當(dāng)前位置:首頁 > 物聯(lián)網(wǎng) > 智能應(yīng)用
[導(dǎo)讀]在上一節(jié)中,我們收集了人工智能創(chuàng)造的關(guān)鍵"成分"--數(shù)據(jù)。這是我們模式的基礎(chǔ)。請記住,配料的質(zhì)量(您的數(shù)據(jù))直接影響最后一道菜的質(zhì)量(您的模型的性能)。

在上一節(jié)中,我們收集了人工智能創(chuàng)造的關(guān)鍵"成分"--數(shù)據(jù)。這是我們模式的基礎(chǔ)。請記住,配料的質(zhì)量(您的數(shù)據(jù))直接影響最后一道菜的質(zhì)量(您的模型的性能)。

現(xiàn)在,我們將把這些數(shù)據(jù)轉(zhuǎn)換成一個完全運(yùn)行的數(shù)據(jù)?大語言模型。 到本節(jié)結(jié)束時,您將與自己的AI進(jìn)行互動!

選擇你的底層

在我們投入訓(xùn)練之前,我們將探索不同的方法來訓(xùn)練你的語言碩士。這就像為你的面包食譜選擇合適的面粉一樣--它顯著地影響了你最終創(chuàng)造的能力和局限性。

有很多方法可以訓(xùn)練一個ML模型.這也是一個積極的研究領(lǐng)域,每天都在出現(xiàn)新的方法。讓我們看一看模型開發(fā)方法的主要驗證和真實類別。( 注意事項 :這些方法不一定相互排斥。)

主要方法

1.從頭開始(預(yù)先訓(xùn)練你自己的模型)

這提供了最大的靈活性,但卻是資源最密集的途徑。這里需要大量的數(shù)據(jù)和計算資源,這意味著只有資源最充足的公司才能培訓(xùn)經(jīng)過培訓(xùn)的新型模型。

2.微調(diào)(建立在預(yù)先培訓(xùn)的模式基礎(chǔ)上)

這包括從一個強(qiáng)大的,現(xiàn)有的LLM開始,并使其適應(yīng)我們的具體的飲食規(guī)劃任務(wù)。這就像使用預(yù)做的面團(tuán)一樣--你不必從零開始,但是你仍然可以定制它。

3.利用開放源碼模式

探索越來越多的開源模型,通常是關(guān)于共同任務(wù)的預(yù)先培訓(xùn),而不需要廣泛的培訓(xùn)。

4.使用現(xiàn)成的商業(yè)模型

對于準(zhǔn)備生產(chǎn)的應(yīng)用,請考慮商業(yè)LLMS(例如:,來自谷歌,開放,微軟)為優(yōu)化性能,但有潛在的定制限制。

5.云計算服務(wù)

使用強(qiáng)大的工具和管理的基礎(chǔ)設(shè)施簡化培訓(xùn)和部署,簡化流程。

選擇正確的方法

你的法律碩士的最佳基礎(chǔ)取決于你的具體需要:

· 時間和資源: 你是否有能力進(jìn)行預(yù)訓(xùn)練,或者你需要一個更快的解決方案?

· 定制: 你需要多少控制模型的行為?

· 費(fèi)用: 你的預(yù)算是多少?你能投資于商業(yè)解決方案嗎?

· 表現(xiàn): 你需要什么水平的準(zhǔn)確性和性能?

· 能力: 您有哪些技術(shù)技能和/或計算資源?

向前邁進(jìn)

在本教程中,我們將側(cè)重于對雙子座專業(yè)進(jìn)行微調(diào),在我們的飲食規(guī)劃模型的努力和功能之間取得平衡。

準(zhǔn)備好培訓(xùn):導(dǎo)出數(shù)據(jù)集

既然我們已經(jīng)選擇了基礎(chǔ)層,那就準(zhǔn)備好數(shù)據(jù)進(jìn)行訓(xùn)練吧。由于我們使用的是谷歌云平臺(GCP),所以我們需要的數(shù)據(jù)是JSONL格式的。

注意事項 :每個模型可能有具體的數(shù)據(jù)格式要求,因此在進(jìn)行之前總是查閱文件。

幸運(yùn)的是,將數(shù)據(jù)從谷歌表轉(zhuǎn)換為json,很簡單Python .

1. 出口到CSV :首先,將您的數(shù)據(jù)從谷歌表中導(dǎo)出為CSV文件。

2. 將CSV轉(zhuǎn)換為JSONL :運(yùn)行以下組腳本,替換your_recipes.csv 你的文件名:

import csv

import json

csv_file = 'your_recipes.csv' # Replace 'your_recipes.csv' with your CSV filename

jsonl_file = 'recipes.jsonl'

with open(csv_file, 'r', encoding='utf-8') as infile,

open(jsonl_file, 'w', encoding='utf-8') as outfile:

reader = csv.DictReader(infile)

for row in reader:

row['Prompt'] = row['Prompt'].splitlines()

row['Response'] = row['Response'].splitlines()

json.dump(row, outfile)

這將創(chuàng)造一個 接收器。 文件中的每一行是一個JSON對象,代表一個膳食計劃。

訓(xùn)練你的模特

我們終于準(zhǔn)備好開始訓(xùn)練我們的LMA了。開始吧!

1.項目設(shè)置

1. 谷歌云項目 :如果你還沒有新的谷歌云項目(?提供免費(fèi)層 ).

2. 啟用API :在控制臺中搜索"頂點(diǎn)人工智能",在頂點(diǎn)人工智能頁面上,點(diǎn)擊 啟用所有推薦的API .

3. 認(rèn)證 :搜尋"服務(wù)帳戶",并在該網(wǎng)頁上,按 創(chuàng)建服務(wù)帳戶 .使用演練設(shè)置一個服務(wù)帳戶,并下載安全訪問所需的憑證。

4. 云存儲桶 找到"云存儲"頁面,創(chuàng)建一個存儲桶。

2.頂點(diǎn)人工智能設(shè)置

1. 航行到?頂點(diǎn)人工智能工作室(提供免費(fèi)層) .

2. 點(diǎn)擊 在控制臺里試一試 在瀏覽器中,你已經(jīng)登錄到你的谷歌云帳戶。

3. 在左邊的窗格中找到并點(diǎn)擊 語言 .

4. 導(dǎo)航到"調(diào)音和蒸餾"標(biāo)簽:

3.示范培訓(xùn)

· 點(diǎn)擊 創(chuàng)建調(diào)諧模型 .

· 對于這個例子,我們將執(zhí)行一個基本的微調(diào)任務(wù),所以選擇"監(jiān)督性的調(diào)整"(默認(rèn)情況下應(yīng)該選擇)。

· 告訴你的模特名字。

· 選擇一個基本模型:我們將使用雙子座Pro1.0002這個例子。

· 點(diǎn)擊 繼續(xù) .

· 上傳您在步驟2中生成的JSOL文件。

· 您將被要求"數(shù)據(jù)集位置"。"這就是你的JSOL文件將位于云中的位置。您可以使用UI非常容易地創(chuàng)建一個"桶"來存儲這些數(shù)據(jù)。

點(diǎn)擊開始和等待模型被訓(xùn)練!通過這一步,你現(xiàn)在進(jìn)入了LLMAAI競技場。您生成的模型的質(zhì)量僅受您的想象力和您可以為您的用例找到、準(zhǔn)備和/或生成的數(shù)據(jù)的質(zhì)量的限制。

對于我們的用例,我們使用了我們早些時候生成的數(shù)據(jù),其中包括關(guān)于個人如何實現(xiàn)其具體健康目標(biāo)的提示,以及與這些限制相匹配的膳食計劃。

4.測試你的模型

一旦您的模型被訓(xùn)練,您可以測試它通過導(dǎo)航到它的調(diào)子和提取主頁。在這個接口中,您可以和其他聊天機(jī)器人一樣與新創(chuàng)建的模型進(jìn)行交互。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉