A欧美国产国产综合视频_最近日本中文字幕免费完整_国产乱伦一级片_久久99国产综合精品婷婷_韩国理论片在线中文字幕一区二区_亚洲AV成人影片在线观看_亚洲av无码电影网_优物视频最新网址_天天艹无码天天射_脱下丝袜的极品销魂大胸美女王馨瑶91精品美女嫩模写真套图,男男被?到喷水18禁视频,欧美久久精品一级黑人c片 ,综合在线视频精品专区

人民網(wǎng)

更高效的大模型調(diào)優(yōu)方法,華盛頓大學推出“代理調(diào)優(yōu)” – AI新智界

原文來源:AIGC開放社區(qū)

更高效的大模型調(diào)優(yōu)方法,華盛頓大學推出“代理調(diào)優(yōu)” – AI新智界

圖片來源:由無界 AI生成

隨著ChatGPT等生成式AI產(chǎn)品朝著多模態(tài)發(fā)展,,基礎(chǔ)模型的參數(shù)越來越高,,想進行權(quán)重調(diào)優(yōu)需要耗費大量時間和AI算力,。

為了提升模型的調(diào)優(yōu)效率,,華盛頓大學和艾倫AI實驗室的研究人員推出了全新方法——Proxy Tuning(代理調(diào)優(yōu))。

該調(diào)優(yōu)方法無需接觸模型的內(nèi)部權(quán)重,,利用一個小型調(diào)整模型和一個未調(diào)整的對應(yīng)模型,,通過對比它們的預測結(jié)果來引導基礎(chǔ)模型的預測

再通過解碼時的引導,,基礎(chǔ)模型可以朝著調(diào)優(yōu)方向進行微調(diào),,同時保留了更大規(guī)模預訓練的優(yōu)勢。

為了驗證代理調(diào)優(yōu)的性能,,研究人員對LlAMA-2的13B,、70B原始模型進行了微調(diào),。結(jié)果顯示,,這兩個模型分別接近對應(yīng)的Chat模型的91.1%和88.1%的性能

更高效的大模型調(diào)優(yōu)方法,,華盛頓大學推出“代理調(diào)優(yōu)” – AI新智界

此外,在知識量大的TruthfulQA數(shù)據(jù)集測試中,代理調(diào)優(yōu)的真實性比直接調(diào)優(yōu)的模型還高,說明在解碼時更好地保留了訓練知識,。

論文地址:https://arxiv.org/abs/2401.08565?

代理調(diào)優(yōu)的核心技術(shù)思想是,先調(diào)優(yōu)一個小的語言模型,然后用這個小型調(diào)優(yōu)模型指導大型黑箱語言模型,使其具備像調(diào)優(yōu)后的模型一樣行為,、功能,。

但不需要訪問其內(nèi)部權(quán)重,只需要其在輸出詞表上的預測分布。有趣的是,,該技術(shù)與大模型中的“蒸餾”技術(shù)恰恰相反。

代理調(diào)優(yōu)的技術(shù)方法

首先,,我們需要準備一個小型的預訓練語言模型M-,,該模型與基礎(chǔ)模型M共享相同的詞匯表。M-可以是一個現(xiàn)成的模型,也可以是通過較小規(guī)模的預訓練得到的模型,。

更高效的大模型調(diào)優(yōu)方法,,華盛頓大學推出“代理調(diào)優(yōu)” – AI新智界

接下來,我們使用訓練數(shù)據(jù)對M-進行調(diào)優(yōu),,得到一個調(diào)優(yōu)后的模型M+,。調(diào)優(yōu)可以使用各種技術(shù),例如,,有監(jiān)督的微調(diào)或領(lǐng)域自適應(yīng)方法,,具體取決于任務(wù)的需求。

詳細解碼流程

在解碼時,,對于給定的輸入,,我們通過對基礎(chǔ)模型M的輸出預測分布和調(diào)優(yōu)模型M+的輸出預測分布之間的差異進行操作,來引導基礎(chǔ)模型的預測,。

使用基礎(chǔ)模型M對輸入進行解碼,,得到基礎(chǔ)模型的預測結(jié)果。這可以通過生成模型的輸出概率分布來實現(xiàn),,通常使用一種解碼算法,,例如,貪婪搜索或束搜索來生成最優(yōu)的輸出序列,。

更高效的大模型調(diào)優(yōu)方法,,華盛頓大學推出“代理調(diào)優(yōu)” – AI新智界

然后,使用調(diào)優(yōu)模型M+對相同的輸入進行解碼,,得到調(diào)優(yōu)模型的預測結(jié)果,。

接下來,計算基礎(chǔ)模型的預測結(jié)果與調(diào)優(yōu)模型的預測結(jié)果之間的差異,??梢允褂肒L散度或交叉熵方法,來度量兩個預測分布之間的差異,。

最后,,將預測差異應(yīng)用于基礎(chǔ)模型的預測結(jié)果,以引導基礎(chǔ)模型的預測朝向調(diào)優(yōu)模型的預測方向移動,。同時可以將預測差異添加到基礎(chǔ)模型的預測分布中,,以調(diào)整每個詞的概率值。

免責聲明:本文來自網(wǎng)絡(luò)收錄或投稿,,觀點僅代表作者本人,,不代表芒果財經(jīng)贊同其觀點或證實其描述,版權(quán)歸原作者所有,。轉(zhuǎn)載請注明出處:http://lequren.com/1088130.html
溫馨提示:投資有風險,,入市須謹慎,。本資訊不作為投資理財建議。

(0)
AIGC開放社區(qū)的頭像AIGC開放社區(qū)
上一篇 2024年1月24日
下一篇 2024年1月24日
198搶自鏈數(shù)字人

相關(guān)推薦