原文來源:硅基立場(chǎng)
圖片來源:由無界 AI生成
每次Google在生成式人工智能領(lǐng)域祭出大招,都能讓人感到一種隱秘且巨大的情緒力量:隱忍,、不甘與較量,。
在5月的Google I/O上,Google發(fā)布PaLM系列模型,,即被視為是對(duì)彼時(shí)風(fēng)頭正盛的GPT-4的強(qiáng)勁挑戰(zhàn),。年底毫無預(yù)警地祭出Gemini系列大語言模型(包含移動(dòng)版Nano、基礎(chǔ)版Pro和高級(jí)版Ultra),,在關(guān)鍵性能和基準(zhǔn)評(píng)測(cè)指標(biāo)上針對(duì)GPT的意圖更加直接,。
Google官方聲稱:在被大型語言模型研究和開發(fā)廣泛使用的 32 項(xiàng)學(xué)術(shù)基準(zhǔn)中,Gemini Ultra 的性能有 30 項(xiàng)超越了目前GPT–4代表的最先進(jìn)水平,。Gemini標(biāo)榜“原生多模態(tài)”,,這讓它一開始就在文本、圖像,、音頻,、視頻和代碼等組合模態(tài)上進(jìn)行預(yù)訓(xùn)練,故而可能在復(fù)雜理解和推理方面有更強(qiáng)表現(xiàn),,特別是解決數(shù)學(xué)和物理問題,。
Google不遺余力地強(qiáng)調(diào)上述優(yōu)勢(shì)——OpenAI走的是“漸進(jìn)式多模態(tài)”的路,先基于文本語料,,代碼跟進(jìn),,再圖像視頻音頻,最后把這些能力組合在一起訓(xùn)練,。而Gemini從一開始就在多模態(tài)語料上訓(xùn)練,再用多模態(tài)數(shù)據(jù)調(diào)優(yōu),,比OpenAI訓(xùn)練GPT的方法“先進(jìn)”一些,。
“先進(jìn)”的多模態(tài)訓(xùn)練,理論上能帶來更強(qiáng)勁的性能,。公布的Gemini Ultra學(xué)術(shù)基準(zhǔn)評(píng)測(cè)結(jié)果大面積超越GPT-4的細(xì)節(jié)似可說明,。但學(xué)術(shù)基準(zhǔn)測(cè)試本身就是理論的一部分,,并不能真正體現(xiàn)應(yīng)用的效果。不少人擠兌中國(guó)一些大語言模型熱衷于基準(zhǔn)測(cè)試“刷分”,,我們?cè)撘灰曂?,Google的做法與國(guó)內(nèi)大模型沖著超越GPT刷分,本質(zhì)上沒有什么不同,。
目前社交平臺(tái)X上實(shí)測(cè)Gemini Pro(Bard聊天機(jī)器人目前只支持Pro版)的用戶已經(jīng)貢獻(xiàn)了不少吐槽,。比如它混淆了2023年和2022年的奧斯卡獎(jiǎng)獲得者,也不會(huì)用Python寫入兩個(gè)多邊形的交集這種簡(jiǎn)單函數(shù),。我們還發(fā)現(xiàn)它識(shí)別不出葉子的數(shù)量,,以及做不對(duì)簡(jiǎn)單的求銳角幾何題。即便Gemini Pro對(duì)標(biāo)的是GPT-3.5,,它也還是差了點(diǎn)意思,。
被人們指出的另一個(gè)突出問題是Gemini的宣傳視頻“造假”:Gemini Ultra對(duì)一組手勢(shì)動(dòng)作很快做出反應(yīng),說這是一個(gè)石頭剪子布的游戲,,但它未被視頻顯示的功能文檔卻給出了至少兩條提示:“我在做什么,?”,“提示,,這是一個(gè)游戲”,。其它的一些測(cè)試甚至需要更多的提示問題輔助生成結(jié)果,但這個(gè)過程在Gemini的官方視頻里被省略掉了,。以至于大多數(shù)不太較真的人高估Gemini的理解能力和反應(yīng)速度,,這不能不說是個(gè)誤導(dǎo)。
我到現(xiàn)在都記得2017年我在Google I/O的現(xiàn)場(chǎng),,臺(tái)上的Google員工演示如何通過Google Assistant語音助手直接預(yù)訂一家餐廳,,下面掌聲雷動(dòng),我也跟著拍巴掌,,覺得太棒了,。但一個(gè)月后即傳出這是一個(gè)事先準(zhǔn)備好的橋段。Google沒有造假,,但它通常太希望展示其AI能力的無與倫比,太急切地呈現(xiàn)自己的AI樂觀主義,,以至于經(jīng)??s略呈現(xiàn)了背后的過程,也就事實(shí)上夸大了效果,。
說白了,,Gemini視頻的夸張呈現(xiàn),只是說明Google太在意Gemini比GPT強(qiáng)了。它很著急,,加上人們對(duì)任何跟ChatGPT較勁的任何大模型,,特別是巨頭的“杰作”,通常都比較苛刻,。當(dāng)然,人們對(duì)Google是最苛刻的——畢竟OpenAI選擇用Google發(fā)明的Transformer架構(gòu)搞出了劃時(shí)代的GPT模型,,動(dòng)機(jī)之一就是擺脫Google無所不在的AI壓制,那誰還不希望看見Google露怯呢,。
某種程度上,,Google是OpenAI在這個(gè)星球上唯一的孿生。包括Meta的LLamA架構(gòu)都是開源的,,以馬斯克老師對(duì)開源的偏愛,Grok未來大概率也得開源,。中國(guó)的大語言模型也在不同程度上都走了開源道路,。只有OpenAI和Google是堅(jiān)定閉源的,這就讓Google在大語言模型上的進(jìn)展,,本能地與OpenAI形成了強(qiáng)綁定關(guān)系,。
還有一個(gè)戲劇性的張力:每次OpenAI有圍繞GPT的大動(dòng)作,輿論都會(huì)喊Google出來挨一回落后就要挨的打,。然后Google差不多一定會(huì)在OpenAI出招之后的一到兩個(gè)月,,祭出一個(gè)新的大招,證明一下你大爺還是你大爺,。然后再憋幾個(gè)月,OpenAI再出招,,Google再被喊出來挨打,。格局真就會(huì)因此改變么?
某種程度看,,Google在生態(tài)建設(shè)上還是比OpenAI落后了一個(gè)身位,。畢竟這個(gè)世界上已經(jīng)有幾百萬個(gè)開發(fā)者自己做的GPTs了。而Google最早要到明年初才能向開發(fā)者和企業(yè)客戶提供強(qiáng)化訓(xùn)練反饋后的Gemini Ultra,,讓人們?cè)谏厦骈_發(fā)自己的應(yīng)用,。到那時(shí)恐怕GPT Store都已經(jīng)正式推出來了,。我一直有點(diǎn)困惑,Google當(dāng)年難道不是靠Android的開源奪得蘋果半壁江山的么,?這次怎么把這個(gè)角色讓給Meta了?
我真的不是要怪Google,,我更期待Google證明自己,。我們這群在1990年代末接觸互聯(lián)網(wǎng)的人,對(duì)Google是有一些很微妙的特殊感情的,。而Google也必須證明自己的AI First戰(zhàn)略能結(jié)出真正的果實(shí),。只是GPT的幽靈在Google徘徊,是一個(gè)事實(shí),。誰都可以試圖擺脫這個(gè)幽靈,,唯獨(dú)Google不行,這是它無可選擇的對(duì)手,。
其實(shí)Google今天圍繞Gemini所做的一切,,某種程度上能讓我們中國(guó)的大語言模型開發(fā)者心有共鳴:大家的頭頂上都徘徊著GPT的幽靈,這就讓大家都試圖通過某些努力,,證明自己在某些方面比GPT做得更好,。
Google在Gemini基準(zhǔn)測(cè)試中采用了一切小“技巧”(采用更復(fù)雜的思維鏈提示和結(jié)果選優(yōu),而測(cè)試GPT只用5次反饋且無提示詞)獲得了碾壓GPT的成績(jī),,類似的測(cè)試方法我們是不是聽起來很熟悉,?中國(guó)的大語言模型研發(fā)者有沒有一種老鄉(xiāng)見到了老鄉(xiāng)的戚戚然的感覺?
我們經(jīng)常喜歡將智譜,、百度和Minimax的努力與OpenAI做對(duì)比,,但換一個(gè)思路,其實(shí)大語言模型的較量,,何嘗不是百度,、智譜、Minimax,、Google,、Meta、Anthropic和Grox們一起在圍攻OpenAI的光明頂,?從這個(gè)意義上,,中國(guó)大模型和美國(guó)除OpenAI之外的大模型在一個(gè)陣營(yíng)一個(gè)戰(zhàn)壕里,是報(bào)團(tuán)也是互相學(xué)習(xí)的對(duì)象,。大模型的百草我們這些神農(nóng)嘗多了,,就發(fā)現(xiàn)我們中國(guó)的大模型不是比美國(guó)的大模型差,只是不如ChatGPT,,就這樣,。
Google這次訓(xùn)練Gemini另一個(gè)值得圈點(diǎn)的地方,,是它完全采用了自家的芯片集群——TPU進(jìn)行的訓(xùn)練。Google官宣TPUs v4和 v5e在通過AI優(yōu)化過的基礎(chǔ)設(shè)施上實(shí)現(xiàn)了這一大規(guī)模訓(xùn)練,,可擴(kuò)展性強(qiáng)且推理最高效,。這恐怕是我們聽說的一款性能還算強(qiáng)勁的大語言模型,不依賴英偉達(dá)的算力和軟硬件架構(gòu)而修成正果的,。當(dāng)然人家TPU是自產(chǎn)自銷的,,但我看到了“替代英偉達(dá)”這件事在大模型訓(xùn)練實(shí)操上的可能性和可行性。這對(duì)中國(guó)的大語言模型訓(xùn)練意味著什么,,不言自明,。
此外,Gemini Nano也是一個(gè)亮點(diǎn),,這是一款尺寸最小的Gemini模型,,優(yōu)先用于G家自產(chǎn)的Pixel 8手機(jī)上?!岸藗?cè)大模型”是近期的一個(gè)話題,,其實(shí)它更接近“小模型”。中國(guó)智能手機(jī)廠商OPPO,、vivo和小米近期都有發(fā)布自己的端側(cè)模型,,聯(lián)想則從AI PC的維度也切進(jìn)了事實(shí)上的同一個(gè)領(lǐng)域。這次Google加入了這個(gè)陣營(yíng),,應(yīng)該是一個(gè)信號(hào),,這件事值得努力,有的做,。
其實(shí)很神奇,。從Google這次Gemini模型的發(fā)布,我看到了Google與一眾我們熟悉的中國(guó)大語言模型開發(fā)者同樣的境遇和努力:那種隱忍,、不甘和較量,,那種偶爾展露的在一些基準(zhǔn)測(cè)試關(guān)鍵指標(biāo)上跟OpenAI較勁的小手段和小心思,那些試圖建立自己生態(tài)的步步為營(yíng),,那種試圖擺脫英偉達(dá)算力的嘗試,,以及基于移動(dòng)優(yōu)勢(shì)在端側(cè)模型的努力……面對(duì)OpenAI,大家都是一樣的,。
一個(gè)GPT的幽靈,,在Gemini的上空徘徊,也在我們每一個(gè)中國(guó)大語言模型的上空徘徊,。
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,,觀點(diǎn)僅代表作者本人,不代表芒果財(cái)經(jīng)贊同其觀點(diǎn)或證實(shí)其描述,,版權(quán)歸原作者所有,。轉(zhuǎn)載請(qǐng)注明出處:http://lequren.com/1082693.html
溫馨提示:投資有風(fēng)險(xiǎn),,入市須謹(jǐn)慎。本資訊不作為投資理財(cái)建議,。