來源:首席商業(yè)參謀
GPT-4o很強(qiáng),,但沒到顛覆世界的程度
前段時(shí)間OpenAI發(fā)布了GPT-4o(“o”代表“omni”)。簡單來說它可以實(shí)現(xiàn)文本,、音頻和圖像的任意組合作為輸入,并生成文本,、音頻和圖像輸出的任意組合,。且有諸多驚艷應(yīng)用。
GPT-4o 的主要升級點(diǎn)在于打通任何文本,、音頻和圖像的輸入,,相互之間可以直接生成,,無需中間轉(zhuǎn)換,;此外 GPT-4o 語音延遲大幅降低,,能在 232 毫秒內(nèi)回應(yīng)音頻輸入,平均為 320 毫秒,這與對話中人類的響應(yīng)時(shí)間相似,。
GPT-4o 不僅能通過視覺 AI 能力理解攝像頭中發(fā)生的事情,,同時(shí)還能夠?qū)⒗斫獾膬?nèi)容通過語音與舊版本 ChatGPT 交互,,進(jìn)行更加豐富有趣的互動(dòng),。同時(shí)還支持中途打斷和對話插入,,且具備上下文記憶能力,。
而且 GPT-4o 對廣大用戶來說它有個(gè)遠(yuǎn)超 GPT-4 的優(yōu)點(diǎn):免費(fèi),。體驗(yàn) GPT-4 級別的智能、從模型和網(wǎng)絡(luò)獲取響應(yīng)、分析數(shù)據(jù)并創(chuàng)建圖表,、聊一聊你拍的照片,、上傳文件以獲取摘要,、寫作或分析幫助、使用 GPTs 和 GPT Store、通過 Memory 構(gòu)建更加有幫助的體驗(yàn),,這些功能全部可以免費(fèi)獲得。要知道 GPT-4 Plus 版本就因?yàn)槭召M(fèi)貴,、付款麻煩,,使用門檻高讓絕大部分人望而卻步,,能讓更多的人用上便是 GPT-4o 的最大亮點(diǎn)。
但是現(xiàn)在能用上GPT-4o只有GPT-4 Plus版本,,其他版本需要后續(xù)開放而且免費(fèi)的GPT-4o次數(shù)有限,,過了次數(shù)會(huì)直接轉(zhuǎn)為GPT-3.5。
有業(yè)內(nèi)人士認(rèn)為,,特別是在預(yù)告中 OpenAI 公司的 CEO Altman 甚至用上了 ” 魔法 ” 二字,,相比之下 GPT-4 的神通廣大,、Sora 那種神筆馬良的既視感,GPT-4o 顯然稱不上魔法,。而且從多模態(tài)能力方面考察,,GPT-4o 的能力并沒有比上代有明顯提升。哪怕是和 GPT 的老對手 Anthropic 的 Claude 3 相比也沒有拉開差距,,可以說從模型能力來看 GPT-4o 和 GPT-4 沒有本質(zhì)區(qū)別。
所以GPT-4o的發(fā)布更多像是一種搶跑,,展現(xiàn)一種領(lǐng)先的姿態(tài),也是維持熱度刺激購買需求的一種方式,。
有意思的是,,就在GPT-4o發(fā)布24小時(shí)之后,谷歌也緊跟著發(fā)布產(chǎn)品頗有對陣叫板的意味,。谷歌CEO桑達(dá)爾·皮查伊發(fā)布數(shù)十款Google和AI 結(jié)合產(chǎn)品,,堪稱“全家桶”級別,全面圍剿Open AI,。其中包括支持200萬token長文本的Gemini 1.5 Pro和 Gemini 1.5 Flash,,對標(biāo)Sora的Veo,開源模型Gemma 2,,支持生成式搜索的AI Overviews、第六代TPU等,。
整場開發(fā)者大會(huì)最大的看點(diǎn)為,,谷歌推出的AI語音助手——Astra,,它能夠通過攝像頭識(shí)別物體,、代碼和各種東西。現(xiàn)場演示視頻中,,用戶要求Astra在看到發(fā)出聲音的東西時(shí)告訴她,助手回答說,,它可以看到一個(gè)發(fā)出聲音的揚(yáng)聲器。對于一閃而過的蘋果,,Astra居然也能夠準(zhǔn)確回答出在眼鏡旁邊,。除Astra外,,谷歌還推出基于Gemini的多款通用AI Agent子系列產(chǎn)品,。如音頻的NotebookLM、音樂的Music AI Sandbox,、視頻的Veo,、圖像的Imagen 3,,直接對標(biāo)OpenAI發(fā)布的GPT-4o,、Dall-E和Sora,。
但問題也跟OpenAI類似,,目前還不足以讓開發(fā)者構(gòu)建更加原生和殺手級應(yīng)用,,從推理能力到多模態(tài)能力都是如此,。兩家更像是你追我趕的算術(shù)級競爭,,誰也沒有拉開太多,,自然就很難貢獻(xiàn)震驚世界的應(yīng)用。
也難怪馬斯克在看過發(fā)布會(huì)后表示,,GPT-4o的演示讓他感到“不適、尷尬”。Andrej Karpathy大佬也用十分平靜的語氣給出技術(shù)總結(jié),,得到了馬斯克的附議:他們發(fā)布的是一個(gè)在同一神經(jīng)網(wǎng)絡(luò)中結(jié)合文本-音頻-視頻三種模態(tài)并同時(shí)處理的模型,,僅此而已。
大模型也要“精打細(xì)算”
去年生成式AI與大語言模型這一撥科技熱潮在去年席卷了全球科技圈,。無論是科技巨頭還是新興獨(dú)角獸,,都在爭先恐后研發(fā)規(guī)模更大、性能更強(qiáng)的模型,,進(jìn)而引發(fā)了圍繞AI芯片的軍備競賽,,并讓身為AI軍火商的英偉達(dá)比前一年多賺了340億美元。
但今年的情況已經(jīng)顯然沒有那么樂觀,,務(wù)實(shí)謹(jǐn)慎的風(fēng)格傳遍了科技圈,。科技媒體The Information報(bào)道稱,,「包括微軟,、亞馬遜和Google在內(nèi)的云廠商和其他銷售該技術(shù)(指生成式AI)的公司,正在降低自己的預(yù)期」,。一些人已經(jīng)在擔(dān)憂生成式AI吹出來的泡泡會(huì)不會(huì)已經(jīng)太大了,,它是未來,但可能不是現(xiàn)在,,就像互聯(lián)網(wǎng)如今已經(jīng)是一門萬億美元級別的生意,但并不妨礙千禧年時(shí)吹出的互聯(lián)網(wǎng)泡泡的爆炸結(jié)局,。
關(guān)于OpenAI公司去年的營收,目前有兩種說法,,The Information稱其2023年最后一個(gè)月的年化收入是16億美元,,而《金融時(shí)報(bào)》給出的數(shù)字是20億美元。這個(gè)收入水平在AI行業(yè)絕對是第一梯隊(duì),,但是跟微軟每年提供給OpenAI公司不低于10億美元的費(fèi)用相比,,仍然不算多,更何況Sam Altman雄心勃勃計(jì)劃7萬億美元自建芯片工廠打造軟硬一體呢,?或許上市能解決OpenAI的投資難題,,但是作為非營利性組織的OpenAI轉(zhuǎn)為正常的私人盈利公司尚存在諸多問題,短期來看并不現(xiàn)實(shí),。
一大批剛剛在2023年晉升為獨(dú)角獸的美國生成式AI公司,,已經(jīng)落入理想難以兌現(xiàn)的窘境。曾經(jīng)在AI獨(dú)角獸上排名前3的初創(chuàng)公司Inflection兩位聯(lián)合創(chuàng)始人跳槽微軟,,因?yàn)橥谧吡薎nflection大部分員工,,包括其創(chuàng)始人,微軟同意向Inflection支付約6.5億美元,,以獲得其模型授權(quán),,并補(bǔ)償Inflection的投資人,。
排名僅次于Inflection的另一家AI獨(dú)角獸Cohere也被傳出融資困境,。這家公司自去年12月就開始尋求以60億美元估值融資5億美元,,迄今沒有確定交易,而它上一輪融資還停留在去年6月,。按照大模型的燒錢速度,,這些無法自我造血的獨(dú)角獸原本每半年甚至每個(gè)季度都要有新的融資才能為繼。
更為尷尬的是這些公司并沒有明顯推出強(qiáng)于GPT-4的大模型,,雖然宣傳上都是“各種領(lǐng)先”但實(shí)際體驗(yàn)下來差距不小,。而且這些公司基本不具備盈利能力,成為資本棄兒,,缺少后續(xù)輸血也就不難理解了,。
金沙江主管合伙人朱嘯虎認(rèn)為,大模型是很差的商業(yè)模式,。問題是技術(shù)沒有差異點(diǎn),,而且每一代技術(shù)比如3.5可能就要幾千萬美金,4.0可能要幾億美金,,5.0可能要幾十億美金,,每一代模型你都要重新去砸錢,而且你變現(xiàn)周期可能就兩三年,,這比發(fā)電廠還要差,。
比如發(fā)電廠,在投了基建以后,,基本上不需要再投入很多錢,,但大模型是要每兩三年就要砸更多的錢去升級,而且變現(xiàn)的周期可能就兩三年,。說實(shí)話這個(gè)商業(yè)模式是非常差的商業(yè)模式,。
所以不管國內(nèi)外AI投資都已經(jīng)進(jìn)入了要認(rèn)真考慮成本收益的階段,如果AI已經(jīng)進(jìn)入終局那么行業(yè)第二第三將變得價(jià)值極低,,現(xiàn)階段OpenAI領(lǐng)導(dǎo)者的地位仍然牢不可破,,對于初創(chuàng)公司來說可能隨時(shí)在“死亡邊緣”。
去年的“宮斗”仍沒有結(jié)束
去年 11 月,,Ilya 與另外三名董事會(huì)成員一道,,迫使該公司高調(diào)的首席執(zhí)行官 Sam Altman 辭職,但后來他表示后悔,。據(jù)報(bào)道,,雙方爭論的焦點(diǎn)是對 OpenAI 方向的分歧:Ilya 對 Altman 以犧牲安全工作為代價(jià)而急于推出人工智能產(chǎn)品感到沮喪。Altman 在被趕下臺(tái)的五天后就回到了 OpenAI,重申了自己的控制權(quán),,并繼續(xù)推動(dòng)越來越強(qiáng)大的技術(shù),,這讓他的一些批評者感到擔(dān)憂。Ilya 仍然是 OpenAI 的員工,,但他再也沒有回去工作,。
今年5月17日,,在公司聯(lián)合創(chuàng)始人兼首席科學(xué)家伊利亞·蘇茨克沃(Ilya Sutskever)周二宣布離職后幾個(gè)小時(shí),,其超級對齊團(tuán)隊(duì)負(fù)責(zé)人之一詹·萊克(Jan Leike)也在社交平臺(tái)X上發(fā)帖宣布辭職。
OpenAI超級對齊負(fù)責(zé)人Jan Leike,,自曝離職的真正原因,,以及更多內(nèi)幕。一來算力不夠用,,承諾給超級對齊團(tuán)隊(duì)的20%缺斤少兩,,導(dǎo)致團(tuán)隊(duì)逆流而行,但也越來越困難,。二來安全不重視,,對AGI的安全治理問題,優(yōu)先級不如推出“閃亮的產(chǎn)品”,。
這里先解釋一下“對齊”是什么意思,由于GPT大模型的生成是黑盒機(jī)制產(chǎn)生內(nèi)容是隨機(jī)可控性弱的,,難免產(chǎn)生不符合人類價(jià)值觀的東西,。所以他們在構(gòu)建一個(gè)能與人類水平相媲美的自動(dòng)對齊研究器,盡可能將相關(guān)工作交由自動(dòng)系統(tǒng)完成,,同時(shí)確保人工智能系統(tǒng)的行為與人類價(jià)值觀和目標(biāo)保持一致,。
離開的也不只是對齊團(tuán)隊(duì)的人,,OpenAI前工程負(fù)責(zé)人,曾領(lǐng)導(dǎo)過ChatGPT, GPT-4, DALL·E和APIs上線的Evan Morikawa也宣布離開,,將與前波士頓動(dòng)力高級機(jī)器人學(xué)家Andy Barry和Deep Mind研究科學(xué)家Pete Florence 和 Andy Zeng共同開展一個(gè)全新項(xiàng)目,,并認(rèn)為“這是在全球范圍內(nèi)實(shí)現(xiàn) AGI 所必需的”。
有網(wǎng)友表示這聽起來像是OpenAI想繼續(xù)燒錢商業(yè)化,,而不是確保前進(jìn)步驟的安全,。他們想成為大亨,而不是英雄,。
對Jan Leike的長文開炮,,奧特曼當(dāng)然是不會(huì)就此作罷的了。很快他便發(fā)文“反擊”:“我非常感謝 Jan Leike 對 OpenAI 對齊研究和安全文化的貢獻(xiàn),,也非常難過看到他離開,。他說得對,我們還有很多事情要做,,我們承諾會(huì)做到,。我會(huì)在接下來的幾天里發(fā)一篇更長的文章?!辈怀鲆馔獾脑?,未來幾天還會(huì)像去年一樣,小作文反轉(zhuǎn)不斷,。至于真相是什么,,或許只有躬身其中的少數(shù)人知道,是非曲直其實(shí)對網(wǎng)友來說并不太重要,。
重要的是此次“離職潮”表明了去年以來的內(nèi)部矛盾并沒有消弭,,反而是隱藏轉(zhuǎn)移爆發(fā)。歸根結(jié)底的來說,,Ilya Sutskever跟Sam Altman之爭主要是技術(shù)原教旨主義者和市場激進(jìn)派之間的矛盾,。Jan Leike表示:“我相信,我們應(yīng)該將更多的帶寬花在為下一代模型做準(zhǔn)備上,,關(guān)注安全,、監(jiān)控、對抗性穩(wěn)健性,、超級對齊,、保密性、社會(huì)影響等相關(guān)話題,。這些問題很難解決,,我擔(dān)心我們還沒有走上正軌,。”
但Sam Altman一直以來在強(qiáng)調(diào)AI會(huì)如何顛覆世界創(chuàng)造出令人驚訝的產(chǎn)品,,在瘋狂地積累芯片甚至要自建芯片廠,,來加速技術(shù)的發(fā)展。筆者認(rèn)為兩者之爭是幾乎所有AI從業(yè)者都要考慮的事情,,技術(shù)當(dāng)然可以促進(jìn)社會(huì)生產(chǎn)力發(fā)展,,但也會(huì)帶來一系列安全問題和風(fēng)險(xiǎn)。
Sam Altman未必真的是唯利是圖一心只想賺錢,,他所說的重視AI安全不一定是謊言。但作為管理者要考慮公司的長久運(yùn)營,,能兼顧是最好不能兼顧那就需要有優(yōu)先級,。目前AI對齊所需算力并不小而且對齊之后的AI性能下降明顯,這可能是Sam Altman無法給對齊團(tuán)隊(duì)滿意安排的重要原因之一,。當(dāng)然真實(shí)情況可能更復(fù)雜,,但邁向下一個(gè)時(shí)代的科技生產(chǎn)力,如果沒有足夠的商業(yè)利益一切都會(huì)是空談,。
如果OpenAI完全放棄對齊或者不重視,,那對未來的GPT-5來說將是巨大的風(fēng)險(xiǎn),商業(yè)化被迫戛然而止也有可能,??傊覀兿M霈F(xiàn)一個(gè)更好更開放的OpenAI,,而不是把問題都丟給社會(huì),。
中國大模型也無需自卑
近一個(gè)月國產(chǎn)大模型讓市場產(chǎn)生了正在追平美國的印象,很多亮點(diǎn)也來自初創(chuàng)企業(yè),。月之暗面將上下文長度擴(kuò)展至200萬token,;Minimax出海陪聊應(yīng)用Talkie日活接近 Character.AI;發(fā)布了Vidu的生數(shù)科技,,提出U-ViT架構(gòu)比Sora還早,;開源模型DeepSeek在保證性能的前提下,讓成本降至1塊錢百萬token輸入,。
有些文章說國內(nèi)AI都在卷價(jià)格只有國外在卷功能,其實(shí)并不客觀,。推理需求已經(jīng)真實(shí)存在了,。去年底發(fā)布以來,阿里巴巴近1.7萬中小外貿(mào)商家訂購了AI生意助手,,發(fā)布了上百萬商品,,搜索量提升近四成,。字節(jié)跳動(dòng)將豆包大模型接入了抖音、飛書等業(yè)務(wù),,日均處理1200億token文本,,但沒有公布參數(shù)等細(xì)節(jié),可能是因?yàn)榕cTiktok用了類似的推薦算法,。百度文心大模型日處理文本2500億token,,日均調(diào)用量為去年底的4倍。騰訊已經(jīng)把混元大模型用在了會(huì)議,、讀書與游戲客服上,;AI支持的廣告服務(wù)的點(diǎn)擊率與交易量也在上升。
開源大模型通義千問已經(jīng)火到國外去了,,有太多外國人在討論和使用(通義千問)Qwen大模型。
通義發(fā)布1100億參數(shù)開源模型Qwen1.5-110B,,該模型在MMLU,、TheoremQA、GPQA等基準(zhǔn)測評中超越了Meta的Llama-3-70B模型,;在HuggingFace推出的開源大模型排行榜Open LLM Leaderboard上,,Qwen1.5-110B沖上榜首,再度證明通義開源系列業(yè)界最強(qiáng)的競爭力,。
或許有人會(huì)質(zhì)疑跑分成績,,但是面向C端主打全功能免費(fèi)的通義,卻是真香了,。同時(shí)通義千問 APP 還升級為「通義 APP」,,集成文生圖、智能編碼,、文檔解析,、音視頻理解、視覺生成等全棧能力,,想成為用戶的「全能 AI 助手」,。
寫在最后
無論是OpenAI還是國內(nèi)的AI企業(yè),都離不開金融資本和產(chǎn)業(yè)資本的運(yùn)作,,過于排斥商業(yè)化并不是好事,,但也應(yīng)該有底線取得安全與效益的平衡,只有這樣才能實(shí)現(xiàn)科技創(chuàng)造美好未來,。歷史上的重大技術(shù)進(jìn)步往往伴隨著金融泡沫,,這是新技術(shù)推廣的自然組成部分。AI有泡沫并不可怕,,可怕的是技術(shù)的基石不牢,,難以解決現(xiàn)實(shí)中的種種問題,,最終難以落地變成“全都是泡沫”。
參考資料:
OpenAI重磅發(fā)布GPT-4o 來源:Founder Park
GPT-4o搶先測 來源:DoNews
GPT-4o很好但最大亮點(diǎn)只有免費(fèi) 來源:ZAKER
大模型的泡沫來了嗎,?來源:NewNewThing
中美巨頭的AI差距 來源:未盡研究
OpenAI保護(hù)人類的團(tuán)隊(duì)分崩離析 來源:硅星人Pro
OpenAI的元老科學(xué)家都跑光了 來源:AI前線
Ilya離開OpenAI內(nèi)幕曝光 來源:量子位
通義千問2.5正式發(fā)布 來源:阿里云
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,,觀點(diǎn)僅代表作者本人,不代表芒果財(cái)經(jīng)贊同其觀點(diǎn)或證實(shí)其描述,,版權(quán)歸原作者所有,。轉(zhuǎn)載請注明出處:http://lequren.com/1103290.html
溫馨提示:投資有風(fēng)險(xiǎn),入市須謹(jǐn)慎,。本資訊不作為投資理財(cái)建議,。