采訪|馮大剛
撰文|鄧詠儀
編輯|楊軒 蘇建勛
封面來源|視覺中國
2023年,,全世界的關(guān)注焦點,,都在AI大模型的焦灼競賽。
中國參賽選手,、百度“文心一言”在研發(fā)階段時,,百度技術(shù)團隊曾與ChatGPT進行對比測試,李彥宏對36氪回憶,當(dāng)時“差距是40分的水平,,一個月能追得上,。”
可過了一個月,,技術(shù)團隊再次測試后,,發(fā)現(xiàn)差距反而拉大了——AI大模型的發(fā)展速度不是線性的。
緊張追趕之后,,到文心一言今年3月16日發(fā)布時,,甚至“能達到它(ChatGPT)今年1月份的水平?!崩顝┖陮?6氪說,。要說文心一言和ChatGPT差距多大?“可能最多是兩個月,。但這兩個月什么時候能追上,,才是更重要的問題?!?/p>
過去一周,,AI領(lǐng)域處于更強烈的疾風(fēng)驟雨之中。百度文心一言發(fā)布會前一天,,OpenAI發(fā)布了新一代GPT-4大模型,;后一天,又有微軟發(fā)布搭載最新GPT-4的AI助手Copilot——均是震撼業(yè)界的產(chǎn)品進展,。
百度文心一言隨之成為激烈爭論的對象,。帶著人們圍繞文心一言的諸多質(zhì)疑,36氪獨家訪問了百度創(chuàng)始人兼CEO李彥宏,,直接發(fā)問:為什么發(fā)布會用了Demo而不是實時演示,?為什么產(chǎn)品在不甚完美時就發(fā)布?
這些質(zhì)疑折射出國人的復(fù)雜情緒:人有我無的焦慮,,民族情緒的高漲,、期待與失望間的起伏……
在回應(yīng)質(zhì)疑之外,,36氪在與李彥宏交談中,,印象更加深刻的,是他給出了關(guān)于AI行業(yè)的許多直接論斷,。
比如,,被問到中國創(chuàng)業(yè)公司里會不會再出一個OpenAI?他直接回答“基本不會了”,,“沒有必要再重新發(fā)明一遍輪子,。”
比如,“在應(yīng)用層,,將會出現(xiàn)全新的,、十倍于現(xiàn)在微信和抖音的創(chuàng)業(yè)機遇?!北热纭癆I將會顛覆云計算市場”,。
比如,AI雖然會取代人類工作,,但有更多意想之外的機會,。一個針對個人的提示是,不會面向AI寫提示詞(prompt,,人與機器進行交互的指令語言)的人會被淘汰,。
無論如何,我們正站在一個歷史性的時點:基于AI大模型技術(shù),,可能開啟一個新增長時代,。就在兩天前,英偉達發(fā)布了專用于大模型計算的新GPU,,能讓大模型處理成本下降一個數(shù)量級,。“我們正處于AI的iPhone時刻,?!庇ミ_創(chuàng)始人黃仁勛在會上三次激動地強調(diào)。
以下為對話全文,,經(jīng)36氪編輯整理:
回應(yīng)文心一言發(fā)布會的所有質(zhì)疑
36氪:3月16日文心一言發(fā)布會之后,,網(wǎng)上有非常多的聲音,,其中有祝福,也有質(zhì)疑,,今天我是代表質(zhì)疑的聲音,。首先問一個小問題,今天這樣一個突然的采訪,,會不會讓你覺得有壓力,?
李彥宏:不會。確實像你講的,,3月16日之后,,網(wǎng)上有各種各樣的聲音,我自己也確實有一些話想說。
36氪:有人說你在發(fā)布會現(xiàn)場比較緊張,,是這樣嗎,?
李彥宏:我真沒覺得自己緊張。因為這個東西(指文心一言)是我非常熟悉的,,包括那5個演示場景,,基本上都是我選的,或者至少是別人給我建議,、我認真看過的,。
后來我也回看了發(fā)布會實況,也沒覺得我在任何時候緊張,。我猜測,,是因為當(dāng)時在臺上,我看不到股價變化,,所以沒有被它所影響,。但是很多在臺下的人,包括看直播的人,,能夠看到一些資本市場的反應(yīng),,又看不到我們真實產(chǎn)品是什么樣子(因為當(dāng)時還沒有發(fā)布出來),所以會有此猜測,。
36氪:在發(fā)布會中,,你提到產(chǎn)品還沒有準(zhǔn)備好。為什么要在還沒有完美的情況下發(fā)布,?
李彥宏:最主要的原因,,是因為有市場需求。我們有好多客戶都在問,,這個東西什么時候出來,?我們什么時候能夠用?你能不能保證我是第一批試用產(chǎn)品的人,?不斷有人在問這方面的問題,。
目前整個大環(huán)境,是ChatGPT非?;?,甚至被神話了。大家一定是有焦慮感的,,如果我們的客戶不能及早地用最先進的產(chǎn)品,,他們也會有焦慮感,。在這種情況下,,我們確實希望盡早把它推出來。
36氪:選擇在3月16日開發(fā)布會,這個日期是怎么確定的,?
李彥宏:一開始我們想的是3月底,,其實哪一天我覺得都是可以的。
但我在很早的時候,,答應(yīng)了去參加今年的亞布力論壇,,亞布力是3月17日,那時我會見到很多新老朋友,,包括政府領(lǐng)導(dǎo),、媒體,大家一定會問(文心一言),,那個時候我們還沒有發(fā)布的話,,別人問起來,我真不知道該說什么了——你說得少,,大家會覺得你一點信息都不透露,,你不拿我當(dāng)朋友;說得多,,我們是上市公司,,等于選擇性地披露一些東西,也是不行的,。
所以想來想去,,決定稍微往前趕一點。為了適應(yīng)3月17日亞布力論壇,,就決定3月16日來開發(fā)布會,。
36氪:所以碰上OpenAI發(fā)布新版本,這是偶然,。
李彥宏:對,,我們事先并不知道OpenAI會在那一天發(fā)GPT-4。對于我們來說實際上也沒有那么重要,。我們自己能看到的可提升的地方已經(jīng)足夠多了,,先把這些東西做好就夠了。
36氪:發(fā)布會現(xiàn)場為什么會用先做好的Demo,,而不是實時展示,?
李彥宏:我是希望能現(xiàn)場演示的,,因為人機對話產(chǎn)品具有極強交互屬性,但后來兩個因素讓我改變了主意,。一是生成式AI每次給出的答案不一定一樣,,會帶來不確定性。二是真正說服我的理由,,是全球所有類似發(fā)布會,,沒有一個是現(xiàn)場演示的,都是錄好的,。如果大家都可以,,那我們也OK。
36氪:文心一言發(fā)布的產(chǎn)品有五個場景,,包括文學(xué)創(chuàng)作,、商業(yè)文案創(chuàng)作、數(shù)理邏輯推算,、中文理解,、多模態(tài)生成,為什么是這樣的五個場景,?
李彥宏:這是很好的問題,。我們選擇的邏輯是這樣:文心一言對標(biāo)ChatGPT,所以大部分ChatGPT有的功能,,我們也要有,。
但同時,我們畢竟植根于中國,,所以,,我們的對話型產(chǎn)品,一定要體現(xiàn)我們對于中文,、對中國文化更好的理解,。我們確實有一些ChatGPT沒有的東西,希望在發(fā)布會展示給大家,。
所以,,前三個場景是對標(biāo)ChatGPT已有的功能,我希望大家能夠感受到我們的東西不差,。比如第一個例子是,,三體的作者是哪里人?我在ChatGPT里面試過很多次,,它答的都是錯的,,每次生成的答案都不一樣,有時候說甘肅天水人,,有時候說山西呂梁人,,答案非常隨機,。所以,我第一個例子用了那個例子,,但是前三個例子的那些能力,,大家已經(jīng)看過了,,在ChatGPT里面那些能力都是有的,。
第五個例子,,是多模態(tài)能力的展示,。有一個四川話,有一個文生圖,,一個文生視頻,,這代表了百度過去十幾年在AI上綜合能力的積累。
做這五個例子的時候,,我給團隊提了個要求,,我希望產(chǎn)品發(fā)出去之后,能讓大家玩起來,。第一個就是剛才講的四川話,,我們有語音合成的能力,也對中國情況更了解,。所以,,我希望當(dāng)用戶提問的時候,不管是提什么問題,,我們都能夠用語音合成,,并且能支持用各種各樣的方言說出來,不管是四川話還是廣東話,。我希望大家覺得很有意思,,喜歡去玩這些東西。
第二個要求,,當(dāng)用戶的問題本身存在事實性錯誤時,,我們能夠辨別,,比如“二戰(zhàn)期間蘇聯(lián)為什么轟炸波蘭?”其實蘇聯(lián)沒有轟炸波蘭,,是德國轟炸波蘭,。我希望文心一言能夠辨別用戶問題當(dāng)中是有錯誤的,并且告訴你說,,你剛才說的不對,,我告訴你正確答案是什么。
所以當(dāng)用戶有這樣的問題,,或者故意進行錯誤引導(dǎo)的時候,,如果產(chǎn)品能夠辨別,用戶會覺得你很聰明,。
36氪:有人說這是為調(diào)皮的人類而準(zhǔn)備的,。
李彥宏:能夠給大家多帶來一些歡樂的話,何樂而不為,?
36氪:提及ChatGPT,,別人一定會把它跟文心一言對比,你覺得哪個更領(lǐng)先,?假如ChatGPT更領(lǐng)先的話,,你覺得它領(lǐng)先文心一言幾年?
李彥宏:這個問題應(yīng)該這樣說,,ChatGPT發(fā)布是去年11月30日,,我們現(xiàn)在已經(jīng)發(fā)布了,也就是說不可能被領(lǐng)先幾年,。
但是科學(xué)地去評比,,文心一言到底是處于去年ChatGPT 11月30日的水平,還是12月30日的水平,?這個我們沒有特別嚴謹?shù)姆椒ㄔu測,,我們自己可以保留(產(chǎn)品狀態(tài)),但是ChatGPT當(dāng)時的狀況我們已經(jīng)保留不了了,。
但是我可以給你講一個我們內(nèi)部開發(fā)的過程,。第一版產(chǎn)品出來的時候,我們和當(dāng)時的ChatGPT做了一個對比,,和它大概差40分,。
李彥宏:我們的對話式人工智能大語言模型應(yīng)該具備的各種各樣的能力,,每一項能力去挑了提示詞(prompt),。
36氪:滿分是100分,差了40分,?
李彥宏:對,。當(dāng)時我們能看到的提升空間遠不止40分,,所以我們覺得說一個月之內(nèi)肯定追上它。但是過了一個月,,我們又做了一次評測,,發(fā)現(xiàn)這個差距不僅沒有縮小,而且拉大了,。
所以我們當(dāng)時很緊張,,說這個東西越做,跟人家差得越遠了,,但后來發(fā)現(xiàn),,其實ChatGPT那種升級不是勻速的升級,,雖然提升很快,,但是它有自己的發(fā)展規(guī)律。
而百度這種一版一版的迭代方式,,升級速度是非常非??斓摹5鹊轿覀兏艺f3月16日開發(fā)布會的時候,,我們覺得就是至少可以達到它去年11月30日的水平,,甚至說按照理性判斷的話,應(yīng)該達到了ChatGPT今年1月份的水平,。所以,,那個時候我們才敢出去發(fā)的。
尤其當(dāng)你去測試ChatGPT比較擅長的能力(英文,、編程等),,會發(fā)現(xiàn)差距很大,那是因為ChatGPT也發(fā)生了很大的變化,。我們發(fā)布會前一天,,OpenAI上了GPT-4,和GPT-3.5也是不一樣的,。
36氪:可以說,,文心一言在兩個月后能達到ChatGPT的水平嗎,?
李彥宏:遠遠不夠,因為人家也在進步,。百度進步的速度要比它快,,有一天不僅要追上它,,還要超過它。
剛才我們講的文生圖能力,,百度的能力打磨比較久,,大家玩起來挺嗨。GPT4本身沒有文生圖能力,,站在另一個角度比較的話,,ChatGPT落后百度,文心一言早就有這個能力了,。
早在文心一言發(fā)布之前,,大家用文心一格(指代百度基于文心大模型的文生圖系統(tǒng))就能體驗這個能力,這是我們做得好的地方,。ChatGPT發(fā)布的時候,,大家都說它跨時代、震撼發(fā)布等,,它發(fā)布的理解圖片能力,,不是文生圖,只是輸入圖片告訴你這個圖片是什么,。
客觀比較下,,我們有我們的長處,我們也很有信心在綜合能力上,,能夠迅速追上甚至超過,。
剛才我們講的文生圖的能力,百度的能力打磨比較久的時間,,我們目前就是大家玩起來挺嗨,,但是ChatGPT本身沒有文生圖的能力,站在另一個角度比較的話,,ChatGPT落后百度,,文心一言早就有這個能力了。
ChatGPT4發(fā)布的時候,,大家都說它跨時代震撼發(fā)布之類的,。其實它發(fā)布的所謂理解圖片的能力,不是文生圖,,輸入圖片告訴你這個圖片是什么,。我們搜的只是官網(wǎng)上的能力,沒有人體驗過,。
李彥宏:成本比較類似,。但是這個東西不重要,,重要是我們可以通過端到端的優(yōu)化,讓這個成本迅速下降,。
李彥宏:會稍微便宜一點,。
李彥宏:這很難劃分清楚,。例如,,我們對于大語言模型的投入算不算在內(nèi)?可能有些投入是去做了辨別式的東西,,比如去優(yōu)化搜索等等,,有些是生成式的。
如果沒有那些投入,根本就不可能出現(xiàn)文心一言這個模型,。
中國基本不會再出一個OpenAI
李彥宏:人工智能如果按語言模型來分類,,一種叫辨別式AI,典型應(yīng)用是搜索,。搜索就是根據(jù)你提的需求,,看一個個網(wǎng)頁跟你的需求匹配不匹配,主要是在辨別,;另一種是ChatGPT,,也就是生成式AI產(chǎn)品,你提一個提示詞,,它根據(jù)提示詞發(fā)揮,,甚至發(fā)揮錯了都有可能,這個方向早期并不被大廠看好,,積累也沒有特別深厚,。
在這過程中,,其他大廠像Google、亞馬遜,、Facebook,,你說它們重視不重視?現(xiàn)在肯定很重視,。想不想做出這么一個東西來,?肯定很想。聽到這就很容易理解,,為什么我會說百度是大廠當(dāng)中第一個做出來的,。
李彥宏:很多人也在問我,,中國會不會再出一個OpenAI?基本不會了,。OpenAI誕生是因為美國大廠都不看好這個方向,,但現(xiàn)在中國的大廠都看好AI大模型,都在做這個方向,。創(chuàng)業(yè)公司重新做一個ChatGPT其實沒有多大意義,。
第二,,我覺得基于這種大語言模型開發(fā)應(yīng)用機會很大,,沒有必要再重新發(fā)明一遍輪子,有了輪子之后,,做汽車,、飛機,價值可能比輪子大多了,。
李彥宏:其實算力是很籠統(tǒng)的說法,,你的CPU怎么樣、GPU怎么樣,芯片跟框架匹配程度怎么樣,,框架跟模型的匹配程度,,里面可提升的空間都是很大的。
百度在四層架構(gòu)都有領(lǐng)先的產(chǎn)品,。芯片本身不管是摩爾定律,,或者GPU的發(fā)展速度也非常快,,框架也不能叫成熟,,我們的工程師還在日以繼夜優(yōu)化框架。
模型更新得就更快了,,一天能夠上線三次升級,,這種速度一定會使效率越來越高。將來制約整個大語言模型發(fā)展的很可能不是算力,。今天我們看到算力很緊張,,將來你可能發(fā)現(xiàn)算法突然變了,不是這個算法了,,(制約發(fā)展的)可能就是另外一套東西,。
李彥宏:在應(yīng)用層?;乜匆苿踊ヂ?lián)網(wǎng)時代,,今天特別成功的微信、抖音,、淘寶,,都是應(yīng)用。操作系統(tǒng)其實沒幾個,,一個IOS,,一個安卓,僅此而已,。很難講安卓的價值比微信,、抖音大。在應(yīng)用這個層面,,機會很多,,能夠創(chuàng)造的價值也非常大,。
李彥宏:我確實聽到了這種說法,,但我覺得離我們真實的想法差得太遠了,。
首先我覺得不會顛覆,你用的其實還是百度搜索,。當(dāng)這個能力(文心一言)被賦予到百度搜索上的時候,,幾乎不會改變你的使用方法。你不需要重新再花很多精力去學(xué)百度搜索怎么用,,只是答案更精準(zhǔn)了,,過去篇幅比較小的答案,現(xiàn)在可以更加詳實,、更加生動,、更加活潑,它擴大了搜索的邊界,。
框架層我多講兩句。百度在全球大廠當(dāng)中最先做出來是有道理的,,我們在芯片層,、框架層、模型層,、應(yīng)用層都有自己的布局,,全球大廠在這四層上都有領(lǐng)先產(chǎn)品的是沒有的,。
36氪:可今天我去搜索百度的東西,,當(dāng)中有15個搜索結(jié)果,其中有兩三個是廣告,,簡單說這是百度的商業(yè)模式,。未來如果文心一言只給出一個答案,這怎么商業(yè)化,?
我從來沒有覺得商業(yè)模式是一個問題。如果我們給大家(不管是個人還是企業(yè))提供了價值,,他們就會通過市場機制來回報我們,。
李彥宏:Google可以索引幾乎所有互聯(lián)網(wǎng)的內(nèi)容,但是中國的話每一個APP都有自己的這種獨立的生態(tài),,也有一定的壁壘,。所以用戶在獲得信息上確實沒有那么方便。
李彥宏:聯(lián)盟也說不上,,我覺得美國人的這個思維方式也競爭,,比如微軟和Google就是競爭,。但是它的思維方式是說,如果你已經(jīng)很領(lǐng)先了,,我最好別做一個跟你一樣的東西,,我如果通過創(chuàng)新做一個跟你不一樣的東西來競爭,那才是我的本事,。
36氪:文心一言會接入哪些產(chǎn)品,以及對百度的業(yè)務(wù)矩陣有哪些機會和變化,?
李彥宏:這些天我們各個部門也都在開會討論,,文心一言是一個通用能力,它跟各個產(chǎn)品的結(jié)合都是很自然的,,跟搜索,、貼吧、文庫,、百度健康,、小度等等。幾乎公司里面每個產(chǎn)品拿出來,,包括百度書法,,都能自然地想到和它怎么結(jié)合,讓產(chǎn)品變得用戶體驗更好,,更加powerful,。
李彥宏:是的,。
36氪:你在財報會上提到,,文心一言會是改變云計算的Game Changer,,為什么?
今天就會看到,,我們完全沒有必要基于芯片層,、框架層來開發(fā)應(yīng)用——基于大模型就好了,又快,,成本又低,。
我認為微軟其實也是這樣想的。大家都知道,,ChatGPT和微軟的產(chǎn)品真正結(jié)合,,是非常厲害的。這是很多云廠商非常害怕的事情,。
36氪:未來十年內(nèi),,會不會出現(xiàn)誕生新的微信,新的抖音,?
36氪:今天無數(shù)人在提問:AI會不會讓打工人沒有工作?OpenAI的創(chuàng)始人Sam Altman說,,大量的人一定會失業(yè),,所以O(shè)penAI會按需收費,給沒有工作的人補貼。這其實是有點悲涼的,,他自己說也有點可怕,,你覺得這個事情會發(fā)生嗎?這個問題你怎么看,。
我沒有那么悲觀,,我是樂觀的,。不管有多少工作被替代,這只是整個圖景的一部分,,另外一部分是,,存在我們現(xiàn)在甚至無法想象的更多新機會。我做一個大膽預(yù)測,,十年以后,,全世界有50%工作會是提示詞工程(prompt engineering),不會寫提示詞(prompt)的人會被淘汰,。
百度的使命就是用科技讓復(fù)雜的世界更簡單,這個事情現(xiàn)在成立,,十年之后還會成立,。
我希望十年之后回望今天,會發(fā)現(xiàn)每一個普通人的生活,、整個社會會被百度改變,。我們起了什么正面作用?我們有什么東西沒有做到位,?我們什么東西可以做得更好,?我更希望琢磨這樣的事情。
李彥宏:我覺得不會是這樣,我恰恰覺得人是唯一,。在如此浩瀚的宇宙,,目前沒有任何跡象證明有外星人,足見在這個宇宙當(dāng)中人有多么的獨特,。今天我們說想用機器替代人,想復(fù)刻一個人,,我認為這是不現(xiàn)實的,。
36氪:十年后,,AGI(通用人工智能)是不是已經(jīng)實現(xiàn)了?
“強人工智能”(Artificial General Intelligence),,意思是它和人的能力是一樣的。這個詞對應(yīng)的是“弱人工智能”和“超人工智能”,。這種劃分方法我不是很認可,。
智能涌現(xiàn)也好,,機器越來越聰明也好,,我都很看好,我唯一不覺得我們的努力方向是要把機器變成人,,完全沒有必要,。
李彥宏:技術(shù)進步的速度越來越快,,生產(chǎn)效率提升會越來越明顯,,這是過去很多年的發(fā)展之中不斷證明的。如果過去大家可能一周工作5天,,也許10年之后工作3天就足夠了,。勞動生產(chǎn)率的提升會讓人們生活的幸福感更強。
我自己也因為這件事情很興奮,,因為我能夠參與其中并且貢獻一些東西,。
李彥宏:一定更幸福,。
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,觀點僅代表作者本人,,不代表芒果財經(jīng)贊同其觀點或證實其描述,,版權(quán)歸原作者所有。轉(zhuǎn)載請注明出處:http://lequren.com/1005993.html
溫馨提示:投資有風(fēng)險,,入市須謹慎,。本資訊不作為投資理財建議。