作為一家16歲AI公司的董事長,,思必馳創(chuàng)始人高始興在今年初第一次使用ChatGPT時依舊難掩驚艷,,“至少,發(fā)言稿可以不用專人寫作了。”
然而,伴隨驚艷而來的,,還有當(dāng)時外界對幾乎所有AI公司的質(zhì)疑。
大模型走紅后,,不論是計算機(jī)視覺,、語音識別,亦或基于垂直任務(wù)的自然語言理解,,都被統(tǒng)稱為“上一代AI”,。在36氪今年的交流中,就有好幾家“上一代”AI公司坦言面對新技術(shù)倍感壓力,。
對比之下,,雖然思必馳也屬人工智能語音語言公司,,高始興的內(nèi)心卻沒有過多波瀾,,“我們比較早就布局了這一技術(shù)。之前十億級的模型已經(jīng)用在產(chǎn)品上,,只是沒有對外強(qiáng)調(diào)”,。
據(jù)介紹,思必馳十億級參數(shù)量的模型,,名為DFM-1,,于2022年研發(fā)推出,在ChatGPT還未火熱的2022年已進(jìn)行了小規(guī)模產(chǎn)品應(yīng)用,。而在7月的發(fā)布會上,,思必馳又新推出了DFM-2大模型,參數(shù)量達(dá)到百億級別,。
除卻已有布局,,高始興對思必馳的信心,還源于大模型的技術(shù)路線和場景積累,。
對比其他模型,DFM-2在技術(shù)上強(qiáng)調(diào)對話交互能力,,在場景中強(qiáng)調(diào)專業(yè)化和行業(yè)化,。
思必馳聯(lián)合創(chuàng)始人、首席科學(xué)家俞凱專門厘清了幾個概念,,“通用人工智能,,必須要大模型加上語言計算才行,否則只是專用大模型,。而在此基礎(chǔ)上,,通用大模型還分全域和垂域?!倍Z言計算,,恰好是這家對話式人工智能公司的擅長所在。
俞凱解釋,,大模型概念由來已久,,包括 AIphaFold 蛋白質(zhì)折疊、Stable Diffusion 圖像生成大模型到 Whisper 語音大模型等,,但都沒有引起產(chǎn)業(yè)廣泛重視,。直到對話式語言大模型 ChatGPT 的出現(xiàn),展現(xiàn)出語言計算與大模型結(jié)合所達(dá)成的通用人工智能效果,。俞凱篤信,,“對話式語言計算大模型”,是認(rèn)知領(lǐng)域通用人工智能發(fā)展的里程碑。
基于大模型和語言計算技術(shù),,思必馳的百億參數(shù)模型選擇落地垂直行業(yè),,而非全域。俞凱認(rèn)為,,目前To C領(lǐng)域,,生成式AI已經(jīng)跨越生產(chǎn)力門檻,但在To B領(lǐng)域,,對大模型的數(shù)據(jù)和經(jīng)驗的要求都非常高,。
思必馳的百億大模型將主要聚焦汽車、物聯(lián)網(wǎng)等行業(yè)——也就是這家公司早前已深入的領(lǐng)域,。以汽車為例,,據(jù)介紹,自2019年正式進(jìn)入汽車前裝,,思必馳的產(chǎn)品目前已“上車”600多萬輛,。
“汽車和物聯(lián)網(wǎng)領(lǐng)域是思必馳的主要業(yè)務(wù)領(lǐng)域——服務(wù)于汽車,、家電等智能化,,同時,也賦能垂直行業(yè)的信息智能化,,如金融,、政務(wù)?!备呤寂d表示,。
但即便對所選行業(yè)已有積累,高始興依然不否認(rèn)大模型落地到具體垂直行業(yè)場景的困難,。在他眼中,,現(xiàn)在思必馳的百億大模型“還不錯,但依然有提升空間”,。尤其,,在汽車和家電等物聯(lián)網(wǎng)領(lǐng)域,產(chǎn)品類別非常多,,各種復(fù)雜場景下各系統(tǒng)的融合,,都需要差異化方案——這種情況下要用好大模型,勢必是一場長期戰(zhàn),。
而在回答大模型是否會促進(jìn)IPO的提問時,,高始興坦言,思必馳會在今年或明年繼續(xù)啟動上市,,而大模型是否會對此有促進(jìn)作用,還是要看產(chǎn)業(yè)落地,。
“我們的主戰(zhàn)場針對幾個重點垂直行業(yè),,如車聯(lián)網(wǎng)、IOT以及金融政務(wù)等,。這個方向,,思必馳在技術(shù)、資源和客戶各方面都有積累,?!彼偨Y(jié),“思必馳是一家比較踏實的公司,?!?/p>
以下是對話部分(經(jīng)節(jié)選):
36氪: 思必馳是什么時候開始考慮做大模型的?而且是大模型加上語言計算的概念,?
高始興:語言模型和人機(jī)對話,,確實是我們首先提出的理念。我們是中國最早做對話式人工智能的公司之一,甚至可以說是首個引入這一理念的公司,。
思必馳的聯(lián)合創(chuàng)始人俞凱曾經(jīng)參與創(chuàng)辦過一家人機(jī)對話公司,,后來被蘋果公司收購,所以我們在人機(jī)對話方面的經(jīng)驗非常豐富,。而在語言模型方面,,我們已經(jīng)做了三四年了。思必馳實際上很早就發(fā)布了十億級別的模型,。
36氪:這次發(fā)布的DFM-2百億模型是什么時候開始做的,?現(xiàn)在的進(jìn)展是?
高始興:我們的百億級模型在四月份開始內(nèi)部測試,,現(xiàn)在已經(jīng)開始與一些客戶進(jìn)行落地應(yīng)用,。
另外,思必馳的模型更加深扎行業(yè),。B端和G端與C端有很大不同,,我個人認(rèn)為,或許應(yīng)該由國家來做這些能夠覆蓋各種生態(tài)的大模型,,因為這應(yīng)該是國家的基礎(chǔ)設(shè)施,。對思必馳來說,行業(yè)更應(yīng)該是我們模型所深耕的對象,。技術(shù)型公司應(yīng)該深入到行業(yè)場景中去做技術(shù)創(chuàng)新,,做產(chǎn)業(yè)應(yīng)用。所以,,我們的百億模型的定位是具有一定的通用能力,,然后深入到行業(yè)中,服務(wù)于行業(yè)的垂域模型,。
36氪:思必馳怎么看生成式人工智能和大模型,?
俞凱:今天我們講了大模型和通用人工智能。生成式人工智能其實是諸多人工智能中的一類,,它可以不是大模型,,也可以不是通用的,而且在人工智能領(lǐng)域早已存在?,F(xiàn)在的關(guān)鍵變化是,,生成式人工智能在圖像、語音和文字生成的多樣性和質(zhì)量上已經(jīng)到了一個突破性階段,。
從產(chǎn)業(yè)上看,,現(xiàn)在生成式人工智能在To C領(lǐng)域跨越了門檻。但如果是在To B領(lǐng)域,,情況可能會有所不同,。C端和B端的需求不一樣,,在To B領(lǐng)域,判別式人工智能的問題,,生成式人工智能同樣會面臨,。判別式人工智能關(guān)注正確與否,生成式人工智能更關(guān)注好與壞,。然而在To B領(lǐng)域,,即使是生成式人工智能,正確與否也非常重要,。
對于我們來說,,巨大的機(jī)會在于,生成式人工智能已經(jīng)過了門檻,,它可以作為輔助工具,,與現(xiàn)有的商業(yè)模式結(jié)合來擴(kuò)大應(yīng)用。但是,,出現(xiàn)一種全新的,、純技術(shù)的生成式人工智能被大規(guī)模復(fù)制的可能性是相當(dāng)小的。
因此,,在我看來,,既沒有那么樂觀,也沒有那么悲觀,。我不認(rèn)為現(xiàn)在的生成式人工智能能夠改變世界,,但我相信,它會擴(kuò)大我們的工具使用范圍,,并促使我們將人工智能系統(tǒng)更全面地應(yīng)用到工作中,。
36氪:大模型是否會對To B行業(yè)過去的部署應(yīng)用產(chǎn)生影響?
俞凱:會有一部分影響,,但我認(rèn)為影響比較小,。這個事情特別容易判斷,舉個例子:
假設(shè)你是一名不了解To B業(yè)務(wù)的媒體工作者,,我把你派到一個制造工廠,你能否在一天之內(nèi)完成那里的工作,?如果能,,那么這項工作肯定可以被ChatGPT或其他通用人工智能復(fù)制。如果不能,,那么所有的積累都是有價值的,。這件事的重點并不在于你生成了一些文案,而是你對整個知識流程的精確理解非常重要,。
然而,,你要如何獲得這種精確的理解呢,?要么需要有數(shù)據(jù),要么需要有人教你,。但如果你沒有和廠商合作,,沒有處在這個垂域內(nèi),怎么可能有這些呢,?所以行業(yè)的數(shù)據(jù)和經(jīng)驗是非常重要的,。因為它無法代替人的經(jīng)驗和繁瑣的to B流程,因為在to B領(lǐng)域評價指標(biāo)是多維且復(fù)雜的,,這些無法被通用人工智能簡單替代,。
36氪:目前思必馳大模型所重點關(guān)注的行業(yè)是?
高始興: 我們主要關(guān)注汽車和物聯(lián)網(wǎng)領(lǐng)域,,這與我們的主要業(yè)務(wù)——汽車,、家電智能化,行業(yè)信息智能化息息相關(guān),。對于垂直行業(yè),,如金融,我們也在做智能外呼等項目,,像公安的智能審訊和反詐騙等也有,。
我覺得我們目前也承載不了太多行業(yè),而且要把幾個垂直行業(yè)的賦能做好,,也是一件非常了不起的事情,。
比如在汽車、物聯(lián)網(wǎng)領(lǐng)域,,產(chǎn)品類別本身非常多,,成千上萬。而且,,其中有的場景需要本地服務(wù),,有的需要云端服務(wù),有的需要本地與云端結(jié)合才能做出好的端到端的人機(jī)交互體驗,。
在這之外,,還有各種系統(tǒng)融合、聲學(xué)環(huán)境等需要考慮,。實際上,,我認(rèn)為如果不深入到行業(yè)中,是很難做好的,。我們必須理解場景,,而這些場景實際上非常復(fù)雜。
汽車領(lǐng)域思必馳從后裝到前裝,,做了八到九年的時間,,才做到現(xiàn)在的程度,。我們已經(jīng)做得相當(dāng)好了,比上一代的語音控制技術(shù)已經(jīng)進(jìn)步很大,,但還有進(jìn)步的空間,,東風(fēng)大模型將會帶來新的體驗升級。
36氪:比如說還存在怎樣的進(jìn)步空間,,有具體的例子嗎,?
高始興:未來,我覺得汽車一定會有無人駕駛,,它(大模型)就是你的駕駛助手,、汽車空間的生活娛樂助手。你問它任何問題,,除了常見的汽車控制等問題外,,其他任何問題都可以回答你,像汽車工程師,。車?yán)镆彩且粋€生活娛樂空間,,車內(nèi)學(xué)習(xí)、辦公等等都可以實現(xiàn),。
36氪:比較像現(xiàn)在流行的”副駕駛模式”,。
高始興:對,一定是這樣的,。我們實現(xiàn)了很多創(chuàng)新發(fā)布,,如多音區(qū)人機(jī)對話,我們在這里不僅結(jié)合了人機(jī)對話技術(shù),,還結(jié)合了一些聲學(xué)技術(shù),。無論你在車內(nèi)的主駕駛座位、副駕駛座位還是后排座位,,都可以進(jìn)行人車交互,。
有了百億大模型之后,之前的產(chǎn)品就像大腦更聰明了一樣,。在車內(nèi),,現(xiàn)在的人機(jī)對話還無法讓它成為你車內(nèi)的說明書。大模型之后,,你可以問它關(guān)于車的任何問題,,無論是維修問題,還是其他的問題,,都能回答你。這就是一個例子,。更高級的場景,,你在車內(nèi),,它就是你的助理,,你可以通過人機(jī)對話進(jìn)行訂票、訂酒店,,一站式的服務(wù)。我們期待大模型可以像一個智能助理一樣,,更好地理解和與人交流,。
36氪: 現(xiàn)在我們內(nèi)測的效果怎么樣?
高始興: 還是很不錯的,,也還有提升空間,。因為這涉及到很多方面,不僅是技術(shù)性能的提升,,真正的落地還需要結(jié)合我們在垂直行業(yè)中的經(jīng)驗,,結(jié)合這些場景進(jìn)行優(yōu)化,這不是一朝一夕可以完成的,。比如剛才提到的讓大模型消化,、吸收產(chǎn)品說明書,就需要我們和汽車制造商一起合作,。
36氪:思必馳今年還會啟動上市嗎,?大模型會對這件事產(chǎn)生怎樣的影響?
高始興:我們肯定會啟動上市,,但不一定在今年,,有可能是明年。至于大模型是否有促進(jìn)作用,,我覺得核心還是要把業(yè)務(wù)做好,。大語言模型只是我們一個工具,我們一直在做人機(jī)對話語言模型,,最終還是要產(chǎn)業(yè)落地,。
36氪:作為一家準(zhǔn)備IPO的公司,財務(wù)狀況也非常重要,,但訓(xùn)練大模型是一件比較貴的事,。
高始興:是的,訓(xùn)練大語言模型是很貴的,,但好在我們過去有積累,,包括人機(jī)對話的語料積累,語言模型技術(shù)的積累,,以及早期購買的計算資源,。
對思必馳來說,首先,,這是必須要做的事情,。其次,,公司能承受。我們已經(jīng)有了對話語言模型的技術(shù)和數(shù)據(jù),,所以這就是一個投入的問題,。我們早期也有了GPU算力和超算中心,蘇州政府也給了我們很多支持,。
36氪:對于大模型的投入產(chǎn)出比,,思必馳有什么預(yù)期嗎?
高始興:我覺得效果是陸續(xù)顯現(xiàn)的,,其實并不一定僅從C端直接收費,。比如,如果我們的B端產(chǎn)品升級,,用戶體驗好了,,自然B端客戶就會有源源不斷的升級需求。當(dāng)然我們大模型也有直接的C端用戶,。
整體來說,,思必馳的大模型主要服務(wù)于”溝通萬物、打理萬事”的理念,,主戰(zhàn)場是針對特定行業(yè),,如車聯(lián)網(wǎng)、IOT以及金融政務(wù)等,,構(gòu)建具有通用能力的行業(yè)專業(yè)模型,。對于這件事,我們在技術(shù),、資源和客戶各方面都有積累,。思必馳還是一家比較踏實的公司。
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,觀點僅代表作者本人,,不代表芒果財經(jīng)贊同其觀點或證實其描述,,版權(quán)歸原作者所有。轉(zhuǎn)載請注明出處:http://lequren.com/1061594.html
溫馨提示:投資有風(fēng)險,,入市須謹(jǐn)慎,。本資訊不作為投資理財建議。