本報(bào)記者 李昆昆 李正豪 北京報(bào)道
11月27日,亦即字節(jié)跳動(dòng)確認(rèn)收縮游戲業(yè)務(wù)當(dāng)天,《中國(guó)經(jīng)營(yíng)報(bào)》記者注意到,,字節(jié)跳動(dòng)成立了一個(gè)新的AI(人工智能)部門Flow,技術(shù)負(fù)責(zé)人為字節(jié)跳動(dòng)技術(shù)副總裁洪定坤,,業(yè)務(wù)帶頭人為字節(jié)跳動(dòng)大模型團(tuán)隊(duì)的負(fù)責(zé)人朱文佳,。Flow 的相關(guān)招聘信息顯示,F(xiàn)low 是字節(jié)跳動(dòng)旗下 AI 創(chuàng)新業(yè)務(wù)團(tuán)隊(duì),,目前已在國(guó)內(nèi)和海外分別上線了豆包和 Cici 兩款產(chǎn)品,,還有多個(gè) AI 相關(guān)創(chuàng)新產(chǎn)品在孵化中。業(yè)內(nèi)普遍認(rèn)為,,這也許是字節(jié)跳動(dòng)在收縮游戲業(yè)務(wù)的同時(shí),,加碼AI應(yīng)用開(kāi)發(fā)的信號(hào)。
《中國(guó)經(jīng)營(yíng)報(bào)》記者打開(kāi)豆包App發(fā)現(xiàn),,發(fā)現(xiàn)其已經(jīng)上線了編程助理,、文學(xué)伴侶、爆款文案,、戀愛(ài)大師等應(yīng)用功能,,值得一提的是,,豆包上還上線了創(chuàng)建AI智能體功能,所有用戶都可以在豆包上創(chuàng)建自己的AI智能體,。
記者詢問(wèn)豆包都有哪些應(yīng)用場(chǎng)景,,結(jié)果顯示:“我是字節(jié)跳動(dòng)公司基于云雀模型開(kāi)發(fā)的人工智能,,我的名字叫豆包。我可以應(yīng)用于自然語(yǔ)言處理,、對(duì)話系統(tǒng),、智能客服、內(nèi)容生成,、智能助手,、教育培訓(xùn)等場(chǎng)景。這些只是我的一些應(yīng)用場(chǎng)景,,隨著技術(shù)的不斷發(fā)展,,我的應(yīng)用場(chǎng)景還會(huì)不斷擴(kuò)展?!?/p>
而Cici主打海外市場(chǎng),,2023年8月已在海外多個(gè)市場(chǎng)上線,目前已在36個(gè)國(guó)家和地區(qū)上線,,基本上除了歐美成熟市場(chǎng)之外的全球其他區(qū)域均有覆蓋,。
創(chuàng)建AI智能體
實(shí)際上,早在2016年,,字節(jié)跳動(dòng)就成立了AI實(shí)驗(yàn)室,,聚焦于自然語(yǔ)言處理、機(jī)器學(xué)習(xí),、數(shù)據(jù)挖掘等方面的研究,。抖音,、今日頭條等字節(jié)跳動(dòng)旗下產(chǎn)品中也頻頻加入AIGC(生成式人工智能)功能,持續(xù)吸引流量,。
一直以來(lái),,AI在字節(jié)跳動(dòng)的核心業(yè)務(wù)中都扮演著重要的角色。根據(jù)官方披露的抖音標(biāo)簽算法圖,,AI處于整個(gè)流程的核心地位,。從機(jī)器視頻檢測(cè),到結(jié)合關(guān)鍵詞匹配,,再到疊加推薦,、系統(tǒng)“挖墳”、更高級(jí)別流量池,,相關(guān)場(chǎng)景都出現(xiàn)了AI的加持,。
在豆包的界面中,尤其引人注意的是,,每個(gè)用戶都可以在豆包上創(chuàng)建自己的AI智能體來(lái)獲取粉絲,粉絲可以與AI智能體對(duì)話,。記者試著在豆包上創(chuàng)建了自己的智能體,,咨詢問(wèn)題都會(huì)收到自動(dòng)回復(fù)。
比如,,記者問(wèn)豆包的數(shù)據(jù)來(lái)源來(lái)自哪里,,豆包是這樣回答的:“我是基于字節(jié)跳動(dòng)的云雀模型開(kāi)發(fā)的人工智能,我的訓(xùn)練數(shù)據(jù)來(lái)自于互聯(lián)網(wǎng),、書籍,、新聞、社交媒體等多個(gè)領(lǐng)域的文本數(shù)據(jù),。這些數(shù)據(jù)經(jīng)過(guò)清洗,、預(yù)處理和標(biāo)注等一系列處理步驟后,被用于我的訓(xùn)練,?!?/p>
談及豆包與OpenAI、文心一言等大模型產(chǎn)品的區(qū)別,,盤古智庫(kù)高級(jí)研究員江瀚告訴本報(bào)記者:“從優(yōu)勢(shì)來(lái)看,,一是專注于某一領(lǐng)域,豆包可能專注于某一特定領(lǐng)域,,如娛樂(lè),,這使得它在該領(lǐng)域內(nèi)的理解和應(yīng)用可能更深入。二是本地化優(yōu)勢(shì),,如果豆包是針對(duì)某一特定地區(qū)或國(guó)家開(kāi)發(fā)的,,它可能更好地理解該地的文化,、習(xí)慣和語(yǔ)言,從而在某些任務(wù)上表現(xiàn)出色,。從劣勢(shì)看,,一是規(guī)模較小,與OpenAI和文心一言等相比,,豆包可能在模型大小,、訓(xùn)練數(shù)據(jù)量和計(jì)算資源上都有所限制,這可能會(huì)影響其在某些任務(wù)上的性能,。二是通用性差,,由于豆包當(dāng)前專注于某一領(lǐng)域或地區(qū),它在其他領(lǐng)域或地區(qū)的性能不如大型通用模型,?!?/p>
記者了解到,豆包的訓(xùn)練數(shù)據(jù)來(lái)自互聯(lián)網(wǎng)上的大量文本,,包括新聞,、博客、小說(shuō),、論文等,,而OpenAI的訓(xùn)練數(shù)據(jù)則來(lái)自多個(gè)領(lǐng)域的文本,包括科學(xué),、技術(shù),、藝術(shù)等;豆包的模型結(jié)構(gòu)是基于深度學(xué)習(xí)的,,使用了多層神經(jīng)網(wǎng)絡(luò),,而OpenAI 的模型結(jié)構(gòu)則是基于強(qiáng)化學(xué)習(xí)的,使用了深度強(qiáng)化學(xué)習(xí)算法,;豆包的應(yīng)用場(chǎng)景主要是自然語(yǔ)言處理,,包括文本生成、問(wèn)答,、翻譯等,,而OpenAI的應(yīng)用場(chǎng)景則更加廣泛,包括機(jī)器人,、游戲,、金融等領(lǐng)域。
總的來(lái)說(shuō),,目前豆包和OpenAI的區(qū)別可能在于其訓(xùn)練數(shù)據(jù),、模型結(jié)構(gòu)和應(yīng)用場(chǎng)景不同。
大模型百花齊放
大模型是今年互聯(lián)網(wǎng)行業(yè)的關(guān)鍵詞。實(shí)際上,,從2021年起,,中國(guó)就涌現(xiàn)了一些有代表性且具備影響力的大模型。受ChatGPT影響,,國(guó)內(nèi)大模型在2023年進(jìn)入高速發(fā)展階段,,一時(shí)間呈現(xiàn)“百模大戰(zhàn)”局面。根據(jù)賽迪顧問(wèn)數(shù)據(jù),,截至2023年7月底,,中國(guó)累計(jì)發(fā)布了130個(gè)大模型,其中64個(gè)大模型是在2023年內(nèi)發(fā)布,。國(guó)內(nèi)大模型技術(shù)分布基本與海外一致,,65%的大模型集中在自然語(yǔ)言領(lǐng)域,22%的大模型集中在多模態(tài)領(lǐng)域,。
從全球范圍來(lái)看,,中國(guó)和美國(guó)在大模型領(lǐng)域引領(lǐng)全球發(fā)展。根據(jù)中國(guó)科學(xué)技術(shù)信息研究所,、科技部新一代人工智能發(fā)展研究中心聯(lián)合發(fā)布的《中國(guó)人工智能大模型地圖研究報(bào)告》,,截至2023年5月,美國(guó)已發(fā)布100個(gè)參數(shù)規(guī)模10億以上的大模型,。中國(guó)亦積極跟進(jìn)全球大模型發(fā)展趨勢(shì),,自2021年以來(lái)加速產(chǎn)出,如2021年6月北京智源人工智能研究院發(fā)布1.75萬(wàn)億參數(shù)量的悟道2.0,、2021年11月阿里M6大模型參數(shù)量達(dá)10萬(wàn)億等。
同時(shí),,在應(yīng)用方面,,基于通用大模型能力已相對(duì)成熟可用,其上的應(yīng)用生態(tài)已逐漸繁榮,。得益于對(duì)先進(jìn)算法模型的集成以及較早的產(chǎn)品化,,OpenAI不僅展現(xiàn)了GPT(生成式預(yù)訓(xùn)練Transformer模型)在人機(jī)對(duì)話中的超預(yù)期表現(xiàn),同時(shí)基于GPT的應(yīng)用生態(tài)也已逐漸繁榮,,微軟數(shù)款產(chǎn)品(Bing,、Windows操作系統(tǒng)、Office,、瀏覽器,、Power Platform等)、代碼托管平臺(tái)GitHub,、AI營(yíng)銷創(chuàng)意公司Jasper等均已接入GPT,。
2023年,字節(jié)跳動(dòng)在AI領(lǐng)域的動(dòng)作明顯加快。6月,,火山引擎發(fā)布大模型服務(wù)平臺(tái)——火山方舟,,運(yùn)營(yíng)模式是在一個(gè)平臺(tái)內(nèi)提供多個(gè)模型,讓企業(yè)用戶同步試用,,并選用更適合自身業(yè)務(wù)需要的模型組合,,本質(zhì)上扮演了“賣鏟人”的角色。其自研的通用大模型“云雀”始終沒(méi)有官宣,,直到今年8月才在首批通過(guò)《生成式人工智能服務(wù)管理暫行辦法》大模型名單中露出,。8月17日,字節(jié)跳動(dòng)公測(cè)基于云雀大模型開(kāi)發(fā)的AI聊天機(jī)器人“豆包”,,面向C端市場(chǎng)發(fā)力AI應(yīng)用,。此外,市場(chǎng)還傳出了字節(jié)跳動(dòng)正在計(jì)劃開(kāi)發(fā)云端AI芯片和Arm服務(wù)器芯片的消息,。
在算力儲(chǔ)備方面,,字節(jié)跳動(dòng)今年向英偉達(dá)訂購(gòu)的GPU產(chǎn)品總價(jià)超10億美元,接近英偉達(dá)去年在中國(guó)銷售的商用GPU總和,,而GPU是AI訓(xùn)練不可或缺的計(jì)算基礎(chǔ)設(shè)施,。
談及是否看好豆包未來(lái)的發(fā)展,財(cái)經(jīng)專欄作者馬繼鵬對(duì)本報(bào)記者說(shuō):“目前來(lái)講,,還是比較有潛力的,,可能取決于幾個(gè)方面,一是字節(jié)跳動(dòng)的云雀模型在業(yè)內(nèi)來(lái)說(shuō)還是比較先進(jìn)的,,之前有消息說(shuō)字節(jié)跳動(dòng)在AI芯片儲(chǔ)備方面還是有優(yōu)勢(shì)的,,所以它的底層技術(shù)實(shí)力不用擔(dān)心。二是字節(jié)跳動(dòng)有很好的寫大模型代碼的人,。三是因?yàn)樽止?jié)跳動(dòng)也有龐大的數(shù)據(jù)能力,,一定會(huì)把云雀大模型訓(xùn)練得比較聰明?;谝陨先c(diǎn),,如果這個(gè)大模型本身比較先進(jìn)、比較聰明的話,,那它上面的應(yīng)用應(yīng)該也不會(huì)太差,。”
江瀚認(rèn)為,,豆包的未來(lái)取決于多個(gè)因素,,包括其技術(shù)路線、市場(chǎng)定位,、合作伙伴和競(jìng)爭(zhēng)格局等,。如果豆包無(wú)法突破技術(shù)或資源的限制,,或者面臨激烈的競(jìng)爭(zhēng)和市場(chǎng)壓力,它的未來(lái)發(fā)展可能會(huì)受到挑戰(zhàn),。但如果豆包能夠繼續(xù)深化其在特定領(lǐng)域或地區(qū)的技術(shù)和應(yīng)用優(yōu)勢(shì),,并與其他企業(yè)或機(jī)構(gòu)建立合作關(guān)系,它有可能在該領(lǐng)域或地區(qū)取得領(lǐng)先地位,。另外,,如果豆包能夠持續(xù)投入研發(fā),跟上技術(shù)發(fā)展的步伐,,并擴(kuò)大其模型和數(shù)據(jù)的規(guī)模,,它也有可能成為一個(gè)更具競(jìng)爭(zhēng)力的通用模型。
免責(zé)聲明:本文來(lái)自網(wǎng)絡(luò)收錄或投稿,,觀點(diǎn)僅代表作者本人,,不代表芒果財(cái)經(jīng)贊同其觀點(diǎn)或證實(shí)其描述,版權(quán)歸原作者所有,。轉(zhuǎn)載請(qǐng)注明出處:http://lequren.com/1082586.html
溫馨提示:投資有風(fēng)險(xiǎn),,入市須謹(jǐn)慎。本資訊不作為投資理財(cái)建議,。