摘要:上海在大模型,、區(qū)塊鏈,、云計(jì)算等前沿科技領(lǐng)域的先期探索,,正逐步進(jìn)入了“結(jié)果”期。
今年,,超600萬上海市民投保2023年滬惠保,,絕大多數(shù)人都只是手機(jī)上點(diǎn)幾下就操作成功,不再需要和保險代理人面對面簽協(xié)議。原本復(fù)雜的買保險流程,,如今卻如此簡便,,背后的金融科技力量支撐中,少不了上??萍计髽I(yè)優(yōu)刻得的“數(shù)據(jù)沙箱”,,這一技術(shù)能使滬惠保與醫(yī)保局?jǐn)?shù)據(jù)對接,在保證隱私和安全的前提下,,讓市民的參保流程縮短至幾分鐘,。
一份至少40多頁的銀行信貸報(bào)告,依賴人工填寫至少需要3分鐘,,在“曹植”大模型的輔助下,,完成同樣一份報(bào)告僅需6秒,效率提高了30倍,。
9月7日至9日,,2023外灘大會將在上海舉行。作為2023外灘大會的關(guān)鍵議題,,當(dāng)前核心技術(shù)和未來前沿科技如何銜接落地,,成了業(yè)界關(guān)注的趨勢重點(diǎn)。大會召開前夕,,記者在走訪上海本地科創(chuàng)企業(yè)的過程中發(fā)現(xiàn),,近幾年來,上海在大模型,、區(qū)塊鏈、云計(jì)算等前沿科技領(lǐng)域的先期探索,,正逐步進(jìn)入“結(jié)果”期,,甚至與不少地方拉開了“半個身位”的差距。
抓住跨時代技術(shù)的風(fēng)口
“大模型不是越大越好,,這一點(diǎn)已經(jīng)在業(yè)界達(dá)成了共識,,只有要高質(zhì)量訓(xùn)練數(shù)據(jù)的‘投喂’,哪怕是樣本小一些,大模型的輸出效果反而很好,?!边_(dá)觀數(shù)據(jù)董事長陳運(yùn)文表示,在有些通用大模型還在燒錢拼參數(shù)的時候,,不少垂直領(lǐng)域的大模型已經(jīng)走通了商用道路,,其中不乏上海企業(yè)的身影。
眾所周知,,科技進(jìn)步從來不是簡單的量變過程,,一旦突破“奇點(diǎn)”將以指數(shù)級速度進(jìn)化。因此如何找到前沿科技的“千里馬”,,尤為考驗(yàn)科技企業(yè)的眼光,。早在2020年6月,GPT-3剛剛誕生,,AI大模型的概念還鮮為人知,,陳運(yùn)文就開始率先試用,效果并不滿意,,不過他卻看好大模型的潛力,。兩年后,ChatGPT(GPT-3.5)的橫空出世,,雖然與GPT-3只隔了0.5個代際,,效果確是天壤之別,這讓陳運(yùn)文意識到:“這是一個跨時代的技術(shù),,或許能撬動整個社會與行業(yè)的變革,。”
即便ChatGPT誕生迅速走紅,,不少人還只是將其看作是聊天工具,,但達(dá)觀數(shù)據(jù)卻想把握住ChatGPT背后NLP(自然語言處理)的技術(shù)風(fēng)口,全力投入自主研發(fā)國產(chǎn)大模型,。
今年1月開始,達(dá)觀數(shù)據(jù)調(diào)集了近200位工程師的團(tuán)隊(duì)參與研發(fā)“曹植”大模型,,不僅要買高性能GPU芯片,,還要學(xué)會組網(wǎng)形成算力網(wǎng)絡(luò),訓(xùn)練模型也要從小數(shù)據(jù)開始打磨,,逐漸將規(guī)模擴(kuò)大到中,、大、超大的模型,。據(jù)了解,,“曹植”大模型的訓(xùn)練數(shù)據(jù)規(guī)模遠(yuǎn)超于一所大學(xué)圖書館的藏書量,光研發(fā)大模型的硬件投入超千萬元。
經(jīng)過半年的攻堅(jiān),,今年7月,,國內(nèi)首個垂直行業(yè)專用的自主可控的GPT大語言模型——“曹植”大模型在人工智能大會上正式發(fā)布,這也是國內(nèi)首批可落地的產(chǎn)業(yè)應(yīng)用級模型,。在陳運(yùn)文看來,,ChatGPT在3月開始火出圈的時候,達(dá)觀數(shù)據(jù)已經(jīng)領(lǐng)先半個身位,。目前,,“曹植”可準(zhǔn)確完成多種類型、復(fù)雜結(jié)構(gòu)的長文本寫作,。以信貸報(bào)告為例,,一份銀行信貸報(bào)告至少40頁,以前靠人工逐一填寫,,如今“曹植”大模型能自動完成報(bào)告,,只需要人工寫大綱以及核實(shí)數(shù)字即可。
上海人工智能行業(yè)翹楚商湯科技也在大模型領(lǐng)域早有布局,早在4月就推出商湯“商量SenseChat”,,是國內(nèi)最早的基于千億參數(shù)大語言模型之一,,前不久正式向公眾開放服務(wù)。此外,,商湯還聯(lián)合多家國內(nèi)頂級科研機(jī)構(gòu)發(fā)布書生·浦語InternLM-123B,,在全球51個知名評測集中整體排名全球第二。
借助通用大模型的強(qiáng)大算力,商湯在不少垂直領(lǐng)域也是行業(yè)大模型的“隱形冠軍”,。據(jù)了解,,基于商湯“日日新”大模型孵化出的醫(yī)療語言大模型“大醫(yī)”,已在全國多家醫(yī)院成功落地,。商湯與鄭州大學(xué)第一附屬醫(yī)院合作,,基于海量藥學(xué)知識和專家經(jīng)驗(yàn),定向研發(fā)行業(yè)前沿的用藥咨詢大語言模型,,與上海交通大學(xué)醫(yī)學(xué)院附屬新華醫(yī)院合作開發(fā)了慢性病患者的智能隨訪功能,。
夯實(shí)人工智能的底座
大模型的興起也在帶動云計(jì)算技術(shù)的發(fā)展。傳統(tǒng)觀點(diǎn)認(rèn)為,,國產(chǎn)大模型面臨的三方面挑戰(zhàn)是算力,、數(shù)據(jù)和算法,但優(yōu)刻得副總裁劉杰表示,,還有一方面能力也是國產(chǎn)大模型的短板,,即系統(tǒng)工程能力,這就為數(shù)據(jù)產(chǎn)業(yè)提供了新的機(jī)遇,。
他向記者舉例,,比如某算法需要一千張顯卡的訓(xùn)練集群,每臺服務(wù)器是8張卡,,那么一個千卡的集群就是100多臺服務(wù)器,,如何把這100多臺服務(wù)器組成一個可供大模型訓(xùn)練所需要的集群,并實(shí)現(xiàn)盡可能接近100%的運(yùn)算效率,,需要將任務(wù)分配最優(yōu)化,,這就是一個非常復(fù)雜的系統(tǒng)工程,要求平臺對硬件,、軟件,、計(jì)算等多方面專業(yè)都十分熟悉。
這種系統(tǒng)工程能力的高低,,將直接決定模型訓(xùn)練和使用成本的高低,。也因此,人工智能企業(yè)開始尋求具有系統(tǒng)工程建設(shè)能力的云計(jì)算企業(yè)優(yōu)勢互補(bǔ),。
優(yōu)刻得原本有著云計(jì)算服務(wù)和無損網(wǎng)絡(luò)運(yùn)營經(jīng)驗(yàn),,和自建數(shù)據(jù)中心的優(yōu)勢,很快便切入了AIGC解決方案這一賽道,。近年來,,得益于數(shù)字經(jīng)濟(jì)的不斷壯大,,優(yōu)刻得也迅速發(fā)展,。這家注冊成立于2012年的企業(yè),,如今已經(jīng)完成科創(chuàng)板上市,,成為國內(nèi)云計(jì)算第一股,,在云計(jì)算、數(shù)據(jù)流通,、隱私計(jì)算等方面實(shí)現(xiàn)了率先布局,。
“對于數(shù)字化轉(zhuǎn)型來說,云計(jì)算企業(yè)更像是一個底座,,一個信息化的基礎(chǔ)設(shè)施,,我們更多的是去給各類企業(yè)、政府提供所需的底層資源,,包括數(shù)據(jù)中心,、算力、存儲,、網(wǎng)絡(luò)等,。”劉杰說,。
伴隨著大模型,、元宇宙、區(qū)塊鏈等技術(shù)浪潮的不斷席卷,,云計(jì)算產(chǎn)業(yè)迎來一輪又一輪的發(fā)展機(jī)遇,,很多上海數(shù)據(jù)科技企業(yè)如優(yōu)刻得、星環(huán)科技得以迅速成長,。根據(jù)IBM發(fā)布的2020年云計(jì)算市場的報(bào)告中,,全球云計(jì)算市場的規(guī)模預(yù)計(jì)將在2020年達(dá)到3700億美元,市場增長率將達(dá)到17%,。
打破數(shù)據(jù)聯(lián)通的壁壘
當(dāng)然,,云計(jì)算領(lǐng)域很重要一部分內(nèi)容是隱私計(jì)算。相較于大模型這類興起的人工智能技術(shù),,以“區(qū)塊鏈+隱私計(jì)算”為代表的數(shù)據(jù)流轉(zhuǎn)技術(shù)在上海已有成熟的應(yīng)用,。
1982年,圖靈獎得主,、中科院院士姚期智提出了經(jīng)典“百萬富翁”問題:兩個百萬富翁在街頭相遇,,雙方想要一較財(cái)富高低,但都不愿暴露自身財(cái)富有多少,,如何在沒有第三方幫助的情況下,,推斷出誰更富有,?從這個問題開始,隱私計(jì)算,、多方安全計(jì)算等技術(shù)分支不斷發(fā)展,,現(xiàn)在已經(jīng)可以在眾多的生活場景中逐步落地,雖然使用者可能并不會感覺到它們的存在,。
比如在購物時,,你是否會收到商家發(fā)放的優(yōu)惠券、滿減券,?這可能就是商家根據(jù)你的信用,、消費(fèi)習(xí)慣、消費(fèi)水平等多方面數(shù)據(jù),,分析后再發(fā)放給你的消費(fèi)券,。但這些數(shù)據(jù)并不一定就是商家自有的,可能涉及支付方,、銀行方,、商戶等多方的數(shù)據(jù),商家如何在不侵犯顧客信息隱私的前提下,,得到更多數(shù)據(jù)的聯(lián)動,,就需要隱私計(jì)算的支持。
再比如政務(wù)機(jī)關(guān)之間,,雖然各自都掌握大量的公共數(shù)據(jù),,但如果想要打破壁壘,實(shí)現(xiàn)數(shù)據(jù)聯(lián)通卻非常之難,,這對于各個基層政府部門的技術(shù)要求過高,。如果能用去中心化的方式實(shí)現(xiàn)數(shù)據(jù)聯(lián)通,則可以增加數(shù)據(jù)的使用效率,,真正發(fā)揮數(shù)據(jù)的價值,更好地為民服務(wù),。
近年來,,螞蟻鏈、Conflux(樹圖)等上海區(qū)塊鏈企業(yè)不斷涌現(xiàn),,在產(chǎn)業(yè)上鏈,、城市上鏈方面提供技術(shù)支持,。螞蟻鏈技術(shù)總監(jiān)魏長征介紹,,2021年,,螞蟻鏈率先提出面向數(shù)據(jù)流轉(zhuǎn)的“鏈原生隱私計(jì)算”技術(shù)理念,,并推出數(shù)據(jù)隱私協(xié)作平臺“FAIR”,在出廠設(shè)置中就將隱私計(jì)算與區(qū)塊鏈融合到了單個系統(tǒng)內(nèi),。目前,,“區(qū)塊鏈+隱私計(jì)算”已經(jīng)成為業(yè)界認(rèn)可的有效解決方案。隱私計(jì)算的發(fā)展直接關(guān)系到區(qū)塊鏈的應(yīng)用推廣,。復(fù)旦管院信息管理與商業(yè)智能系教授竇一凡告訴記者,區(qū)塊鏈?zhǔn)且环N去中心化的分布式存儲技術(shù),,如果實(shí)現(xiàn)大規(guī)模推廣,,例如在醫(yī)療、金融,、商業(yè)領(lǐng)域,,必然會涉及涉及敏感信息的合規(guī)使用,這就對數(shù)據(jù)安全提出了非常高的要求,。
竇一凡介紹,自2016年開始,,網(wǎng)絡(luò)安全法,、數(shù)據(jù)安全法、個人信息保護(hù)法等法規(guī)相繼出臺,,2022年底“數(shù)據(jù)20條”發(fā)布,,當(dāng)前國內(nèi)有關(guān)數(shù)據(jù)產(chǎn)業(yè)發(fā)展的法律邊界已經(jīng)逐漸明晰?!爱a(chǎn)業(yè)怎么能夠在邊界內(nèi)做得更好,,我們還拭目以待?!?/p>
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,,觀點(diǎn)僅代表作者本人,不代表芒果財(cái)經(jīng)贊同其觀點(diǎn)或證實(shí)其描述,,版權(quán)歸原作者所有,。轉(zhuǎn)載請注明出處:http://lequren.com/1071235.html
溫馨提示:投資有風(fēng)險,,入市須謹(jǐn)慎。本資訊不作為投資理財(cái)建議,。