來源:科技每日推送
主持人:尊敬的來賓,女士們、先生們,,專家學(xué)者,,開發(fā)者,企業(yè)家們,,大家上午好,。
歡迎蒞臨2024AI智領(lǐng)者峰會,我是來自阿里云的AI主持人通義,。很高興在我國全國的經(jīng)濟性經(jīng)濟中心城市和國家創(chuàng)新型城市,,粵港澳大灣區(qū)核心城市深圳與大家相遇。45年前深圳市建立經(jīng)濟特區(qū),,作為中國改革開放的窗口,,創(chuàng)造了舉世矚目的深圳速度。創(chuàng)新是深圳這座城市的特點,,特質(zhì)和品牌,,如今,當(dāng)人工智能科技的浪潮席卷而來,,我們見證了AI如何以前所未有的速度重塑了經(jīng)濟和生活,,這座城市也正在以科技創(chuàng)新之際,拓展創(chuàng)新之路,,最終呈高質(zhì)量發(fā)展之效,。今天,我們從這里出發(fā),,共話人工智能大模型的實踐方向和應(yīng)用的未來,加速推動大灣區(qū)乃至全國快速探索出一條適合自己的智能化創(chuàng)新之路,。首先,,有請阿里云智能集團副總裁、公共云首席解決方案架構(gòu)師 韓鴻源帶來開場演講云計算加速AI爆發(fā),。掌聲歡迎,。
韓鴻源:各位尊敬的嘉賓大家早上好。
歡迎大家來到AI智領(lǐng)者峰會會場,,我來簡單向大家介紹一下我們在云和AI方向的發(fā)展和未來發(fā)展方向的一些看法,。
首先,先回顧一下云計算一個發(fā)展過程,,從2006年云計算誕生開始,,其實云計算經(jīng)歷一個快速發(fā)展的迭代過程,云和云上承載的應(yīng)用相互促進,,形成今天非常蓬勃云計算整個的趨勢,,在這個趨勢上來講,回顧一下過程里面幾個關(guān)鍵的時間段,,最開始的時候,,其實云計算承載的是把線下的這些IT技術(shù)能力搬到云上去,降低成本和方便管理能力這些方面的提升,,當(dāng)然到今天為止其實很多人認為云計算還是停留在這個階段上,,但實際上云計算經(jīng)過了其他很多快速發(fā)展的階段,比如走過了初期的管理能力提升和降低成本階段之后,,云上誕生了像云原生這樣的新的開發(fā)范式,。這個新的開發(fā)范式加速很多應(yīng)用的迭代和能力的提升,包括也促進云計算本身的一些發(fā)展,,在云原生技術(shù)普及之后,,其實下一個階段里面誕生很多先進架構(gòu)的需求,,這個需求來自于當(dāng)越來越多的關(guān)鍵業(yè)務(wù)系統(tǒng)承載在云上的時候,對云計算提出了更多的要求,,這個時候可以看到在云上做這些高可用容災(zāi)各方向的這些發(fā)展,,包括架構(gòu)上怎么更好支撐這些業(yè)務(wù)系統(tǒng),保證業(yè)務(wù)系統(tǒng)連續(xù)性和可靠性的同時,,能夠提升運行效率,,提出很多新的挑戰(zhàn),同時很多新興的公司體會到云計算帶來新的好處,,就是傳統(tǒng)行業(yè)里當(dāng)要做業(yè)務(wù)連續(xù)性和高可用性的時候,,其實是一個非常高的門檻,但是當(dāng)結(jié)合云計算做這件事情的時候,,通過軟件定義的方式非常簡單在非常小的規(guī)模下使用到具有高可靠性,,高可用性這些基礎(chǔ)設(shè)施,來構(gòu)建自己業(yè)務(wù)系統(tǒng)和保證業(yè)務(wù)系統(tǒng)的連續(xù)運行,。走過這個階段之后,,后續(xù)是一個全球化的蓬勃發(fā)展,尤其是當(dāng)國內(nèi)企業(yè)參與到全球化進程中的時候帶來很多新的變化,,就是在近幾年的全球化里面其實云計算面臨很多的挑戰(zhàn),,比如像合規(guī)、數(shù)據(jù)主權(quán)相關(guān)的話題,,當(dāng)云計算面臨挑戰(zhàn)的時候,大家一起做了非常多的工作之后,,解決掉了這方面絕大部分的擔(dān)心,,所以也促成了全球化的蓬勃發(fā)展,促成了國內(nèi)企業(yè)出海非常蓬勃的發(fā)展,。
走過這個階段之后,,最近這兩年大家看到生成式AI的爆發(fā)和帶來一些新的需求,在這個階段里,。就是大家今天最關(guān)心的情況,,不管是大模型還是其他的生成式AI,帶來了新的基礎(chǔ)設(shè)施和基礎(chǔ)能力的需求,,同時也為應(yīng)用帶來新的發(fā)展機會,。我們預(yù)計在下個階段里面隨著人工智能技術(shù)的持續(xù)發(fā)展和成本的持續(xù)降低,人工智能會走到一個無處不在的狀態(tài),,這是未來新的發(fā)展階段,,我們今天努力去幫助大家一起去走向這個階段,鋪平走向這個階段所有的技術(shù)能力和技術(shù)手段方面的準備,。
回到現(xiàn)在說的生成式AI爆發(fā)階段上,,大家可以感受的到是說,,今天在生成式AI爆發(fā)的階段里面,其實云計算幫助生成式AI做到讓所有人可以非常容易使用到這些技術(shù)手段,,包括技術(shù)能力方面的提升,,讓大家可以有效地去運行所有技術(shù)負載。我這里列了一下,,從計算,、數(shù)據(jù)、開發(fā),、部署各個方向來講,,今天的生成式AI對所有的技術(shù)能力提出非常多新的挑戰(zhàn),這些挑戰(zhàn)包括計算能力提升到今天大家看到的EFLOP(音)級別的能力需求,,包括持續(xù)運行一個訓(xùn)練任務(wù),,可能需要運行周或者月級別的時長才能讓它拿到有效的結(jié)果。數(shù)據(jù)方面來講其實是TB,、PB級的數(shù)據(jù)會成為常態(tài)參與到所有的密集計算過程里,,才能產(chǎn)生想要的結(jié)果來。在開發(fā)過程里,,很多時候模型的探索是面臨著非常多的技術(shù)基礎(chǔ)工作,,這些工作里面其實怎么樣高效開展工作,也是需要有一個有效平臺支撐它的運轉(zhuǎn),。最后,,實際上今天大家可以看到,通過這邊提供一些信息,,今天絕大部分跟AI相關(guān)的工作,,其實是承載在云上的,絕大部分組織使用了這些云的能力,,也是通過在云上使用更有效地讓它們發(fā)揮作用的,。
作為一個云計算公司,在我們的平臺上持續(xù)在追求一個極致的性能和彈性方向上的持續(xù)提升,,來有效地支撐剛才提到不管存儲計算網(wǎng)絡(luò)還是軟件能力層面各個方面的提升需求,。結(jié)合這幾個方面來看,我簡單匯報一下我們在計算,、存儲,、網(wǎng)絡(luò)、大數(shù)據(jù)幾個方向的一些進展,。
可以看到,,雖然經(jīng)過十幾年的發(fā)展,但今天阿里云在每年每個階段里面持續(xù)提升自己的技術(shù)能力,,包括在AI方向上,,我們自研自己的服務(wù)器,,在自己的集群里面去探索更大規(guī)模集群下能夠有效運行計算負載。存儲方向來講,,怎么讓存儲不成為AI訓(xùn)練和所有AI工作的瓶頸,,去提升它的運行效率。在網(wǎng)絡(luò)方面怎么樣能夠去更有效地讓更大的集群有機結(jié)合起來,,更好有效地開展工作,。數(shù)據(jù)庫和大數(shù)據(jù)方面來講其實更多承載大家看到更偏傳統(tǒng)一些的負載,但是當(dāng)它跟AI做結(jié)合的時候,,當(dāng)新的應(yīng)用在AI方向上做了更多事情的時候,,也會對這些技術(shù)能力提出很多新的要求,我們也配合這些能力做了非常多新的提升,,包括數(shù)據(jù)庫響應(yīng)每年雙十一和所有促銷活動里面的業(yè)務(wù)壓力,,包括像大數(shù)據(jù)里面流失去處理每秒鐘幾億次,每秒鐘幾億TB級的這種存儲量,。
除了這些之外今天還有一個新的趨勢,,云計算逐漸走向serverless化,任何AT系統(tǒng)運轉(zhuǎn)不可能沒有服務(wù)器,,serverless講的不是沒有服務(wù)器,,是服務(wù)器對用戶的使用沒有感知。就是當(dāng)你去使用這些云上服務(wù)能力的時候,,并不需要感知這些物理服務(wù)器的存在,,不需要感知這些物理存在情況下,可以更有效地使用這個服務(wù),,這樣會大大簡化企業(yè)使用IT計算能力的難度和方便大家開發(fā)新的應(yīng)用,。這是我們現(xiàn)在新的追求方向,今天大家感受AI的使用也是serverless的方式,,大家去調(diào)云上所有這些AI服務(wù)的時候,你不會知道這個服務(wù)運行在什么樣的服務(wù)器上,,你也不需要關(guān)注這個服務(wù)運行在什么樣的服務(wù)器上,,你去使用這個服務(wù)有效地滿足業(yè)務(wù)需求就好了。
結(jié)合這點之后,,現(xiàn)在看到一個新的發(fā)展方向,,在傳統(tǒng)意義上,大家一般會認為云計算組成是由基礎(chǔ)設(shè)施和一些軟件層技術(shù)去實現(xiàn)的,。但是現(xiàn)在隨著人工智能一步一步的發(fā)展,,我們覺得今天需要把另外一個因素引進到技術(shù)站里面來,就是模型及服務(wù)的服務(wù)能力,。這個服務(wù)能力有一個很大的變化,,和以前比起來有很大的區(qū)別,,以前大家永德不管是IaaS、PaaS都是傳統(tǒng)大家使用的計算能力,,這些更偏傳統(tǒng)計算機架構(gòu)下有效執(zhí)行的能力,。但是當(dāng)走到今天以模型和AI為中心的時候帶來一個新的變化,神經(jīng)網(wǎng)絡(luò)會成為計算能力一個基礎(chǔ)的組成部分,,神經(jīng)網(wǎng)絡(luò)的計算方式跟以前的傳統(tǒng)機器指令的執(zhí)行方式間會有很大的差異,,結(jié)合這個新的計算方式引入會帶來很多新的變化,資源池的變化,,管理方式的變化,,技術(shù)能力組織的變化,所有這些變化加在一起其實今天看到的我們認為未來可能會從IaaS,、PaaS走到IaaS,、PaaS+MaaS三個方向,一起結(jié)合支撐業(yè)務(wù)系統(tǒng)和應(yīng)用有效地運行和發(fā)展,。
說到這點之后,,談一下今天主要的話題,我這里畫了一幅圖,,這個圖畫得比較簡單,,不是一個面面俱到地想覆蓋一切的圖。但是從詩意的角度來講,,今天非常熱門大語言模型這個方向來講,,畫這個圖想說今天用戶去使用這個模型的時候并不需要去掌握模型的原始訓(xùn)練所有的細節(jié),,這個圖分了三個階段,,上面畫了我們?nèi)コ休d不同的工作負載大家會是什么樣的架構(gòu)在做。從最左邊開始,,其實基礎(chǔ)模型的訓(xùn)練,,很多時候在今天來講,大家可以感受得到從去年的百模大戰(zhàn)到現(xiàn)在以后可能不再會有那么多的模型存在了,,模型的競爭會越來越激烈,,想訓(xùn)一個好的模型,想讓市場上有競爭力不是那么容易的事情,。其實往下走的時候,,不管是對技術(shù)資源的需求、投入資金的要求,,還有對技術(shù)能力的要求,,這都會越來越高,這個方向來講會經(jīng)歷一個比較殘酷淘汰的過程,。這個之后流程里面,,在使用模型階段里面,,可以看成兩個小段,以前當(dāng)大語言模型剛出來的時候,,大家非常喜歡做的一件事情就是模型微調(diào),,就是我針對特定的業(yè)務(wù)方向,希望能把我享有的領(lǐng)域支持注入模型里面,,讓模型按我希望的方式回答我的問題,,去處理我給它的請求。但是這個需求今天不會是繼續(xù)像以前那么強了,,原因是什么,?當(dāng)基礎(chǔ)模型泛化能力越來越強的時候,當(dāng)它能夠去做更多處理的時候,,模型的微調(diào)有時候不一定是最好的選擇,。當(dāng)然不管模型經(jīng)不經(jīng)過微調(diào),最終可能走到下面真正用的時候,,其實是走到推理服務(wù)的階段,,就你是一個基礎(chǔ)模型也好,是一個定制模型也好,,當(dāng)你走到推理的時候是模型真正發(fā)揮作用的時候,。在這個推理流程里,今天從應(yīng)用側(cè)去看的時候,,不管今天訪問的是任何一個AI的模型服務(wù),,本質(zhì)上來講它不是一個原始的推理服務(wù)。推理服務(wù)實際上通過API訪問的,,訪問的時候?qū)嶋H上中間有很多串入環(huán)節(jié)的,,當(dāng)你訪問的你認為是模型服務(wù)的時候,有可能里面有其他的處理流程在里面,。我這里畫了一下,,這邊有一些提示詞的優(yōu)化嵌入到里面去,也有像下面增強生成語料的提供結(jié)合在一起去做的,,右側(cè)畫了一個示意的應(yīng)用,,這個應(yīng)用除了使用AI能力之外,它還會像以前一樣地去使用所有云上這些基礎(chǔ)能力,,不管是PaaS也好,還是IaaS也好,,這可能是未來應(yīng)用運行的大概形態(tài),。在這個形態(tài)來講從用戶側(cè)來講,更多還是關(guān)注在應(yīng)用這一側(cè),,怎么跟模型做好接口使用的作用,,而不需要去關(guān)注太多模型內(nèi)部到底怎么樣把它訓(xùn)出來,,因為使用一個基礎(chǔ)模型不意味著你要去訓(xùn)練一個基礎(chǔ)模型,你完全可以使用很多現(xiàn)成的服務(wù),,當(dāng)你理解了更多原理的時候,,可以讓你更好使用這個模型,但是不意味著你要從頭做起這些訓(xùn)練工作和基礎(chǔ)工作,。
說到剛才幾個階段,,PAI、靈駿簡單和大家講一下,。PAI,、靈駿是今天云計算基礎(chǔ)設(shè)施級的基礎(chǔ)能力,結(jié)合上層軟件能力一體化的整體訓(xùn)練平臺,。在這個平臺上,,它會給以前的IT帶來新的可以值得大家反思的地方,隨著生成式AI的持續(xù)發(fā)展,,今天有一個很大的變化,,以前云計算把大家線下的負載搬到云機房里面去,可能改造或者不改造沒有關(guān)系,,云上也不會帶來翻天覆地的變化,,當(dāng)今天要訓(xùn)練的模型大到可能需要萬卡甚至于更多卡的時候,,這個能力可能不是大家選一個機房,,在里面把服務(wù)器把網(wǎng)絡(luò)連上可以運載的狀況,它已經(jīng)變成了非常專業(yè)的工作領(lǐng)域,,當(dāng)你要優(yōu)化大規(guī)模計算基礎(chǔ)設(shè)施的時候,,其實這個東西可能隨著未來隨著商業(yè)化分工的越來越強,會更多由云計算廠商承載,,而不是由每一個客戶搭建這個系統(tǒng),,因為畢竟大家在這塊技術(shù)上是有分工的。
說一些指標性的東西,。今天計算里面用到的網(wǎng)絡(luò)已經(jīng)是每秒鐘能夠傳遞3.2個TBPS的數(shù)據(jù),,網(wǎng)絡(luò)的延時都是個位數(shù)微妙級的,對存儲的需求是幾十TB的這種大B級吞吐量的需求,,持續(xù)連續(xù)性不出現(xiàn)問題,,或者出現(xiàn)問題不影響工作,至少達到幾周的工作才能確保大參數(shù)模型有效地得到訓(xùn)練,。
說完訓(xùn)練相關(guān)的事情,,下一步模型使用有兩個典型的鏈路,模型的推理,其實推理這件事情本質(zhì)是一個原始的操作,,真正去用模型的時候,,其實用戶完全可以選擇基于這種技術(shù)模型喂給它相應(yīng)的提示詞,喂給它相應(yīng)希望能夠知道的上下文也好,,讓它更好的運轉(zhuǎn),。
另外一點在模型使用過程中有很多技巧性的東西,或者有很多的技術(shù)環(huán)節(jié)可以幫助大家讓模型發(fā)揮作用,。下面那條線模型的定制其實不意味著要改模型參數(shù),,很多時候的定制其實怎么樣更有效地讓模型在一個更好的環(huán)境里去運行的時候能夠發(fā)揮出你想要的效果來。這塊來講新的一些發(fā)展趨勢包括智能體的做法,,包括結(jié)合RAG去做知識管理的做法,,現(xiàn)在逐步經(jīng)過很多探索之后,今天的很多應(yīng)用逐漸走向成熟,。這一塊在客戶業(yè)務(wù)系統(tǒng)里面來講,,可以更簡單有效使用這些模型的能力,,通過這些更靈活的方式結(jié)合,,能夠讓它更好地發(fā)揮作用,。
再往下,模型會是一個非常豐富的生態(tài),,在今天來講,,在我們的平臺上,去支持大家去運行的模型包括自己自產(chǎn)的模型,,這里列出來所有通義系列的模型,,包括千問,,包括有通義的多模態(tài)萬象的模型還有通義的VR視覺和語言結(jié)合的模型。除了這個之外,,我們的平臺今天是一個開放的運行方式,,它的承載能力可以去支持三方的這些模型和經(jīng)過調(diào)整的垂直模型的有效運行。今天大家比拼模型之外,,還要比拼模型的服務(wù)能力,。模型服務(wù)這件事來講,我們提供有效運行模型的平臺,,是幫大家更有效更低成本地讓模型能夠發(fā)揮它應(yīng)該發(fā)揮的作用,。除了這兩點之外,,還有更重要一條怎么樣跟開發(fā)者社區(qū)有效地結(jié)合起來,能夠為大家提供一個可以在模型上更方便地開展工作,,更方便地獲取模型和把自己的成果發(fā)布出來的平臺。這是下面列出來這些,,像model scope平臺,,今天國外的huggingface平臺,結(jié)合在一起是為大家提供一個更好的持續(xù)發(fā)展下去的生態(tài)環(huán)境,。
跟大家匯報一下我們自己模型的進展。
在自己研究模型這件事來講,,有一個很重要的原因,,就是當(dāng)我搭建前面大家看到的這些有效的訓(xùn)練也好,推理也好的平臺的時候,,它總要有一個載體驗證它的效果是不是可以有效運轉(zhuǎn),,所以我們自己的通義模型是一個很好的證明,我們今天搭建的所有這些平臺級的能力,,可以有效去訓(xùn)練出好的模型來和讓好的模型在上面提供好的服務(wù)能力,。
這邊可以看到通義其實品牌的發(fā)布是2022年的9月份,通義千問大語言模型發(fā)布是2023年4月份,。當(dāng)時剛發(fā)布的時候,,早期用戶可以體會到初級版本一些不成熟的地方,但是后續(xù)做了非常多模型的迭代,。到去年8月的時候通義模型相對能力比較完整了,,到去年10月份的時候,通義2.0發(fā)布之后,,這個模型能力其實已經(jīng)完全具備今天主流的先進模型能力,。除了這個方向之外,我們今天也在做的一件事情,,我們在提供商業(yè)模型的同時,,其實提供非常多開源的貢獻,通義今天可能是市場上開放的參數(shù)最大最完整最成體系的模型系列,,就是我們從7B的模型開始開源,,到后來7B、14B,,一直迭代到72B,。包括今年4月份我們其實開放千億級參數(shù)的通義的千問模型。
在開放的體系里可以發(fā)現(xiàn),,整個社區(qū)里面,,通義開源模型的下載量和使用量非常高,,尤其國內(nèi)的很多用戶,包括很多海外用戶里面,,通義的開源模型有非常好的用戶基礎(chǔ)和非常好的口碑存在,。除了這個之外,通義模型商業(yè)版本,,我們自己在持續(xù)發(fā)展的模型也在不停的發(fā)展,,今年5月份的時候上個月在北京開峰會的時候發(fā)布通義千問2.5的版本,這個版本標志著模型的能力進入到了下一個非常高性能的階段,,大家如果有興趣盡可能嘗試新版本,,其實還是能持續(xù)給大家?guī)硪恍┬碌捏@喜。
商業(yè)模型本身,,魔搭社區(qū),,這個社區(qū)是我們?yōu)橹鲗?dǎo)去組建的一個開放社區(qū)。這個社區(qū)歡迎大家加入,,歡迎大家在這個社區(qū)上面使用包括反饋大家的相關(guān)意見,,包括在上面去上傳自己的模型,去下載別人提供的模型,,大家一起促成整個模型的開放生態(tài),,未來更有效,更蓬勃的發(fā)展下去,,讓整個AI的環(huán)境得到更蓬勃的發(fā)展,。
我們的看法。今天在云上去結(jié)合我的生成式AI模型服務(wù)能力,,構(gòu)建新一代的應(yīng)用,,或者去改造現(xiàn)有的應(yīng)用里面加入更多的智能能力,這個可能是我們目前最希望和大家一起探討和持續(xù)發(fā)展的方向,,希望后續(xù)能跟大家有更多的機會,,在這件事情上展開更多的合作。謝謝大家,!
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,,觀點僅代表作者本人,不代表芒果財經(jīng)贊同其觀點或證實其描述,,版權(quán)歸原作者所有,。轉(zhuǎn)載請注明出處:http://lequren.com/1107084.html
溫馨提示:投資有風(fēng)險,入市須謹慎,。本資訊不作為投資理財建議,。