“開源不只是為了讓我們能夠看到代碼,,它更是為了讓我們能夠使用代碼,。而后者,,才是開源真正的魔力,,或者說,,力量所在,?!?/p>
原文來源:甲子光年
作者|劉楊楠
編輯|王博
圖片來源:由無界 AI?生成
2023年的大模型浪潮中,,“開源”是一個繞不開的關(guān)鍵詞。大廠,、明星創(chuàng)業(yè)公司,、高校及科研院所均投身其中:
6月9日,智源研究院宣布:“悟道3.0”邁向全面開源的嶄新階段,;
6月15日,,百川智能推出70億參數(shù)量的中英文預(yù)訓(xùn)練大模型baichuan-7B,模型免費可商用,;7月,,百川智能繼續(xù)推出完全開源、免費可商用的baichuan-13B,;
7月17日,,智譜AI宣布開源大模型ChatGLM-6B和ChatGLM2-6B;
8月3日,,阿里巴巴宣布開源通義千問70億參數(shù)模型Qwen-7B,;
10月30日,昆侖萬維宣布開源百億級大語言模型「天工」Skywork-13B系列,,并罕見地配套開源了600GB,、150B Tokens的超大高質(zhì)量開源中文數(shù)據(jù)集;
11月6日,,元象XVERSE宣布開源650億參數(shù)高性能通用大模型XVERSE-65B,;
……
為什么大模型會在國內(nèi)引起新一輪AI開源熱潮?
對這輪大模型初創(chuàng)公司而言,,開源是一手“一石三鳥”的好牌——
其一,,開源是一個免費的自我宣傳渠道??焖俚_源模型能及時向外界“秀肌肉”,,個人開發(fā)者或企業(yè)真正使用模型后,就能直觀感受到企業(yè)的技術(shù)實力;
其二,,企業(yè)也能通過開源模型匯聚一批潛在的合作伙伴,,甚至潛在客戶,為之后的商業(yè)化做積累,;
其三,,“高手在民間”,企業(yè)能夠通過開源匯聚一批散落各處的優(yōu)秀開發(fā)者共同迭代自己的模型,。
大模型給沉寂已久的AI開源填了一把火,,但真正讓星星之火形成燎原之勢的,是一個真正能良性循環(huán)的開源生態(tài),。
在開源生態(tài)的建設(shè)中,,除模型開發(fā)商外,還有一股很重要的力量——開源社區(qū),。如果說模型開發(fā)者為開源生態(tài)源源不斷地注入“活水”,,那么開源社區(qū)就是開源生態(tài)中的一個個“蓄水池”。
長久以來,,國內(nèi)開源生態(tài)的一大痛點便在于,,優(yōu)質(zhì)“蓄水池”太少,很多源源不斷的“活水”都流向了國外,,最終間接導(dǎo)致生態(tài)難以成熟,,以至于在不少人心中,都烙下了“中國做不成開源社區(qū)”的刻板印象,。
今天,,在“大模型把所有行業(yè)重做一遍”的全新語境下,行業(yè)或許需要重新審視中國AI開源生態(tài)的可能性,。
本文,,「甲子光年」深度對話始智AI wisemodel創(chuàng)始人兼CEO、清華校友總會AI大數(shù)據(jù)專委會副秘書長劉道全,,談?wù)劥竽P蜁r代,,中國AI開源生態(tài)的新機會。
始智AI?wisemodel創(chuàng)始人兼CEO,、清華校友總會AI大數(shù)據(jù)專委會副秘書長劉道全,圖片來源:受訪者提供
1.做“中國版Hugging Face”
2023年9月4日,,國內(nèi)首個完全獨立運營的第三方AI開源社區(qū)“wisemodel.cn”上線。
“我們的目標(biāo)是要打造‘中國版Hugging Face’,,匯聚國內(nèi)外常用的開源AI模型和數(shù)據(jù)集等資源,,建設(shè)中立開放的AI開源創(chuàng)新平臺,。”Wisemodel上線當(dāng)天,,其背后公司始智AI的創(chuàng)始人劉道全在官方微信公眾號寫下了第一篇文章,。
除始智AI創(chuàng)始人、CEO外,,劉道全還有另一重身份——清華校友總會AI大數(shù)據(jù)專委會副秘書長,。2015年,畢業(yè)三年的劉道全重返清華,,開始負(fù)責(zé)清華校友AI大數(shù)據(jù)生態(tài)方面的工作,。
2022年,,劉道全開始籌備獨立創(chuàng)業(yè),。
那時,ChatGPT還沒有成為AI界的“屠龍少年”,,新的風(fēng)暴還未出現(xiàn),,劉道全最先瞄準(zhǔn)了一條來錢最快,也最易把握的賽道——倒騰算力,。
確定方向后,,劉道全跑遍了全國各大云廠商和數(shù)據(jù)中心,基本摸清了全國的算力分布格局,。但很快,,他發(fā)現(xiàn),算力屬于基礎(chǔ)資源類生意,,“基礎(chǔ)資源類生意最后通常都免不了價格戰(zhàn)”,,劉道全告訴「甲子光年」。
他想做點更有價值的事,。事實上,,當(dāng)時的劉道全已經(jīng)站在了“天時地利人和”的交界處。
2020年,,GPT-3的出現(xiàn)已經(jīng)在AI圈形成小范圍震蕩,,清華園里無數(shù)技術(shù)人內(nèi)心蠢蠢欲動。最終,,“清華系”種子選手智譜AI成為國內(nèi)率先入局大模型的初創(chuàng)公司,。三年后的今天,當(dāng)年的種子選手已經(jīng)搖身一變成為行業(yè)頭部企業(yè),。
身為“清華系”的圈內(nèi)人,,劉道全清晰感受到了一些變化正在發(fā)生。他開始盤算手里的資源,。在負(fù)責(zé)AI大數(shù)據(jù)生態(tài)工作的7年里,,劉道全接觸了大量AI,、大數(shù)據(jù)企業(yè),對各類技術(shù)線,、產(chǎn)品分類基本都做到了心中有數(shù),。一手掌握全國的算力地圖,一手掌握AI行業(yè)最新動向,,同時還身處群星閃耀的清華系,,他接下來要解決的問題,便是找到一個切入點,,將已經(jīng)擁有的資源最大化利用,。
ChatGPT給劉道全送來了東風(fēng)。
ChatGPT出現(xiàn)后,,不少人一邊迷茫,,一邊追逐,都希望能在慌亂中以最快的速度找到自己的位置,。而劉道全則敏銳發(fā)現(xiàn),,在大模型和應(yīng)用場景之間的“最后一公里”,還有大量機會,。他分享道:“每家的模型都有不同的功能和特點,,現(xiàn)在很多需求端的企業(yè)在選擇模型的時候都要一個一個去試,有時候甚至可能稀里糊涂就用了一個模型,?!?/p>
要解決大模型落地的“最后一公里”,大致有兩條路可走:一條是針對具體問題做單點的工具,;另一條是做平臺,,將算力、模型,、數(shù)據(jù)集,、工具鏈等資源集合在平臺上,讓每一個問題都能找到最合適的解決方案,。
歷史已經(jīng)證明,,國內(nèi)的商業(yè)環(huán)境、用戶付費習(xí)慣對工具類應(yīng)用并不友好,,只做單點工具很難變現(xiàn),。于是,劉道全盤了盤手里的資源,,果斷選擇了另一條,,做平臺。
“縱觀商業(yè)發(fā)展史,,企業(yè)最大的競爭壁壘來自于生態(tài)的壁壘,,大模型時代也不例外,。”劉道全表示,。而要做生態(tài),,最好的切入點便是做社區(qū),“中國版Hugging Face”的小目標(biāo)也由此而來,。這個小目標(biāo)背后,,劉道全心中還有一個更宏大的愿景,就是讓wisemodel立足于中國市場,,并努力將其打造成Hugging Face之外最活躍的社區(qū),。
上線3個多月來,始智AI wisemodel社區(qū)已經(jīng)聚集了數(shù)千名注冊用戶,,公開和私有模型總數(shù)超過500個,,公開和私有的數(shù)據(jù)集總數(shù)接近100個。社區(qū)日均PV在10-20萬次之間,,每天模型和數(shù)據(jù)集的下載次數(shù)在1千次左右,,社區(qū)公眾號的關(guān)注人數(shù)也超過了3400人,,累計閱讀次數(shù)超過8.6萬次,。
不過,在中國開源社區(qū)上空,,還長久籠罩著一個詛咒般的刻板印象——中國做不好開源社區(qū),。wisemodel如何打破這種舊狀?
2.扔掉舊地圖,,才能找到新大陸
“中國做不好開源社區(qū)”的刻板印象背后,是多年以來,,中國開源社區(qū)難以商業(yè)變現(xiàn)的殘酷現(xiàn)實,。
直到今天,國內(nèi)依然有許多人認(rèn)為“開源即免費”,。如何自己養(yǎng)活自己,,是所有開源社區(qū)都會面臨的一個歷史性難題。
事實上,,這并非是國內(nèi)獨有的困境,。即使在開源理念的發(fā)源地美國,開源運動的先驅(qū)們也用了很長一段時間來探索開源的商業(yè)模式,?;乜礆v史,從軟件誕生的第一天起,,“開源即免費”的認(rèn)知就被刻在了軟件的基因里,。
將時鐘撥回上世紀(jì)50年代,,“軟件”的概念剛剛誕生。很長一段時間里,,軟件只是硬件的附屬,,可隨硬件免費贈送,后續(xù)升級也無需收費,。當(dāng)時的軟件還直接附帶有源代碼,,便于專業(yè)人員調(diào)試和修改。某種程度上,,這已經(jīng)為之后的開源軟件模式奠定了前調(diào),。
1969年,IBM率先打破了軟件“免費贈送”的模式,,開始對部分軟件收費,。之后20年,收費模式帶動軟件市場迅速繁榮的同時,,也讓軟件生態(tài)變得越來越“封閉”,。除需付費使用外,軟件供應(yīng)商也會通過各種技術(shù)和法律手段,,來限制他人共享,、修改甚至研究程序。
軟件從免費,、開放到收費,、封閉的轉(zhuǎn)變也引來了許多開發(fā)者的不滿。
當(dāng)時還在MIT人工智能實驗室做程序員的理查德·斯托曼(Richard Stallman)反對尤甚。理查德·斯托曼的思想頗為激進(jìn),,主張“所有軟件都應(yīng)對所有人公開”,。1985年10月,,理查德·斯托曼還成立了自由軟件基金會,以資助更多自由軟件開發(fā)者,。
理查德·斯托曼,圖片來源:歷史照片
如今回看,,理查德激進(jìn)的軟件共享哲學(xué)像一把雙刃劍——一方面,,其大力推動了開源軟件的發(fā)展進(jìn)程,成為開源軟件最初的思想內(nèi)核,;另一方面,,“free”在英文中還有“免費”的含義,因此,,自由軟件(free software)被一些人誤認(rèn)為是“免費軟件”,。20世紀(jì)90年代,為避免這種理解謬誤,,網(wǎng)景公司用“開源軟件”替代“自由軟件”,,正式開啟了開源時代。
在此后數(shù)十年的發(fā)展中,,開源社區(qū)逐漸形成了幾種典型的商業(yè)模式,。
BentoML亞太區(qū)負(fù)責(zé)人劉聰曾在一次活動中將開源的商業(yè)模式劃分為三個時代:“所謂1.0可能就是Red Hat(紅帽),賣support和賣license的模式,,2.0更多是OpenCore模式,,賣一些premium的功能。3.0可能就像Databricks和云平臺強綁定的模式,,它的收費和用量可以和云平臺分享?!?/p>
不過,,大模型時代,AI開源或許會在傳統(tǒng)的開源之外形成一種全新的商業(yè)模式,。
劉道全告訴「甲子光年」,,開源社區(qū)本身確實沒有太好的商業(yè)模式,但大模型引發(fā)的這輪AI開源熱潮和傳統(tǒng)的軟件開源有本質(zhì)不同,,可能會給AI開源社區(qū)帶來新的商業(yè)機會,。
“傳統(tǒng)的軟件開源是純粹的代碼托管,開發(fā)者下載代碼后,,部署在自己的服務(wù)器上運行,,用戶跟社區(qū)的交互主要是下載。而AI開源除了代碼,,更重要的是模型,。大模型時代,,讓模型和應(yīng)用分離成為趨勢,用戶開發(fā)的應(yīng)用可以調(diào)用模型能力來解決實際問題,,這其中就有可以挖掘的商業(yè)價值,。”劉道全進(jìn)一步解釋道,。
拋棄舊地圖,,才能找到新大陸。歷史只是證明,,基于代碼托管的傳統(tǒng)軟件開源模式無法在中國跑通,,但大模型帶來的新機會仍需要無數(shù)后來者去驗證。
劉道全就是那個率先出發(fā)的人,。
在他的暢想中,,wisemodel會經(jīng)歷兩個商業(yè)化階段——
第一階段,平臺主要面向開發(fā)者,,打通模型和算力資源,,通過算力變現(xiàn)。
大模型的高門檻在于,,即使大模型已經(jīng)開源,,用戶(企業(yè)或個人)想要下載并部署模型也需要一定的算力資源。準(zhǔn)備好算力后,,用戶還需在算力平臺上安裝各種基礎(chǔ)環(huán)境做調(diào)試,,調(diào)試好之后才能加入自有的數(shù)據(jù)做微調(diào)或者部署推理等。Wisemodel則能打通模型和算力平臺,,幫用戶省去模型和算力平臺的調(diào)試環(huán)節(jié),,讓企業(yè)能夠一鍵使用模型,還可以直接提供模型托管等服務(wù),。
第二階段,,平臺開始面向應(yīng)用開發(fā)者,真正深入應(yīng)用場景,,解決模型與應(yīng)用的“最后一公里”,。
當(dāng)社區(qū)的活躍度和豐富度都相對成熟后,wisemodel便能夠根據(jù)企業(yè)真實場景的需求,,將聚集在平臺上的模型,、工具等打包,提供給企業(yè)的應(yīng)用開發(fā)者,,解決場景業(yè)務(wù)問題,。
不過,理想固然豐滿,但腳下的路,,依然艱難,。
3.開源之路,道阻且長
“現(xiàn)在國內(nèi)依然有很多人認(rèn)為,,在中國做不成開源社區(qū)?!眲⒌廊嬖V「甲子光年」,。
他坦言,wisemodel上線前,,曾經(jīng)歷過一段冷啟動時期,。
從2023年7月開始,劉道全就和“清華系”的模型廠商聯(lián)絡(luò),,智譜AI,、百川智能等第一批wisemodel的“VIP”用戶幾乎全部來自清華系?!暗谝徊ɑ臼恰⒛槨蟼鞯?。”劉道全自我調(diào)侃道,。
冷啟動的艱難在于,,wisemodel真正要實現(xiàn)的,不只是讓模型廠商完成“上傳模型”的動作,,而是要從根本上改變國內(nèi)開發(fā)者在過去數(shù)十年形成的習(xí)慣——人人皆知國外的開源生態(tài)更成熟,,開發(fā)者選擇國外社區(qū)幾乎已經(jīng)成為慣性動作。
培養(yǎng)用戶的使用習(xí)慣注定是一個需要耐心的過程,。
自2023年9月成立以來,,劉道全幾乎把大部分精力都用來運營社區(qū)?!懊刻於荚诳凑l家有新模型了,,就鼓勵他們把模型放上來,我們也會在各個行業(yè)群里幫社區(qū)用戶推模型,。”
對于接下來的計劃,,劉道全有點與創(chuàng)業(yè)者不太相符的“佛系”,。他說:“我們不會給自己設(shè)KPI,開源社區(qū)是件長期的工作,,就像長跑一樣不需要太在意開始的速度,,只要wisemodel持續(xù)存在,整個AI行業(yè)持續(xù)發(fā)展,自然會有新東西源源不斷地上傳到社區(qū),,這樣社區(qū)才可能‘活’起來,,而不是一個‘死’的社區(qū)?!?/p>
或許有人會問,,既然開源無國界,追求開放共融,,為什么要在國外已經(jīng)有成熟開源社區(qū)的前提下,,還要在國內(nèi)重新運營一個社區(qū)?
劉道全表示,,社區(qū)與社區(qū)之間不是完全競爭的關(guān)系,,每個社區(qū)都會有各自的特點,很多社區(qū)都可以聯(lián)動,,每個社區(qū)都是整個開源版圖上的一個組成部分,。
另外,國內(nèi)很多模型廠商的訓(xùn)練語料都以中文為主,,客戶也在國內(nèi),,wisemodel能向開發(fā)者提供更及時的服務(wù),降低開發(fā)者獲取和使用模型的門檻,。同時,,“由于Hugging Face上的模型和數(shù)據(jù)集數(shù)量和種類太過龐雜,除了有影響力的頭部機構(gòu)發(fā)布的內(nèi)容,,很多內(nèi)容已經(jīng)基本沒人關(guān)注和下載,。”劉道全說,。
劉道全也堅定表示,,wisemodel會保持中立。“現(xiàn)在我依然很堅持,,開源社區(qū)這件事被貼上特定標(biāo)簽后,,反而可能做不成。如果有大廠找過來,,我也會直接跟他說‘我們可以合作,,但最好不要投我’?!?/strong>
放眼未來,,開源生態(tài)將會成為國內(nèi)大模型浪潮中一片豐沃的土壤。
從技術(shù)角度看,,國內(nèi)AI實力與美國仍有差距,,更不用說大模型的成本和研發(fā)門檻極高,開源則在技術(shù)層面大大拉低了大模型的入局門檻,讓更多創(chuàng)業(yè)者能夠更容易地拿到入場門票,。
從商業(yè)落地角度看,,很多時候,企業(yè)需要的并不是一個具有千億乃至萬億參數(shù)的SOTA(最先進(jìn))模型,,而是一個能夠穩(wěn)定支撐企業(yè)在此基礎(chǔ)上構(gòu)建穩(wěn)定大模型應(yīng)用的模型底座,,這些模型可能往往只有幾十億參數(shù),這便是開源生態(tài)的機會,。開源模型雖然能力相對較弱,,但在落地時更靈活,也更經(jīng)濟(jì),。
因此,,國內(nèi)的AI從業(yè)者有充分的理由,給國內(nèi)的AI開源生態(tài)更多耐心和信心,。
事實上,,國內(nèi)并不缺少優(yōu)秀的開發(fā)者。Tiamat創(chuàng)始人,、CEO青柑曾在2023甲子引力年終盛典上感嘆:“高手在民間,。”她分享道:“我自己就是開源生態(tài)的受益者,,我上學(xué)的時候會花大量時間在Discord上潛水或者和大佬們討論,,可以在社區(qū)接觸到很多日常生活中絕對接觸不到的大佬。對于我們這些從社區(qū)出來的年輕創(chuàng)業(yè)者而言,,和社區(qū)里的技術(shù)大佬們交流會給我們很多啟發(fā),。”
開發(fā)者們在開源社區(qū)中的每一次靈光一現(xiàn),,都可能成為開啟下一個時代的敲門磚,。
正如被譽為“開源運動圣經(jīng)”的《大教堂與集市》一書中所寫:
“開源不只是為了讓我們能夠看到代碼,它更是為了讓我們能夠使用代碼,。而后者,,才是開源真正的魔力,或者說,,力量所在,。”
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,,觀點僅代表作者本人,,不代表芒果財經(jīng)贊同其觀點或證實其描述,版權(quán)歸原作者所有,。轉(zhuǎn)載請注明出處:http://lequren.com/1085451.html
溫馨提示:投資有風(fēng)險,入市須謹(jǐn)慎。本資訊不作為投資理財建議,。