業(yè)界首個AI蛋白質(zhì)生成大模型“達(dá)爾文”(NewOrigin)7日在2023世界人工智能大會(WAIC)上正式亮相。其研發(fā)領(lǐng)軍人,清華大學(xué)智能產(chǎn)業(yè)研究院卓越訪問教授,、分子之心創(chuàng)始人許錦波表示,,AI蛋白質(zhì)生成大模型瞄準(zhǔn)創(chuàng)新藥設(shè)計、合成生物學(xué)等真實產(chǎn)業(yè)應(yīng)用需求,,將用一個模型滿足蛋白質(zhì)生成全流程需求,未來大分子藥、新生物材料等蛋白質(zhì)設(shè)計可實現(xiàn)“一鍵定制”,。
據(jù)介紹,該大模型通過學(xué)習(xí)千億級多模態(tài)大數(shù)據(jù),,可實現(xiàn)多模態(tài)定向生成,,單模型就能滿足序列生成、結(jié)構(gòu)預(yù)測,、功能預(yù)測,、從頭設(shè)計等蛋白質(zhì)生成全流程需求,解決產(chǎn)業(yè)應(yīng)用所需的特定功能蛋白質(zhì)生成難題,,并在真實的產(chǎn)業(yè)環(huán)境中評估效果與價值,。
過去60多年中,蛋白質(zhì)結(jié)構(gòu)始終是困擾生物學(xué)家的難題之一,,這一局面在AI方法應(yīng)用之后得到了根本性的改變,。2016年,許錦波首次借助AI大幅提升了蛋白質(zhì)結(jié)構(gòu)預(yù)測精度,,并開始逐步影響蛋白質(zhì)生成,。但由于極高的技術(shù)壁壘,,蛋白質(zhì)生成至今仍是尚未完全攻克的技術(shù)難題。
“大模型的出現(xiàn)將大大加速蛋白質(zhì)生成技術(shù)的發(fā)展進(jìn)程,,并推動其在生物醫(yī)藥,、合成生物學(xué)等領(lǐng)域應(yīng)用?!痹S錦波表示,。當(dāng)下ChatGPT等自然語言大模型的表現(xiàn),讓各界對大模型機(jī)制信心倍增,。但在蛋白質(zhì)生成等專業(yè)垂直領(lǐng)域,,通用的自然語言大模型能力十分有限。究其原因,,生物領(lǐng)域的復(fù)雜數(shù)據(jù),、專業(yè)知識與應(yīng)用場景,都與自然語言交互的通用場景相差甚遠(yuǎn),,能力要求也更高,。
因此,研發(fā)蛋白質(zhì)生成大模型,,除了必備的算法,、算力、數(shù)據(jù)等基礎(chǔ)條件,,還需要具備兩大專業(yè)進(jìn)階能力:一是融合計算機(jī),、生物、物理等多學(xué)科,,熟識AI,、分子動力學(xué)、量子計算等多種方法,,且能在實踐中并行考慮序列與結(jié)構(gòu),、主鏈與側(cè)鏈、進(jìn)化與組學(xué)的跨領(lǐng)域融合能力,;二是走出實驗室,,下沉至真實的產(chǎn)業(yè)環(huán)境,在需求,、驗證,、落地上貼近真實產(chǎn)業(yè)需求的能力。
據(jù)了解,,許錦波團(tuán)隊從2019年開始使用預(yù)訓(xùn)練機(jī)制研發(fā)蛋白質(zhì)設(shè)計算法,,通過整合結(jié)構(gòu)預(yù)測、側(cè)鏈預(yù)測、蛋白-蛋白對接等多種技術(shù),,結(jié)合多種場景需求,,目前已在改造或從頭設(shè)計蛋白質(zhì)上取得了重要的突破。比如,,設(shè)計功能類似但更小的蛋白質(zhì),、能夠結(jié)合某個小分子的蛋白質(zhì)、能夠結(jié)合某個底物的酶,、基因編輯用的蛋白質(zhì)等,。
在此基礎(chǔ)上,許錦波團(tuán)隊開發(fā)了融合自然語言和蛋白語言的AI蛋白質(zhì)生成大模型“達(dá)爾文”(NewOrigin),。它具備可以根據(jù)特定需求定制化生成蛋白質(zhì),、實現(xiàn)快速驗證和迭代、降低交互門檻等優(yōu)勢,。更重要的是,該大模型是真正面向產(chǎn)業(yè)需求的AI蛋白大模型,,可基于工業(yè)級的應(yīng)用反饋持續(xù)迭代,,解決真實的產(chǎn)業(yè)需求。
為了更好地滿足應(yīng)用所需,,分子之心以大模型為底層基礎(chǔ),,面向藥物設(shè)計、合成生物學(xué)等應(yīng)用場景打造產(chǎn)業(yè)級的解決方案,,并進(jìn)一步將大模型的能力在藥物設(shè)計,、生物育種、環(huán)境保護(hù),、高性能材料等多個領(lǐng)域廣泛落地,,驅(qū)動多領(lǐng)域創(chuàng)新。比如,,以對話交互的方式,,讓NewOrigin生成針對某個靶點的抗體,或生成具備某個底物特異性的酶等,。
許錦波表示,,AI和生物科技是當(dāng)下全球科技競爭的重要戰(zhàn)略領(lǐng)域,蛋白質(zhì)技術(shù)作為生物科技的底層技術(shù),,與AI融合創(chuàng)新是必由之路,。AI蛋白質(zhì)生成大模型的開發(fā)只是起點,更具價值的是將其真正應(yīng)用于產(chǎn)業(yè)中,,實現(xiàn)可編程,、可預(yù)測的創(chuàng)新藥設(shè)計和生物制品開發(fā),通過底層技術(shù)突破驅(qū)動生物經(jīng)濟(jì)變革。(記者李志勇)
編輯:李會平
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,,觀點僅代表作者本人,,不代表芒果財經(jīng)贊同其觀點或證實其描述,版權(quán)歸原作者所有,。轉(zhuǎn)載請注明出處:http://lequren.com/1055566.html
溫馨提示:投資有風(fēng)險,,入市須謹(jǐn)慎。本資訊不作為投資理財建議,。