原文來源:AIGC開放社區(qū)
圖片來源:由無界 AI生成
谷歌旗下的AI研究機構DeepMind在全球頂級學術期刊《Nature》上發(fā)布了一篇論文,通過深度學習、計算機視覺、大數(shù)據(jù)等,,開發(fā)了一個名為GNoME的圖神經(jīng)網(wǎng)絡模型,主要用于材料發(fā)現(xiàn),。
研究團隊通過GnoME便快速發(fā)現(xiàn)了220萬個新的材料晶體結構,,其中很多結構是人類預測和公式難以發(fā)現(xiàn)的,相較于傳統(tǒng)的材料開發(fā)方法效率提升了10倍,。
論文地址:https://www.nature.com/articles/s41586-023-06735-9?
長期以來,研發(fā)新材料一直面臨高成本,、低效率的難題,。實驗合成法費時費力,成功率低下;
第一性原理計算指導的材料發(fā)現(xiàn)也受限于算力問題,難以做到全面高效的材料空間遍歷。
谷歌DeepMind開發(fā)的深度學習模型AlphaFold在蛋白質結構預測領域,,已經(jīng)展現(xiàn)出了巨大應用潛力并已經(jīng)獲得全球多家著名實驗室的應用,。
因此,研究人員希望可以借助深度學習,,處理復雜的材料結構數(shù)據(jù),開發(fā)一個像“AlphaFold”一樣的高效開發(fā)系統(tǒng)。
簡單來說,,可以把GNoME看成材料發(fā)現(xiàn)界的“AlphaFold”模型,,同時證明了海量的第一性原理計算為模型學習原子間勢提供了支持,并實現(xiàn)了之前從未有過的精度和泛化能力。
GNoME是一個圖神經(jīng)網(wǎng)絡,通過表示晶體的拓撲連接、消息傳遞等機制,實現(xiàn)結構到能量的映射,。該系統(tǒng)集成了多個模塊,實現(xiàn)從候選結構的生成到深度學習預測的全流程自動化,。
GNoME的主要技術創(chuàng)新點在于構建了一個 Flywheel主動學習循環(huán)系統(tǒng):模型過濾得到的候選材料用第一性原理計算驗證,新數(shù)據(jù)反過來提升模型性能,二者之間形成閉環(huán)互補不斷地提升能力,。
也就是說,,GNoME發(fā)現(xiàn)的材料越多,整個模型的能力也就越強,而整個訓練流程全部由AI自動完成,。
發(fā)現(xiàn)方式流程是,,研究團隊首先基于公開材料數(shù)據(jù)庫訓練出初始的結構評價模型,然后利用該模型對數(shù)十億候選結構進行快速過濾,選擇特定數(shù)量送入第一性原理計算。
計算所得精確能量既驗證了模型預測,也為進一步增強模型提供了豐富數(shù)據(jù)。新一輪使用數(shù)據(jù)庫和計算數(shù)據(jù)重新訓練的模型則可實現(xiàn)更高效更準確的材料發(fā)現(xiàn),。
數(shù)據(jù)顯示,隨著每輪訓練數(shù)據(jù)量的積累,模型預測性能持續(xù)改善,材料發(fā)現(xiàn)效率也呈指數(shù)級提高,。6輪迭代后,模型精度達到每個原子11meV,穩(wěn)定結構篩選精確率超過80%,。
超大規(guī)模的訓練數(shù)據(jù)集也是訓練GNoME的關鍵,。GNoME所用的數(shù)據(jù)規(guī)模也刷新了計算材料領域的記錄。
包括公開數(shù)據(jù)庫,、迭代計算以及模型生成,GNoME的訓練數(shù)據(jù)總量超過1億組,涵蓋100多萬種組成,是目前最大的計算材料數(shù)據(jù)集,。
海量數(shù)據(jù)使得深度學習模型可以不斷調優(yōu)提升,尤其是對發(fā)現(xiàn)人類難以預測的新奇材料發(fā)揮了巨大作用。
免責聲明:本文來自網(wǎng)絡收錄或投稿,,觀點僅代表作者本人,,不代表芒果財經(jīng)贊同其觀點或證實其描述,版權歸原作者所有,。轉載請注明出處:http://lequren.com/1081571.html
溫馨提示:投資有風險,,入市須謹慎。本資訊不作為投資理財建議,。