基于DNA序列訓練的大型語言模型(藝術圖),。圖片來源:物理學家組織網(wǎng)科技日報北京8月6日電 (記者張佳欣)DNA包含了維持生命所需的基礎信息,。理解這些信息是如何存儲和組織的,,一直是20世紀最大的科學挑戰(zhàn)之一。現(xiàn)在,,借助GROVER這一基于人類DNA訓練的新型大型語言模型,,研究人員有望解碼基因組中隱藏的復雜信息,。GROVER由德國德累斯頓工業(yè)大學生物技術中心開發(fā),,它將人類DNA視為文本,通過學習其規(guī)則和上下文來提取DNA序列的功能信息。這一新工具有望徹底改變基因組學并加速個性化醫(yī)療的發(fā)展,。相關研究論文發(fā)表在新一期《自然·機器智能》雜志上,。大型語言模型通過文本訓練,發(fā)展出了在多種語境下使用語言的能力,。研究人員設想將生命代碼DNA當作一種語言,,訓練了一個大型語言模型——GROVER。在語言方面,,人們談論的是語法,、句法和語義。而對于DNA來說,,這意味著學習核苷酸的序列等,。就像GPT模型學習人類語言一樣,GROVER基本上學會了DNA“語言”,。研究表明,GROVER不僅能準確地預測接下來的DNA序列,,還可用來提取具有生物學意義的上下文信息,,例如識別DNA上的基因啟動子或蛋白質(zhì)結(jié)合位點。此外,,GROVER還學習了“表觀遺傳”過程,,即在DNA序列不發(fā)生改變的情況下,基因表達的可遺傳變化,。GROVER有望解鎖DNA中蘊含著關于人類本質(zhì),、疾病易感性以及對治療反應的關鍵信息。研究人員相信,,通過語言模型理解DNA的規(guī)則,,將有助于揭示隱藏在DNA中的生物意義,從而推動基因組學和個性化醫(yī)學發(fā)展,。(來源:科技日報)
免責聲明:本文來自網(wǎng)絡收錄或投稿,,觀點僅代表作者本人,不代表芒果財經(jīng)贊同其觀點或證實其描述,,版權歸原作者所有,。轉(zhuǎn)載請注明出處:http://lequren.com/1116224.html
溫馨提示:投資有風險,入市須謹慎,。本資訊不作為投資理財建議,。