基于DNA序列訓(xùn)練的大型語言模型(藝術(shù)圖),。圖片來源:物理學(xué)家組織網(wǎng)科技日?qǐng)?bào)北京8月6日電 (記者張佳欣)DNA包含了維持生命所需的基礎(chǔ)信息。理解這些信息是如何存儲(chǔ)和組織的,一直是20世紀(jì)最大的科學(xué)挑戰(zhàn)之一?,F(xiàn)在,,借助GROVER這一基于人類DNA訓(xùn)練的新型大型語言模型,,研究人員有望解碼基因組中隱藏的復(fù)雜信息,。GROVER由德國(guó)德累斯頓工業(yè)大學(xué)生物技術(shù)中心開發(fā),它將人類DNA視為文本,,通過學(xué)習(xí)其規(guī)則和上下文來提取DNA序列的功能信息,。這一新工具有望徹底改變基因組學(xué)并加速個(gè)性化醫(yī)療的發(fā)展。相關(guān)研究論文發(fā)表在新一期《自然·機(jī)器智能》雜志上,。大型語言模型通過文本訓(xùn)練,,發(fā)展出了在多種語境下使用語言的能力。研究人員設(shè)想將生命代碼DNA當(dāng)作一種語言,,訓(xùn)練了一個(gè)大型語言模型——GROVER,。在語言方面,人們談?wù)摰氖钦Z法,、句法和語義,。而對(duì)于DNA來說,這意味著學(xué)習(xí)核苷酸的序列等,。就像GPT模型學(xué)習(xí)人類語言一樣,,GROVER基本上學(xué)會(huì)了DNA“語言”。研究表明,,GROVER不僅能準(zhǔn)確地預(yù)測(cè)接下來的DNA序列,,還可用來提取具有生物學(xué)意義的上下文信息,,例如識(shí)別DNA上的基因啟動(dòng)子或蛋白質(zhì)結(jié)合位點(diǎn)。此外,,GROVER還學(xué)習(xí)了“表觀遺傳”過程,,即在DNA序列不發(fā)生改變的情況下,基因表達(dá)的可遺傳變化,。GROVER有望解鎖DNA中蘊(yùn)含著關(guān)于人類本質(zhì),、疾病易感性以及對(duì)治療反應(yīng)的關(guān)鍵信息。研究人員相信,,通過語言模型理解DNA的規(guī)則,,將有助于揭示隱藏在DNA中的生物意義,從而推動(dòng)基因組學(xué)和個(gè)性化醫(yī)學(xué)發(fā)展,。(來源:科技日?qǐng)?bào))
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,,觀點(diǎn)僅代表作者本人,不代表芒果財(cái)經(jīng)贊同其觀點(diǎn)或證實(shí)其描述,,版權(quán)歸原作者所有。轉(zhuǎn)載請(qǐng)注明出處:http://lequren.com/1116224.html
溫馨提示:投資有風(fēng)險(xiǎn),,入市須謹(jǐn)慎,。本資訊不作為投資理財(cái)建議。