新華社舊金山2月19日電(記者吳曉凌)美國(guó)弧形研究所19日在官網(wǎng)發(fā)布公報(bào)說(shuō),來(lái)自該研究所、美國(guó)芯片制造商英偉達(dá)公司和美國(guó)斯坦福大學(xué)等機(jī)構(gòu)的研究人員共同開發(fā)的人工智能(AI)生物學(xué)模型Evo 2當(dāng)天正式發(fā)布。
公報(bào)說(shuō),在前一代模型Evo 1的基礎(chǔ)上,Evo 2發(fā)展成為目前生物學(xué)領(lǐng)域規(guī)模最大的AI模型。該模型基于超過(guò)12.8萬(wàn)個(gè)基因組數(shù)據(jù)的9.3萬(wàn)億個(gè)核苷酸進(jìn)行訓(xùn)練。
開發(fā)者表示,Evo 1和Evo 2模型的開發(fā)代表了新興的生成式生物學(xué)領(lǐng)域的關(guān)鍵時(shí)刻,因?yàn)檫@些模型使機(jī)器能夠“用核苷酸語(yǔ)言來(lái)讀、寫和思考”。
據(jù)介紹,Evo 2可用于多種任務(wù),它能夠識(shí)別影響蛋白質(zhì)功能和生物體適應(yīng)性的基因變化。例如,在針對(duì)與乳腺癌相關(guān)的BRCA1基因變體進(jìn)行的測(cè)試中,Evo 2在預(yù)測(cè)哪些突變是良性突變、哪些是潛在致病突變方面達(dá)到了90%以上的準(zhǔn)確率。這將有助于節(jié)省大量用于細(xì)胞或動(dòng)物實(shí)驗(yàn)的時(shí)間和研究資金,通過(guò)找到人類疾病的遺傳原因來(lái)加速新藥研發(fā)。此外,Evo 2還可用于設(shè)計(jì)新的生物工具或治療方法。
公報(bào)還強(qiáng)調(diào)說(shuō),考慮到潛在的倫理和安全風(fēng)險(xiǎn),研究人員在Evo 2的基礎(chǔ)數(shù)據(jù)集中排除了感染人類和其他復(fù)雜生物的病原體,并確保該模型不會(huì)對(duì)這些病原體的相關(guān)查詢返回有效答案。
目前,Evo 2已開放給全球科研人員,他們可通過(guò)網(wǎng)頁(yè)使用該模型,或可免費(fèi)下載該模型的源代碼、訓(xùn)練數(shù)據(jù)及參數(shù)。相關(guān)研究的預(yù)印本論文于19日發(fā)表在“生物學(xué)預(yù)印本文獻(xiàn)庫(kù)”上。