91经典在线,在线观看免费国产精品,神马久久一区二区,欧美综合视频在线观看,а天堂8中文最新版在线官网,欧美美女啪啪,永久免费看成人av的动态图

DeepMind再放大招,AI新工具可解析人類基因組中的“暗物質(zhì)”

  澎湃新聞   2025-06-28 14:47:10

據(jù)《自然》報(bào)道,谷歌DeepMind新開發(fā)的人工智能(AI)模型AlphaGenome可以幫助科學(xué)家解析基因組序列中的“暗物質(zhì)”——非編碼區(qū),了解它們?nèi)绾斡绊懠?xì)胞內(nèi)部運(yùn)作并導(dǎo)致癌癥等疾病的發(fā)生。目前,從事非商業(yè)工作的研究人員可以使用編程接口通過DeepMind的服務(wù)器訪問該模型。這個(gè)AI模型在 6 月 25 日的預(yù)印本中進(jìn)行了描述。

研究人員將大量基因組數(shù)據(jù)輸入機(jī)器學(xué)習(xí)系統(tǒng),訓(xùn)練它們預(yù)測非編碼序列的作用。圖片來源:JuSun/iStock via Getty

2001年,《自然》發(fā)表由美、英、日、德、法、中六國科學(xué)家共同完成的人類基因組序列草圖。然而直到現(xiàn)在,約31億個(gè)堿基對(duì)中的許多仍然是待解之謎。

在長長的人類基因組序列中,98%是不直接參與蛋白質(zhì)編碼合成的基因,即非編碼區(qū),但它們可以影響蛋白質(zhì)活性,并包含了大量與疾病相關(guān)的變異位點(diǎn)。這一部分尤其讓科學(xué)家感到頭疼。

弄清楚DNA序列的作用很難,因?yàn)闆]有現(xiàn)成的答案,就像AlphaFold預(yù)測蛋白質(zhì)3D結(jié)構(gòu)一樣。從吸引一組細(xì)胞機(jī)器附著在染色體的特定部分并將附近的基因轉(zhuǎn)錄為RNA分子,到吸引影響基因表達(dá)發(fā)生地點(diǎn)、時(shí)間和程度的轉(zhuǎn)錄因子,單個(gè)DNA片段具有許多相互關(guān)聯(lián)的作用。例如,許多DNA序列通過改變?nèi)旧w的3D形狀來影響基因活性,從而限制或簡化轉(zhuǎn)錄機(jī)器的訪問。

幾十年來,科學(xué)家開發(fā)了數(shù)十種AI模型來理解基因組。其中許多都集中在單個(gè)任務(wù)上,例如預(yù)測基因表達(dá)水平或確定外顯子是如何被剪切并拼接到不同蛋白質(zhì)中的。而AlphaGenome正是一個(gè)“一體化”解釋DNA序列的工具。

AlphaGenome可以處理多達(dá)100萬個(gè)DNA堿基,這可能包括一個(gè)基因和無數(shù)個(gè)調(diào)節(jié)元件,并能針對(duì)多種生物特性進(jìn)行數(shù)千次預(yù)測。而且,AlphaGenome在預(yù)測過程中對(duì)單個(gè)DNA堿基的變化十分敏感,這意味著科學(xué)家可以預(yù)測突變的影響。

DeepMind研究人員利用AlphaGenome分析了先前研究中發(fā)現(xiàn)的一種白血病患者的不同突變。該模型準(zhǔn)確預(yù)測了非編碼區(qū)突變間接激活了附近的一個(gè)基因,后者是這種癌癥常見的驅(qū)動(dòng)因素。

不過,研究人員表示,AlphaGenome僅基于人類和小鼠的基因組,以及其他相關(guān)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行訓(xùn)練,還沒有測試它在其他生物中的有效性。此外,AlphaGenome預(yù)測的準(zhǔn)確性還有提升的空間。例如,該模型難以識(shí)別位于10萬多個(gè)堿基對(duì)以外的目標(biāo)基因序列。

美國冷泉港實(shí)驗(yàn)室的計(jì)算生物學(xué)家Peter Koo說,AlphaGenome和類似的模型尚未捕捉到不斷變化的細(xì)胞性質(zhì)如何影響DNA序列的功能。因?yàn)檫@些模型只能在一個(gè)固定環(huán)境中進(jìn)行預(yù)測,而細(xì)胞是動(dòng)態(tài)的:蛋白質(zhì)水平、DNA上的化學(xué)標(biāo)簽和其他條件會(huì)隨著時(shí)間或細(xì)胞類型的不同而變化,這可能會(huì)改變同一序列的行為方式。

責(zé)編:周順

一審:周順

二審:劉文韜

三審:楊又華

來源:澎湃新聞

我要問