預測蛋白質(zhì)結構只是開(kāi)始 AI或為生命科學(xué)領(lǐng)域帶來(lái)巨變

時(shí)間:2021-12-13 10:43來(lái)源:大西北網(wǎng)—新華網(wǎng) 作者:崔 爽 點(diǎn)擊: 載入中...
    預測蛋白質(zhì)結構只是開(kāi)始 AI或為生命科學(xué)領(lǐng)域帶來(lái)巨變
 
 
      過(guò)去半個(gè)多世紀,人類(lèi)一共解析了5萬(wàn)多個(gè)人源蛋白質(zhì)的結構,人類(lèi)蛋白質(zhì)組里大約17%的氨基酸已有結構信息,而AlphaFold2預測的結構將這一數字從17%提高到58%.它帶來(lái)的在生命科學(xué)各分支領(lǐng)域的革命,將在今后幾年到十幾年中逐漸顯現出來(lái)。
 
 
      蛋白質(zhì)結構預測是生物學(xué)的重要“圣杯”,也是人工智能落子生命科學(xué)領(lǐng)域最炙手可熱的研究之一。
 
 
      近日,我國自研深度學(xué)習蛋白質(zhì)折疊預測平臺TRFold傳來(lái)好消息,其基于2020年第14屆國際蛋白質(zhì)結構預測競賽(CASP14)蛋白質(zhì)測試集的成績(jì)僅次于“阿爾法折疊的迭代版”(AlphaFold2),排名全球第二,這是國內目前所有公開(kāi)蛋白質(zhì)結構預測模型中的最好成績(jì),我國計算生物學(xué)領(lǐng)域的表現躋身全球第一梯隊。
 
 
      從2018年AlphaFold第一次代表人工智能“參戰”,到AlphaFold2用機器學(xué)習方法取得媲美結構生物學(xué)實(shí)驗的精測精度,計算生物學(xué)給蛋白質(zhì)預測這一世紀難題帶來(lái)了顛覆性的解法。人工智能會(huì )給生命科學(xué)領(lǐng)域帶來(lái)怎樣的巨變?蛋白質(zhì)結構預測這個(gè)生物學(xué)里懸而未決的終極難題之一,會(huì )被人工智能徹底解決嗎?
 
 
      深度學(xué)習可在計算生物學(xué)領(lǐng)域廣泛應用
 
 
      蛋白質(zhì)結構預測是生命科學(xué)領(lǐng)域一個(gè)由來(lái)已久、令人著(zhù)迷的問(wèn)題,同時(shí)又以難度大、成本高、進(jìn)展有限著(zhù)稱(chēng)。但這個(gè)人們本以為需要一個(gè)世紀慢慢探索的問(wèn)題近年來(lái)卻取得了重大突破:2020年CASP14競賽中,谷歌公司旗下的DeepMind公司研發(fā)的AlphaFold2取得了總分(GDT)92.4/100的成績(jì),也就是說(shuō),計算生物學(xué)幾乎獲得了與實(shí)驗室方法精確度相當的蛋白質(zhì)結構預測結果。
 
 
      這個(gè)里程碑事件令結構生物學(xué)家們感慨,自己用價(jià)值1000萬(wàn)美元的電鏡努力了好幾年得出的結果,Alphafold2竟然一下就算出來(lái)了。“依我之見(jiàn),這是人工智能對科學(xué)領(lǐng)域最大的一次貢獻,也是人類(lèi)在21世紀取得的最重要的科學(xué)突破之一。”生物物理學(xué)家、西湖大學(xué)校長(cháng)施一公不吝贊美。
 
 
      為什么要預測蛋白質(zhì)結構?
 
 
      天壤蛋白質(zhì)折疊項目負責人苗洪江對科技日報記者解釋?zhuān)?ldquo;研究蛋白質(zhì)結構,有助于了解蛋白質(zhì)的作用,理解蛋白質(zhì)如何行使其生物功能,認識蛋白質(zhì)與非蛋白質(zhì)之間的相互作用,對于生物學(xué)、醫學(xué)和藥學(xué)等都非常重要”.
 
 
      傳統觀(guān)測蛋白質(zhì)結構的方法主要有3種,即核磁共振、X射線(xiàn)、冷凍電鏡,但這些方法往往依賴(lài)大量試錯和昂貴的設備,每種結構的研究都要花費數年時(shí)間。而人工智能應用于蛋白質(zhì)結構預測的最新成果,即AlphaFold2,能在幾天甚至幾分鐘預測出以前要花費數十年才能得到的具有高置信度的蛋白質(zhì)結構。
 
 
      “剛開(kāi)始大家還在開(kāi)玩笑,說(shuō)Deepmind是不是通過(guò)什么方法盜取了真實(shí)實(shí)驗結果,直到大家看到文章和開(kāi)源代碼才敢相信這件事情真的發(fā)生了。”苗洪江笑言,這側面證明AlphaFold2預測結果之震撼,“這開(kāi)啟了人工智能在計算生物學(xué)廣泛應用的大門(mén),讓整個(gè)領(lǐng)域的人看到了深度學(xué)習在這個(gè)領(lǐng)域可以廣泛應用,這實(shí)打實(shí)的雙盲實(shí)驗結果就是證明。”
 
 
      AI預測結果和實(shí)驗室水平相當
 
 
      1994年,美國科學(xué)家約翰·莫爾特(JohnMoult)發(fā)起國際蛋白質(zhì)結構預測競賽,每?jì)赡昱e辦一屆,競賽的舉辦正是為了吸引計算機科學(xué)、生物物理學(xué)等不同領(lǐng)域的專(zhuān)家參與到蛋白質(zhì)三維結構預測這一極具挑戰性的生物信息學(xué)問(wèn)題中來(lái)。2018年,人工智能正式參與蛋白質(zhì)三維結構的預測,AlphaFold首次大顯身手,在98名參賽隊伍中排名第一。兩年后,AlphaFold2帶來(lái)真正的突破,它用機器學(xué)習方法對幾乎所有的蛋白質(zhì)都預測出了正確的結構,其中有大約2/3的蛋白質(zhì)預測精度達到了結構生物學(xué)實(shí)驗的測量精度。
 
 
      事實(shí)上,過(guò)去半個(gè)多世紀,人類(lèi)一共解析了5萬(wàn)多個(gè)人源蛋白質(zhì)的結構,人類(lèi)蛋白質(zhì)組里大約17%的氨基酸已有結構信息,而AlphaFold2預測的結構將這一數字從17%提高到58%,因為無(wú)固定結構的氨基酸比例很大,58%的結構預測已經(jīng)接近極限了。它帶來(lái)的在生命科學(xué)各分支領(lǐng)域的革命,將在今后幾年到十幾年中逐漸顯現出來(lái)。
 
 
      施一公在接受媒體采訪(fǎng)時(shí)曾談到,人類(lèi)蛋白質(zhì)組里能夠被預測的以單個(gè)蛋白為單位的空間三維結構,已經(jīng)基本都被AlphaFold2預測了??傮w而言,預測結果可信、也比較準確。對結構生物學(xué)來(lái)說(shuō),這是一個(gè)顛覆性突破。此前人類(lèi)尚未被解析的一些結構,現在基本上都已經(jīng)被預測。
 
 
      對生物化學(xué)、細胞生物學(xué)、遺傳發(fā)育、神經(jīng)生物學(xué)、微生物學(xué)、病理藥理等一大批生命學(xué)科和研究領(lǐng)域來(lái)說(shuō),這會(huì )大大改進(jìn)人們對于生命過(guò)程的理解。比如,遺傳學(xué)家也許積累了大量數據,但如果不知道蛋白質(zhì)結構,就沒(méi)法研究某個(gè)突變對于蛋白功能的影響?,F在不同了,通過(guò)AlphaFold2的結構預測就能查看人類(lèi)遺傳病中的每一個(gè)突變在相關(guān)蛋白結構里的具體位置,進(jìn)而有可能推測出蛋白功能如何受到影響。
 
 
      再比如,DeepMind預測出來(lái)的蛋白結構,包括了眾多G蛋白偶聯(lián)受體和關(guān)鍵酶在內的一大批結構未知的藥物靶點(diǎn)蛋白,而且預測的結構足夠準確。這對于制藥界來(lái)說(shuō)太重要了,等于提供了可靠的藥物設計和藥物優(yōu)化的重要基礎。
 
 
      單個(gè)蛋白質(zhì)結構預測只是起點(diǎn)
 
 
      今年7月,DeepMind公開(kāi)了AlphaFold2的源代碼,并在《自然》上發(fā)表論文闡述了AlphaFold2的技術(shù)細節。
 
 
      “這次開(kāi)源在生物學(xué)界掀起了巨大的波瀾,意味著(zhù)生物學(xué)家終于擺脫了先進(jìn)設備的掣肘--此前這些昂貴的先進(jìn)設備只有經(jīng)費充足的大學(xué)或研究機構才有條件配置,而此后,小型團隊或者個(gè)人研究者也有了參與蛋白質(zhì)研究的可能。”天壤創(chuàng )始人、上海交通大學(xué)計算機系原副教授薛貴榮說(shuō)。
 
 
      苗洪江認為,目前的單個(gè)蛋白質(zhì)結構預測只是一個(gè)起點(diǎn),更加精準的側鏈優(yōu)化、蛋白質(zhì)的動(dòng)態(tài)分析、蛋白質(zhì)與其配體(如小分子、DNA、RNA、多肽、蛋白質(zhì)等)的相互作用等一系列的問(wèn)題還沒(méi)有解決,接下來(lái)的工作重點(diǎn)將是利用目前的全蛋白質(zhì)組協(xié)同進(jìn)化分析,建立起蛋白質(zhì)與蛋白質(zhì)之間相互作用的精準鏈路。
 
 
      有了算法模型只是開(kāi)始,向前走依然困難很多,薛貴榮坦言:“算力是很大的制約因素,比如AlphaFold2做了大量的數據蒸餾工作,他們的算法模型是基于30%的真實(shí)數據和70%的蒸餾數據一起訓練的,背后是巨大的算力支持。”
 
 
      充足的算力可以讓蛋白質(zhì)結構預測從單一結構向相互作用、從兩兩研究向規?;?、從微觀(guān)結構向宏觀(guān)系統前進(jìn),“生物界有很多蛋白結構,比如基因測序大概已經(jīng)測了幾十億條序列。但我們只知道序列,不知道結構,這就是很大的信息缺失問(wèn)題。”薛貴榮說(shuō),“蛋白質(zhì)通常以復合物的形式成對或成組地承擔生命所需的種種功能。然而許多蛋白質(zhì)復合物的結構仍然是謎,蛋白質(zhì)之間的相互作用也尚未被識別。我們需要有充足的算力去支撐整個(gè)體系,進(jìn)行蛋白質(zhì)結構預測、蛋白質(zhì)設計,研究蛋白質(zhì)相互作用,藥物研發(fā)等漫長(cháng)而富有挑戰的工作,尋找精準的疾病治療新方法。”
 
 
      同時(shí),在數據來(lái)源和應用方面,也需要藥廠(chǎng)、醫院等進(jìn)行協(xié)同和聯(lián)動(dòng)。“未來(lái)更多的醫藥企業(yè)、機構,以及人工智能公司,要一起把這個(gè)行業(yè)做大,現在只是個(gè)開(kāi)始。”薛貴榮說(shuō)。(記者 崔 爽)
(責任編輯:陳冬梅)
>相關(guān)新聞
頂一下
(0)
0%
踩一下
(0)
0%
------分隔線(xiàn)----------------------------
推薦內容
?
網(wǎng)站簡(jiǎn)介??|? 保護隱私權??|? 免責條款??|? 廣告服務(wù)??|? About Big northwest network??|? 聯(lián)系我們??|? 版權聲明
隴ICP備13000024號-1??Powered by 大西北網(wǎng)絡(luò ) 版權所有??建議使用IE8.0以上版本瀏覽器瀏覽
Copyright???2010-2014?Dxbei Corporation. All Rights Reserved
亚洲成AV人片一区二区小说_26uuu另类亚洲欧美日本_人妻精品动漫H无码专区_亚洲中文字幕超碰无码资源