人工智能預測蛋白質結構數量將超億 阿爾法折疊革命何去何從?

2022-04-21 10:35:26   來源:科技日報

十多年來,德國馬克斯普朗克生物物理研究所分子生物學家馬丁·貝克及其同事一直試圖拼湊出世界上最難的拼圖游戲之一:人類細胞中最大分子機器的詳細模型。這個龐然大物被稱為核孔復合體,控制著分子進出細胞核的流動,而細胞核正是基因組所在之處。每個細胞中都存在數百個這樣的復合物,每個都由超過1000種蛋白組成,它們形成一個環,鑲嵌在核膜上。

這1000塊拼圖由30多種蛋白質構建塊組成,它們以多種方式交織在一起。讓拼圖更難的是,實驗確定的這些構建塊的三維結構是來自許多物種的結構大雜燴,并不能總是很好地融合在一起。而且,拼圖的終極目標,即核孔復合體的低分辨率三維視圖缺乏足夠的細節,人們無法知道需要有多少塊能精確地拼在一起。

2016年,貝克團隊報告了一個模型,它覆蓋了核孔復合體約30%以及30個構建塊的約一半,稱為Nup蛋白。2021年7月,深度思維公司公開了一款名為阿爾法折疊2的人工智能(AI)工具。該軟件可從蛋白質的基因序列中預測其三維結構,并且大部分情況下是精確的。這改變了貝克的任務,以及成千上萬其他生物學家的研究。

在某些情況下,AI為科學家們節省了時間;在其他情況下,它使以前難以想象或極不現實的研究成為可能。盡管它有局限,但它的發展已經不可阻擋。

“一鳴驚人”的成功

2020年12月,阿爾法折疊引起了轟動。當時,它在一場名為“蛋白質結構預測關鍵評估”的比賽中大放異彩。而阿爾法折疊2的預測均而言已與大多數實驗數據不相上下。

在阿爾法折疊算法廣泛開源之前,美國華盛頓大學醫學院蛋白質設計研究所研究人員開發了AI工具RoseTTAFold,其擁有可媲美阿爾法折疊2的蛋白質結構預測超高準確度,而且速度更快、所需計算機處理能力更低。

2021年7月15日,深度思維宣布,它已經使用阿爾法折疊預測了幾乎每一種人類制造的蛋白質的結構,以及其他20種被廣泛研究的生物的整個蛋白質組(比如小鼠和大腸桿菌),共計超過36.5萬個結構。深度思維還將這些數據公開發布到歐洲生物信息學研究所維護的數據庫中,這個數據庫已擴展到100萬個結構。

今年,深度思維計劃發布總計超過1億個結構預測。這幾乎占所有已知蛋白質的一半,是蛋白質數據庫(PDB)結構庫中實驗確定的蛋白質數量的數百倍。阿爾法折疊還部署了深度學神經網絡,目前已經接受了PDB和其他數據庫中的數十萬個實驗確定的蛋白質結構和序列的訓練。

從結構角度解答新科學問題

阿爾法折疊解決結構的能力給生物學家們留下了深刻的印象。“只要一種蛋白質卷曲成單一的明確的三維結構,阿爾法折疊的預測就很難被推翻。”瑞典斯德哥爾摩大學蛋白質生物信息學家阿恩·埃洛夫松說,“這是一種一鍵式解決方案,你可能會得到最佳模型。”

英國倫敦大學學院計算生物學家克里斯汀·奧倫戈團隊正在利用其確定新的蛋白質種類,并發現了數百、甚至數千個潛在的新蛋白質家族,擴大了科學家對蛋白質外觀和功能的了解。在另一項工作中,該團隊正在搜索從海洋和廢水中收集的DNA序列數據庫,試圖識別新的分解塑料的酶。

美國哈佛大學進化生物學家謝爾蓋·奧夫欽尼科夫表示,將任何蛋白質編碼的基因序列轉化為可靠結構的能力都非常可貴。研究人員通過比較基因序列,以確定生物及其基因在不同物種之間的關系。但對于遠親基因,僅通過比較,可能找不到進化上的親,因為序列發生了太大的變化。而通過比較蛋白質結構,其變化速度往往不如基因序列那么快,研究人員或能揭示被忽視的古老關系。這為研究蛋白質的進化和生命起源提供了一個絕佳的機會。

存在一定局限

目前已有嘗試證明,阿爾法折疊不具備預測蛋白質新突變后果的能力,因為沒有與進化相關的序列來檢驗。

研究人員表示,許多蛋白質具有多種構象,并與DNA和RNA等配體、脂肪分子和鐵等礦物質一起發揮作用,但阿爾法折疊的預測是針對孤立結構,它不能真正處理那些可在不同構象中采用不同結構的蛋白質。

美國哥倫比亞大學的計算生物學家穆罕默德·庫雷希說,開發下一代神經網絡將是一個巨大的挑戰。目前還無法獲得大量的數據來捕捉蛋白質動力學,或者蛋白質可能與之相互作用的數萬億個較小分子的形狀。

歐洲生物信息學研究所計算生物學家珍妮特·桑頓認為,阿爾法折疊最大的影響之一可能只是說服生物學家對計算和理論方法的見解持更開放的態度。“對我來說,這場革命就是觀念的改變”。

但阿爾法折疊革命激發了歐洲分子生物學實驗室結構建模師揚·科辛斯基的遠大夢想。他設想,受阿爾法折疊啟發的工具不僅可用來對單個蛋白質和復合體進行建模,還可用來對整個細胞器甚至細胞進行建模,直到完整單個蛋白質分子,“這是我們在接下來的幾十年里要追尋的夢想”。(科技日報實記者 張佳欣)

標簽: 人工智能 預測蛋白質 結構數量 阿爾法折疊革命

相關閱讀

人工智能預測蛋白質結構數量將超億 阿爾法

科技

十多年來,德國馬克斯普朗克生物物理研究所分子生物學家馬丁·貝克及其同事一直試圖拼湊出世界上最難的拼圖游戲之一:人類細胞中最大分子機

2022-04-21

新冠嗅覺喪失癥非病毒本身所致 可能是發生

科技

雖然新冠介導的嗅覺喪失的破壞性影響眾所周知,但其背后的生物學機制仍然是一個謎。18日發表在《美國醫學會神經病學雜志》上的一項研究表明

2022-04-21

行星科學研究指出:木衛二上存在淺層液態水

科技

英國《自然·通訊》雜志19日發表的一項行星科學研究指出,基于來自格陵蘭冰蓋的數據,木星衛星木衛二上可能存在很淺的液態水。研究結果或為

2022-04-21

頂夸克迄今最精確質量測得 新測量出來的質

科技

據歐洲核子研究中心官網19日報道,大型強子對撞機(LHC)的緊湊渺子線圈(CMS)合作組對頂夸克的質量進行了迄今最精確的測量,新測量出來的質量

2022-04-21

無需逐層構建的3D打印技術面世 同時節省時

科技

盡管3D打印技術在過去十年中取得了長足的進步,但該技術仍然面臨一個基本限制:物體必須逐層構建。美國研究人員開發了一種在固定體積的樹脂

2022-04-21

人工智能預測蛋白質結構數量將超億 阿爾法折疊革命何去何從?

科技

十多年來,德國馬克斯普朗克生物物理研究所分子生物學家馬丁·貝克及其同事一直試圖拼湊出世界上最難的拼圖游戲之一:人類細胞中最大分子機

2022-04-21

新冠嗅覺喪失癥非病毒本身所致 可能是發生炎癥的附帶后果

科技

雖然新冠介導的嗅覺喪失的破壞性影響眾所周知,但其背后的生物學機制仍然是一個謎。18日發表在《美國醫學會神經病學雜志》上的一項研究表明

2022-04-21

行星科學研究指出:木衛二上存在淺層液態水

科技

英國《自然·通訊》雜志19日發表的一項行星科學研究指出,基于來自格陵蘭冰蓋的數據,木星衛星木衛二上可能存在很淺的液態水。研究結果或為

2022-04-21

頂夸克迄今最精確質量測得 新測量出來的質量值誤差不超過0.22%

科技

據歐洲核子研究中心官網19日報道,大型強子對撞機(LHC)的緊湊渺子線圈(CMS)合作組對頂夸克的質量進行了迄今最精確的測量,新測量出來的質量

2022-04-21

無需逐層構建的3D打印技術面世 同時節省時間和材料

科技

盡管3D打印技術在過去十年中取得了長足的進步,但該技術仍然面臨一個基本限制:物體必須逐層構建。美國研究人員開發了一種在固定體積的樹脂

2022-04-21

名為微新星的新型恒星爆炸首現 強度約為新星爆發的百萬分之一

科技

近日,一個國際天文學家團隊使用歐洲南方天文臺(ESO)的甚大望遠鏡首次觀測并確認一種新型的恒星爆炸,其強度約為新星爆發的百萬分之一,暫

2022-04-21

首個可協同工作分子機器人開發完成 運輸效率是單個機器人的5倍

科技

日本北海道大學理學院科學家成功開發出世界上第一個利用集群策略工作的微型機器人,首次證明分子機器人能夠通過采用集群策略完成貨物遞送,

2022-04-21

新研究發現定量CT可助力老年髖部骨折風險評估

科技

近日,由北京積水潭醫院牽頭的多國學者合作的研究工作肌肉密度是髖部再次骨折的獨立風險因素:一項隨訪隊列研究在線發表于老年醫學領域權威

2022-04-20

我國科學家發現一類全新的頭方向細胞 為干預老年癡呆癥找到新靶點

科技

頭方向細胞被認為是大腦內部的指南針,但人們對頭方向細胞的編碼機制知之甚少。4月19日,記者從陸軍軍醫大學新橋醫院獲悉,該院神經外科張

2022-04-20

研究證實:16種哺乳動物基因組分析證實 突變頻率越高物種壽命越短

科技

這是一個困擾科學家多年的謎團——為什么不同的動物有如此不同的壽命?人類可以活到80歲左右,而長頸鹿往往在24歲時死亡,裸鼴鼠的成年個體

2022-04-20

遇見旗袍是于萬千人群中的驚鴻一瞥 沿途灑滿了愛的芬芳

旗袍,中國和世界華人女性的傳統服裝,被譽為中國國粹和女性國服。雖然其定義和產生的時間至今還存有諸多爭議,但它仍然是中國悠久服飾文化

北京市電影院有序恢復開放 周五預售部分場次已滿座

7月21日,北京市政府發布《北京市電影局關于在疫情防控常態化條件下有序推進電影院恢復開放的通知》,宣布全市低風險地區影院,可于7月24日

近期持續強降雨影響 第46屆武漢渡江節因長江水位過高取消

?武漢7·16渡江節組委會14日發布公告,由于長江武漢關水位超警戒水位,按照規定取消2020年第46屆武漢7·16渡江節。受近期持續強降雨影響,

“非遺”普及受眾最看重“動手”參觀大師工作室非常享受

過去一段時間,國家級非遺項目灰塑傳承人邵成村,多次在陳家祠等工作現場,向身邊那些帶著好奇目光的人們講解灰塑的種種技術細節:草根灰、

璧山冷酒夜市 豐富市民夜間文旅活動

7月13日,位于璧山區南門唐城夜市街區的璧山冷酒夜市開街。這是璧山區打造夜間經濟消費載體、培育夜間經濟活動品牌的舉措之一。璧山市民一

重啟上市公司資本運作 康佳集團去年半導體業務營業收入為3.22億元

近日,康佳集團正式對外發布2021年年度業績報告。2021年,康佳集團實現全年營收491 07億元,歸屬于母公司的凈利潤為9 05億元,同比增長89 5

偉祿集團連續6年增長 去年營收同比增長37.5%

深港通標的之一的深圳企業偉祿集團近日公布2021年業績。財報數據顯示,偉祿集團全年營業收入11 95億港元,同比增長37 5%,連續6年穩步增長;

龍頭企業去年凈利倍增 整個行業營收規模有望創造歷史新高位

近日,面板龍頭TCL科技、京東方分別發布2021年度業績快報,兩家企業去年歸屬于上市公司股東的凈利潤分別增長129 3%、412 86%,實現超過百億

深圳國企全力為市民 守好“菜籃子”“米袋子”保障量足價穩

疫情防控形勢下,民生物資供應是否充足成為市民最為關注的問題之一。連日來,深農集團、深糧控股等企業,充分發揮國企擔當,全力為深圳市民

去年我國中小企業實現恢復性增長 政策持續加碼助力中小企業平穩發展

中小企業是穩定工業經濟的重要力量,黨中央把促進中小企業發展作為長期戰略。2021年我國中小企業實現了恢復性增長,規上中小企業收入利潤同

工銀瑞信累計創造投資回報4707億元 夯實投研能力建設

公募基金行業的本質是受人之托,代人理財,首要社會責任就是為廣大投資者提供優質的資產管理服務。作為國內首家銀行系基金公司,工銀瑞信始