《Science》華盛頓大學 ProteinMPNN 設計全新蛋白優於AlphaFold 速度比傳統快200倍!

日期2022-09-16
(圖片來源:網路)
今年7月,Alphabet旗下AI公司DeepMind宣布蛋白質結構預測模型AlphaFold成功預測所有已知的蛋白質結構,令全球科學家驚喜。美國時間15日,華盛頓大學貝克實驗室,在《Science》期刊上發表一款機器學習新工具 ProteinMPNN,其可幫助研究人員發現並設計全新蛋白,有助未來疫苗、癌症治療或創新材料的開發。
 
蛋白質是由數十萬個氨基酸,透過長鏈連接方式,摺疊成三維形狀,雖然AlphaFold改變了蛋白結構的預測方式,但在傳統上,多數實驗室仍是使用物理方法,如 Rosetta來設計自然界中已知的蛋白。
 
華盛頓大學貝克實驗室,是長年開發 Rosetta這款可用於蛋白質結構預測、蛋白質對接和設計的工具的維護者。此次實驗室,開發了新的深度學習工具ProteinMPNN,可對大量的氨基酸序列進行訓練,並設計摺疊成全新的三維結構。
 
但在設計新的蛋白質前,研究人員必須先了解,哪種蛋白質骨架具有功能性,因此研究團隊先前還建構兩種深度學習方法,解決此問題。相關研究也已發表在《Science》期刊上。
 
第一種是被形容為「受限的幻覺」(constrained hallucination) 深度學習法,其是讓用戶在蛋白質序列茫茫大海中,偏好搜索出具所需的功能位點之穩定結構序列。
 
第二種深度學習法,則被形容為「繪畫中」(in painting),此工作方式就如文字處理器,可為研究人員自動創造出過去未曾出現的全新蛋白質。
 
在建構這些深度學習上的ProteinMPNN,經實驗結果也驗證ProteinMPNN的序列恢復率(sequence recovery)為52.4%,較Rosetta序列恢復率32.9%高,證明ProteinMPNN的實用性與精準度。
 
愛丁堡大學生化和生技教授Lynne Regan說,使用機器學習設計蛋白質,使整個過程變得更快、更容易,並使研究人員能在更大的範圍內,創造全新的蛋白質結構。
 
「這套系統不僅比過去最佳的工具還快上200倍,自動化的功能也降低蛋白質設計的進入門檻,使用機器學習技術設計蛋白質,是當今非常重要的工具」他說。
 
資料來源:https://www.technologyreview.com/2022/09/15/1059550/an-ai-that-can-design-new-proteins-could-help-unlock-new-cures-and-materials/

(編譯/彭梓涵)