近(4)日,《Nature》新聞指出,科學家在開發對抗新冠(COVID-19)、伊波拉(Ebola)等病毒的抗體藥物時,一種類似於ChatGPT背後技術——屬於生成式人工智慧(generative AI)的「蛋白質語言模型」,能提供建議序列,使抗體的效能更強,有助減輕科學家開發抗體時的繁重工作。原研究刊登於《Nature Biotechnology》。
治療乳癌、類風濕性關節炎等疾病的抗體藥物,每年全球銷售額就超過1000億美元。抗體是生技醫藥界的寵兒,部分原因在於其能被改造(工程化),從而與幾乎任何一種蛋白質結合、發揮功能。
不過,本篇研究作者、史丹佛大學計算生物學家Brian Hie指出,要創造具有有用特性的抗體,並進一步改善它,需要非常大量的篩選工作。
近半年爆紅的ChatGPT屬於生成式AI,其是一種能夠根據學習模式創建文本、圖像和其他內容的神經網絡。
史丹福大學研究人員希望利用生成式AI,加速抗體藥物的開發速度,並解開抗體藥物傳統設計方法所遇到的難題。
這種稱為蛋白質語言模型的神經網絡,不是像ChatGPT一樣輸入大量文字資料,而是透過數千萬個蛋白質序列進行訓練。先前已有其他研究團隊利用此類蛋白質語言模型,來設計全新的蛋白質。
Hie團隊使用的蛋白質語言模型,則是由臉書(facebook)母公司Meta的AI研究人員所開發的。他們使用此模型為抗體提供少量的突變建議。
該模型學習了近1億個蛋白質序列,其中只有數千個是抗體序列。儘管如此,這個模型提出的建議,有相當高的比例,確實提高了SARS-CoV-2、伊波拉病毒和流感病毒的抗體,與其標靶結合的能力;這代表抗體提高了辨識病毒,和阻斷這些病毒感染細胞的能力。
這樣的結果令科學家感到驚喜。不過,Hie說,目前COVID-19抗體對Omicron及其亞型無效,即使以AI引導改變,也不太可能恢復有效性。
通常為了提高抗體效能,科學家會集中精力改進抗體與標靶直接接觸的蛋白質區域。然而,本篇研究另一位作者、史丹福大學生物化學家Peter Kim表示,該AI模型建議抗體改變的位置,有許多是位於抗體與標靶相互作用的區域之外。
Kim說:「此模型提供的資訊,甚至是連抗體工程專家都完全或大部分沒有想到的。對我來說,這是一個『天啊,這到底是怎麼回事?』的時刻。」
參考資料:https://www.nature.com/articles/d41586-023-01516-w
研究論文:https://pubmed.ncbi.nlm.nih.gov/37095349/
(編譯/劉馨香)