由生物技術開發中心(DCB)、生技醫藥產業發展推動小組(BPIPO)、 NVIDIA、臺灣產業科技推動協會(TITA)於12月19日主辦「生成式 AI於新藥開發與精準醫療技術研討會」,吸引逾千人與會。論壇聚焦四大主題,全球AI新藥開發趨勢、AI新藥探索與靶點分析、AI驅動藥物設計優化、及AI如何重新定義生醫,16位專家除DCB 、NVIDIA外,中研院、國衛院、清華大學及多家AI醫藥領先公司包括:美商圖策、維曙智能、亞大基因、分子智藥、安宏生醫等,分享AI製藥當前最新趨勢。
撰文/彭梓涵、吳培安、黃佳啟
經濟部產業發展署林育諄科長致詞表示,隨著高齡化和少子化的挑戰,數位化與智慧化成為醫療發展的關鍵趨勢。
臺灣2023年生醫產業營業額達7,500億新臺幣,其中新藥授權收入已超過500億新臺幣,顯示生醫產業的強大發展量能,期待未來在政府持續支持下,助力生醫產業大幅成長。
DCB董事長暨TITA理事長涂醒哲指出,臺灣在「AI產業化」已是世界龍頭,但在「產業AI化」,臺灣(第26名)相較於鄰近國家新加坡(第3名)、韓國(第6名)還有待提升,AI產業的轉型對臺灣來說非常重要,期望未來能更廣泛的推動產業AI化,以提高效能並節省成本。
BPIPO主任暨DCB副執行長黃千岳表示, DCB過去與科技公司合作都圍繞三個核心方向展開,包括國際合作,以及對新創企業、人才培育的發展,DCB也積極提供資源和技術支持,以促進公司的成長。
NVIDIA亞太南區技術總監Ettikan Kandasamy Karuppiah指出,AI技術為健康醫藥產業帶來巨大機會,NVIDIA也正在探索關鍵領域,包括三大重要應用:手術數位裝置與影像判讀技術、醫患數位互動平台,以及能夠解析DNA、蛋白質和化學物質交互作用的數位生物學應用。
【議題一】AI新藥開發產業趨勢洞悉
劉韋博» 2024年,AI開發藥物第二波啟動年!
在第一場AI新藥開發產業趨勢洞悉中,DCB產業發展處處長劉韋博表示,AI與大數據被醫藥專業人士評為近年對製藥產業最具顛覆性的新興技術。
在這項趨勢下,全球AI藥物研發公司從300家激增到950家,TechBio與BioTech新型跨域生態圈儼然成形;於此同時,投資者數量倍增,也吸引全球大型製藥公司投資數億、甚至數十億美元爭相合作。
不過,劉韋博表示,AI開發藥物會因為藥物的模態(modality)產生很大的差異,因此需要有產業價值鏈的專業分工。
他指出,雖然已經有多項AI開發藥物進入臨床試驗,但目前仍以臨床一期居多,成功進入二期、取得成功的案例還很少,這正好說明產業界正在修正模型。
「之前可能還在測試或驗證階段,但現在AI開發藥物已經絕對可行!」
他也期許DCB成為生醫新創的跨域鏈結平台,幫助國內AI新藥開發的進程,同時促成AI科技公司與產學研醫的深度交流。
陳映嘉» AI、生物醫學交匯 改變醫療格局
NVIDIA醫療生技解決方案架構師陳映嘉,她在會中剖析生成式AI如何革新藥物開發與推動精準醫療。她指出,AlphaFold等技術的突破,大幅提升蛋白質結構預測的速度,使新藥設計與篩選進程加快,藥物開發進入全新時代。
陳映嘉提到,隨著語言模型的發展成熟,如ChatGPT,生物大型語言模型展現極大潛力。而基因序列由ATCG組成,蛋白質序列僅有20種字母,均可透過語言模型處理。這類模型經過「客服模式」訓練後,可根據研究需求進行精準回應。
她進一步分享,NVIDIA在生物醫學上的應用,包括:Parabricks能快速分析短序列片段定序資料,BioNeMo則用於預測蛋白質與小分子特性、蛋白質生成、姿勢預測(DiffDock)及3D蛋白質結構建模。
在精準醫療方面,陳映嘉強調,AI能分析基因數據,辨識疾病基因變異,預測治療反應,協助制定個人化方案,提升療效並減少副作用。近年,也有生技公司以AI開發新型基因載體,為基因療法於神經退化與癌症治療帶來突破。
【議題二】AI新藥探索與靶點分析
張哲維» AI+大數據 突破10%可成藥靶點
在「AI新藥探索與靶點分析」議題中,DCB智慧生醫小組副組長張哲維表示,根據2020年數據統計,全球僅有700個可成功成藥(Druggable)的靶點,面對藥物高失敗率和有限的可用靶點挑戰,製藥產業迫切需要技術創新。
他表示,2002年有科學家以小分子藥角度,提出人類基因體中只有約10~15%的基因是潛在的成藥靶點,但隨著成藥的角度從小分子到大分子藥、AI和機器學習技術、分子結構與結合位點預測、以及多體學技術、多維度評估能力的進步,過去未被認識的靶點也顯示出成藥可能性。
DCB在2020年成立智慧生醫小組,針對臨床前階段建構模型和平台,近期,DCB也以外泌體(Exosome)和腫瘤新生抗原(neoantigen)作為發展重點,期望透過開發新的治療方法,並利用AI演算法推動整個產業的發展。
黃威仁 » NVIDIA GPU運算力實現個人化醫療 基因體分析時間縮短100倍!
NVIDIA資深開發者關係經理黃威仁,介紹了NVIDIA的GPU運算晶片及演算法如何大幅加速基因體分析,推動個人化醫療的發展。他表示,NVIDIA提供從定序偵測到提供生物學洞見(insight)等基因體分析各階段所需的運算模型,可應用在新生兒加護醫療(NICU)、緊急醫療、癌症、族群研究和科研領域中。
他舉NVIDIA與使用者合作的驗證研究為例,說明GPU加上演算法相較於傳統CPU分析方式大幅縮短時間的效益。例如,加速序列比對及變異體偵測(variant calling)的演算法Parabricks,幫助科學家將生殖系細胞的基因體分析從18小時縮短成10分鐘,且開放使用者客製化調整工作流程。
另一項專攻資料科學加速與分析的RAPIDS,則提供一系列的開源軟體庫,其可透過簡單的程式語言加註,就能讓既有的分析流程大幅加速。例如,NVIDIA在與TGen合作下,將單細胞分析的過程從4.3小時縮短到14分鐘。
魏宇峰 » 因果AI助力老藥新用、多標靶藥物開發
維曙智能生物科技執行長魏宇峰則表示,因果AI(Causal AI)雖不及生成式AI熱度,但因果分析法早在2019年便助力三位經濟學家獲得諾貝爾經濟學獎。面對社會現象的複雜性,因果分析法能克服傳統方法難以掌握真實因果關係的限制,但其應用仍集中於特定領域,跨學科發展仍有挑戰,顯示該領域還屬於一片藍海。
他也分享,因果AI在生物醫學的應用,包括:精準標靶的搜尋、老藥新用(Drug repositioning)、多靶點如合成致死(synthetic lethality)的藥物設計、蛋白質序列工程,以及在臨床試驗中尋找適合的群體(cohort)。
不過,魏宇峰也坦言,因果AI目前仍有多項難題,如:高算力需求、耗時分析,以及資料驗證與稀缺性問題,未來技術突破在結合統計學方法與健保數據資源等方式下,有望克服當前限制。
莊承訓 » 亞大基因運用先進運算力 助多體學解鎖未知疾病
亞大基因科技生物資訊科學家莊承訓則指出,在多體學尚未成熟之前,精準醫療面臨諸多挑戰。以胃癌為例,雖已知瀰漫型胃癌預後較差,但臨床上對其成因及治療效果的理解尚不明確,隨著基因定序技術的發展,不同基因突變導致疾病分型也有了更全面的了解。
他進一步分享,亞大基因科技遵循國際上非營利組織全球基因體學與健康聯盟(GA4GH)的標準,建立的分散式基因定序分析和管理巨量生物資訊的雲端平台Atgenomix SeqsLab。
他表示,亞大基因利用Atgenomix SeqsLab平台與NVIDIA的Parabricks軟體結合,在全基因體定序(WGS)分析上,可將分析時間從5小時縮短至10分鐘。
此外,當Atgenomix SeqsLab與NVIDIA的Spark RAPIDS加速器結合應用於核糖核酸定序(RNA-Seq)分析時,在處理高達1萬個樣本和1.9萬個基因的數據集中,能將分析時間從2小時以上縮短至10分鐘,同時節省成本並提高分析的準確性與安全性。
【議題三】AI驅動藥物設計優化與驗證開發
傅琪鉦» 未來30年將為「程式化生物學」應用年
在「AI驅動藥物設計優化與驗證開發」議題中,NVIDIA戰略研究者合作高級開發者關係經理傅琪鉦指出,過去10年來,微軟的EvoDiff、以及諾貝爾得主開發的RoseTTaFold大型語言模型(LLM),已被大量應用在生物學研究與藥物設計。
他表示,生物體中的基因體序列,以及用文字編碼來表達化學物質的方式(SMILES),都可以當作一種語言型態,一但AI理解這種語言,就能精準編程我們所需的分子。
他也認為下一個30年,將會是程式化生物學(Programmable Biology)大量應用的年代。
他也介紹NVIDIA開發的BioNeMo與NVIDIA NIMS,可協助研究人員和開發者利用GPU加速技術,在計算環境中快速進行大規模的生物分子模型訓練和布署。
以AlphaFold2為例,該系統在NIM平台上,不僅能加快蛋白質結構的預測速度,將原本需要40分鐘的預測時間縮短至8分鐘,同時還大幅降低了對GPU的需求。
柯屹又» 生成式AI革新!藥物開發不再依賴大數據年
DCB智慧生醫組組長柯屹又指出,在過去20年中,科學家已經利用電腦模擬技術進行藥物研發。隨著深度學習和生成式AI技術的使用,現在科學家可以更快速地篩選藥物。
除了加速藥物開發,柯屹又進一步指出其中最大的差別,在於傳統的三維定量構效關係(3D-QSAR)技術,如CoMFA、CoMSIA和Pharmacophore,這些技術仰賴人工進行超過800種的特徵提取(Feature extraction )。現在,借助深度學習的力量,特徵提取已不需要人工干預,還顯著提高了預測的效率與準確性。
他也提到,DCB也正在開發「一鍋AI法」(One-pot AI),增強藥物的可成藥性、可合成性與可專利性。在此平台中,目前也有2~3家廠商正在洽談中。
此外,DCB也突破以往「AI訓練依賴大數據」的策略,而以單一化合物(one compound)為基礎,透過擴散模型(Diffusion Models)概念的生成式AI模型,在只有15筆數據情況下,進行脂質奈米微粒(LNP)的配方開發。
陳逸庭» 單模多態生成模型 提升藥物開發成功率
美商圖策生技臺灣分公司AI平台處處長陳逸庭,分享圖策如何從多模態(Multiple-models)篩藥到單模多態(Single Multimodal)的藥物生成AI開發。他首先提出,AI藥物開發的概念應該跳脫「藥物篩選」,而是往更高階的「精準生成藥物」發展。
陳逸庭表示,藥物開發會歷經許多步驟,目前在各環節都有效能高於90%的AI藥物開發平台,但即使都用上AI,仍有可能會因為各模型篩選的誤差,而把真正有潛力藥物剔除掉。
為了解決藥物開發序列工具(Sequential Tool)的瓶頸,圖策科技將所有藥物開發會涉及的因素整合,開發出一個「單模多態」的AI平台,其在靈活性、可擴充性與效率上都高過序列工具,不過他也坦言,此演算法在設計上較為複雜。
目前,圖策透過此平台已成功建立多個模型生成藥物,在不同實驗準確率達91%,並完成動物實驗驗證。
劉 昕» 逆合成、增強式學習 增加AI藥物合成可能性
分子智藥共同創辦人劉昕表示,藥物開發在生成式AI幫助下,雖然提高藥物篩選的時間和成本,但藥物能不能合成(Synthesis)、好不好合成還是一挑戰。
分子智藥也透過逆合成(Retrosynthesis)策略,同時結合生成式AI與合成化學家知識,一方面回饋哪些是好合成的步驟、哪些不易合成,一方面也對生成式AI施加限制,防止其產生難以合成的化合物,從而提高整體合成的可行性和效率。
此外,分子智藥也導入增強式學習(Reinforcement learning),導入環境中各式的模型、分數等,提高好的化合物生成。目前分子智藥已成功吸引了眾多客戶與其合作,進一步進行新藥開發。
陳淑貞» 蛋白質降解劑優勢多 AI突破藥物開發挑戰
安宏生醫科學長陳淑貞首先點出,蛋白質降解系統因具有特異性、降解疾病蛋白、滿足不可成藥靶點,又兼具小分子、大分子藥物優勢,已成為各大藥廠近年重視的領域。
不過她指出,蛋白質降解劑因涉及多種蛋白質-蛋白質和配體-蛋白質間的相互作用,藥物設計的複雜性極高。
她表示,安宏生醫透過公司內部的深度學習AI技術,結合NVIDIA的BioNeMO,強化虛擬化合物庫的化合物生成、篩選具活性的化合物。
安宏透過此平台,在2020年6月開始進行模型建構、虛擬篩選、確認結構,經過三輪藥物優化,僅花了14個月,就確認兩款具有潛力的藥物候選物,分別用於男性雄性禿(AGA)和攝護腺癌。其中,AGA的新藥已在美國通過臨床一期試驗申請。
【議題四】人工智慧技術重新定義生物醫學研究
林彥竹» AI製藥進入超速時代 「技術與商業模式同等重要」
在人工智慧技術重新定義生物醫學研究議題中,前英科智能執行長暨現任陽明交大藥學系兼任助理教授林彥竹分享,英科智能是第一代運用AI演算法研發小分子藥物的公司。
英科智能從沒有藥物到把藥物合成並推進臨床一期,約耗時2.5年,在臨床一期與二期試驗中又各花約1年。林彥竹表示,這樣的時程已被AI製藥視為黃金標準(gold standard)。
他也認為,臺灣的AI藥物研發尚停留在尋找新靶點與新藥的前期階段,建議企業應找到自身利基、突破高門檻領域。他特別強調,技術與商業模式同等重要,只有緊密結合才能創造商業價值,實現技術創新與市場需求的對接。
林榮信» 開發量子力學修正工具 補足蛋白質結構預測不足之處
中研院生醫轉譯研究中心副主任林榮信表示,生成式AI雖然能夠預測蛋白質結構,但仍無法提供非常可靠的預測結果,例如,難以準確預測蛋白質中的固有無序結構域(IDRs)或是內在非結構蛋白(IDP),無法生成處於不同功能狀態下的蛋白質構型,也無法預測金屬離子、輔因子(cofactor)和配體(ligand)的位置。
因此,林榮信團隊投入研發以AI預測蛋白質結構、輔以量子物理方式執行修正的方法,開發出idTarget、SLITHER、MEDock等可增進分子對接(molecular docking)計算準確性與應用性的工具。
林榮信表示,這些工具能用在評估大量蛋白質-配體複合物的結合自由能(binding free energy),為從標靶到先導化合物、再到候選藥物的過程提供協助。
鍾仁華» 心房顫動、乳癌、第二型糖尿病 都與多基因風險有關!
國衛院群體健康研究所(簡稱群健所)研究員鍾仁華分享,在AI演算法持續精進、加上全基因體關聯研究(GWAS)的盛行下,越來越多疾病性狀被發現與多基因相關,促成了多基因風險指標(PRS)的誕生。
但過去的PRS研究結果中,將近80%都是來自以白人為主的研究,目前,國際整合性基因組及預測聯盟(International Consortium of Integrative Genomics Prediction,簡稱INTERVENE),正致力於AI輔助的複雜醫療數據分析,以開發出幫助改善疾病理解及個人化治療的遺傳風險指標。
鍾仁華表示,該聯盟透過與各地的人體生物資料庫(Biobank)合作,找出高負擔疾病(high burden diseases)的PGS,近年在第二階段的擴展中,新增了美國、卡達、中國、臺灣的Biobank,將有助於適用於全球的PRS模組,改善對跨族群疾病原因的了解。
目前,群健所以臺灣人體資料庫為基礎分析,得知與PRS強烈相關的疾病,包含了心房顫動、乳癌、第二型糖尿病。若將與基因關聯性狀得來的PRS整合,將有助於改善疾病預測準確性,邁向精準健康。
楊立威» 設計藥物分子時 就要考慮吸收、分布、代謝、排泄和毒性
清大智慧生醫博士學位學程主任、生物資訊與結構生物所教授楊立威指出,在使用生成式AI設計藥物分子時,就應將人體的吸收、分布、代謝、排泄與毒性(ADMET)考慮進去,達成超越分子層級效益的分子設計。
楊立威團隊曾與美國德州西南醫學中心進行驗證合作,利用AI演算法找到能夠針對三陰性乳癌(TNBC)疾病靶點EgIN2加以抑制、同時又不影響另一與之高度相似的正常蛋白質EgIN1的先導化合物,該化合物具有良性脫靶效應的特色,比知名AI驅動藥物開發公司Atomwise提供的80種預測藥物毒性來得更低。他也分享,雖然AlphaFold3已經是結構生物資訊學的模範生,但它在預測蛋白質結構時缺少分子引力的資訊,也未考慮到濃度的影響,這會影響到藥物發現與設計的成功率。
>>本文刊登於《環球生技月刊》Vol. 122