美國時間2日,北美最大生技盛會登場前一日,由生物技術開發中心(DCB)籌畫的Taiwan Biotech Forum(臺灣生技論壇),今年以「Navigating the Next Generation of Precision Medicine」(引領下一代精準醫學)為主題,邀請全球基因定序儀器龍頭大廠Illumina領導人工智慧實驗室(Artificial Intelligence lab)的副總Kyle Kai-How Farh,分享深度學習(Deep Learning)在臨床致病基因變異的應用與趨勢見解。
Kyle Kai-How Farh是一位跨領域的傑出科學家,不只有美國萊斯大學的電腦科學學士學位,還在哈佛醫學院取得醫學學位,又從麻省理工學院取得博士學位,接著到布洛德研究所進行群體遺傳學博士後研究,再到波士頓兒童醫院擔任臨床遺傳學部門的住院醫師。
他對遺傳科學的研究熱情,讓遺傳科學貫串了他的職業生涯。他在2015年加入Illumina人工智慧部門,領導一個由40位科學家組成的小組。
他指出,人類在解析遺傳變異的影響仍是初級階段,在7000萬個蛋白質編碼變異(protein coding variants)之中,目前已知造成功能變異的只有0.1%,因此他與團隊目標是在5年內破解人類基因體中變異的影響。
他與團隊開發一種與ChatGPT架構類似的深度學習語言演算法——PrimateAI-3D,該工具是從公共資料庫 ClinVar 的基因變異進行深度學習,團隊又使用233種靈長類動物、總計超過800隻個體的定序數據進一步來訓練演算法。
Farh指出,靈長類動物持續平行演化,導致部分疾病的突變已被天澤,因此加入人類「遠親」——獼猴和猩猩等,可讓神經網路學習從基因中找到屬於良性變異的位置,並從自然淘汰過程中,判斷哪些區域的突變可能是致病的,他也把此多基因風險評估(PRS)工具稱為「自然選擇 (natural selection)」的新演算法。
Farh說,PrimateAI-3D在與各種演算法比較下,其表現都優於目前現有的方法,該演算法的研究成果,也在去年6月發表在《Science》期刊上。
Farh也表示,PrimateAI-3D除了準確分辨基因體的變異,也有助於提高藥物開發和臨床試驗的成功率。他們也透過PrimateAI-3D與遺傳學,來了解造成低密度脂蛋白膽固醇(LDL)異常累積的途徑,提供藥廠開發關鍵生物標記的標靶療法,他也表示,事實上,已有多數藥廠對變異進行藥物開發。
而目前,鑒於機器學習、人工智慧技術的進步,他與團隊還進一步開發以深度神經網路為基礎的SpliceAI,其可利用RNA定序(RNA-seq)識別患者細胞中異常的剪接問題,研究團隊在28名未確定的自閉症患者中,也預測了75%患者中基因體發生異常剪接的位點。
現在他們也持續開發新的應用,包括perturb-seq,該工具是一種基因編輯技術,可將不同突變插入單個細胞,讓每顆細胞就像一個實驗室一般,可分析這些突變如何影響細胞功能。他認為,這項技術未來可加速罕見疾病的診斷。
最後他也表示,精準醫學時代來臨,如何推動群體基因體定序,最終還是有賴人工智慧的技術協助。
(報導/彭梓涵)