曾任IBM首席科學家的林清詠,曾被國際電機電子工程師協會(IEEE)任命為IEEE Fellow,是網路科學領域的第一人,堪稱臺灣之光。2017年,他在最靠近IBM職涯發展的天花板之際,轉身在紐約第五大道,成立專攻AI科技的美商Graphen。去年底,他又成立以AI為基礎、專注藥物開發的子公司Drugomics,開發出一套涵蓋12種藥物開發的預測工具,不只可提高藥物成功率、降低副作用,還比傳統藥物開發時間縮短至1/27、成本降低至1/9,000。
撰文/彭梓涵
「人腦是由一千億個節點和700萬兆條邊緣組成的巨大網路,在這複雜的網路中,人類智慧的演化讓我們能從記憶學習、觀察感知,進一步做到表達、推理,人工智慧(Artificial Intelligence, AI)的演化亦是如此」。
IBM前首席科學家、美商圖策科技(Graphen)創辦人林清詠大膽預測,「人工智慧的發展,再不用50年,就能把人類數百萬年演化出具思維與推測能力的歷史走完!」
曾任IBM首席科學家的林清詠,不只創立IBM華生(Watson)研究中心旗下「網路科學和機器學習部門」,領導的多個跨國大型AI項目,創下許多世界第一,2011年他還以網路科學領域第一人,被國際電機電子工程師協會(IEEE)任命為IEEE Fellow,成就堪稱臺灣之光。
在這條被大家認為虛無飄渺的AI披荊斬棘之路,林清詠走了近20年,2017年,他在最靠近IBM公司內部拔擢成為Fellow的天花板之際,轉身在紐約第五大道,成立專攻AI科技的美商Graphen。
Graphen創立短短幾年,疫情間繪製出「COVID-19基因演化路徑分析」,提早預測病毒突變的結構熱點,在幾次關鍵的病毒變異前,向世界發出警訊。
另外,針對蛋白質結構預測的AI,也在2021、2022年結構預測重要比賽CASP中,連續兩年拿下第一名,效能媲美Alphafold2。市調公司《ABI Research》,因此將Graphen與Google的DeepMind並列為蛋白質結構預測的重要影響公司。
去年12月底,他成立以激酶(Kinase)為標的的藥物開發公司Graphen Drugomics,公司獨創的AI藥物開發系統,可推動未來該領域藥物設計、開發與製造。
林清詠表示,人腦智慧的演化是由後腦到前腦,人工智慧的發展也是如此。圖為2018年7月,林清詠於亞洲生技大會的演講。(攝影/彭梓涵)
得過七次最佳論文獎 進入IBM殿堂
若把林清詠的職涯拆解,他的職涯上半場,幾乎貢獻給IBM這家企業。
20多年前,即便是美國頂尖電腦科學(Computer Science)的學生,都很難進入《Fortune》排名500大最想進入的夢幻企業――IBM。
問起林清詠怎麼被IBM關注到?「可能是我很能寫論文,也曾經拿過七次最佳論文獎(Best Paper Award)吧!」林清詠給了這樣的答案。
來自臺灣的林清詠,大學、碩班念的是臺大電機系,他碩士論文多達300多頁,是目前為止無人能打破的紀錄。畢業後,他也以碎形幾何用於影像壓縮的研究,獲得宏碁龍騰論文獎特優獎,以及臺灣電腦視覺、圖學及影像處理研討會(CVGIP) 傑出論文獎。
隨即,他負笈美國哥倫比亞大學攻讀博士學位,期間也在多個國際會議和期刊得過最佳論文獎,其中包括IEEE電路與系統(CAS)協會傑出青年作者獎等。
爾後,他還陸續有很多研究獲得最佳論文獎,但「已族繁不及備載了。」林清詠笑說。
2000年,林清詠博士班畢業班後,馬上被IBM華生研究中心看上……。
為IBM打下多個第一 成為IEEE首位網路科學會士
在IBM華生研究中心,他從研究員做起,但短短3年之間,他就領導了全球23個研究機構超過100名研究人員,展開第一個大規模協作影像語義標註計畫。
林清詠說,這是電腦視覺(Computer Vision)領域有史以來,第一個以機器學習(Machine Learning)為基礎的計畫,他的團隊也在2002~2004年度於美國國家標準與技術研究院(NIST)舉辦的影像語義辨識評比測試中,獲得最佳表現。
接著,他又為IBM創建全球第一個企業社群分析方案——SmallBlue (小藍),小藍是一款不需要個人明確參與下,在社群、知識網絡中,可牽起你想認識的人,拓展交友圈,也能查詢和存取專業知識的管理工具,光是這個系統,一年就能為IBM帶來一億美元的收入。
林清詠不只受到IBM表彰,2008年IBM還讓他創立並管理華生中心旗下「網路科學和機器學習部門」,專注在大數據分析。
他的成就,在2010年被IBM生涯探索評論選為,「一位最有可能對IBM和世界產生最大科學影響的研究員」。2011年他再榮獲IEEE會士是網路科學領域的第一人。
與此同時,他又次被IBM拔擢為公司首席科學家,負責推進IBM與整個AI領域的圖形運算(Graphic Computing)、視覺分析、中介軟體(Middleware)、認知網路分析,以及時空和行為分析等前瞻技術的開發。
他也舉例一些技術說明,就是當大家的機器學習,還只能識別圖片上的是一棟房子、一台車的時候,IBM就能做到說出這是一棟「廢棄」的房子、這是一台「加速中」的車子這類的形容詞。
可以說,林清詠的職涯上半場幾乎都花在AI相關的電腦視覺和圖形學上,他也表示,自己就差一個IBM內部的Fellow,「這個榮耀雖然可以把個人的照片掛在IBM的牆上名留青史,但除此之外,似乎沒有什麼可以再追求的」。
自立門戶 追求真理貢獻於全人類
於是在2017年,在人生的最高峰上,林清詠決定離開IBM,轉身在紐約第五大道上創立公司Graphen,以自己在人工智慧的專長,另闢一片天地。
Graphen成立初期,主要仍延續他在IBM的相關技術,包括,洗錢防制、資安管理、數位金融、市場監控等,創立一年,其開發的系統就獲得中國銀行紐約分行採用,繳出優異的成績單。
然而,他坦言,「這些項目雖然能幫助人類生活提升,但我不會想一輩子做這些!」。
有一年,林清詠回國演講,因緣際會遇到中央研究院化學研究所特聘研究員陳玉如博士,她是推動臺灣與美國臨床蛋白基因體學腫瘤分析聯盟(CPTAC)合作的「台灣癌症登月計畫」主持人。
陳玉如告訴他,自己正在為分析人體基因體學(Genomics)的關聯性研究問題煩惱,希望能借助林清詠在人工智慧與大數據的專長。
雖然,林清詠不懂陳玉如說的各種在人體內的蛋白質訊息傳導,但人類基因體就是一套完整的核酸序列編碼,這和他大學時期學的電腦編碼相通,「人類有這麼大的編碼,就非常值得去探索。」陳玉如的問題因此讓他眼睛為之一亮。
2018年,林清詠準備從基因體的角度出發,投入進行全基因體定序(WGS)方面研究。
受中研院陳玉如癌症登月計畫啟發 投入基因體分析
而天妒英才,爾後的某天,林清詠在回美國飛機上就感到胸口不適,下機後立即被太太送醫急救,並被醫師診斷心肌梗塞,緊急裝設支架才撿回一命。躺在病床上的他問醫師,「我都還沒50歲,為何是我?」,雖然醫師一時無法說出真正原因,不過推論可能與基因有關。
親身鬼門關走一回,也再次激起林清詠對全基因體定序的好奇。事實上,在2019年時,他在兩家基因定序公司做了個人的全基因體定序,有趣的是,兩家公司竟然都沒有預測到他有心肌梗塞的風險。
「我是做大數據分析的,知道怎麼判斷和排名。」因此,林清詠決意自己來寫基因分析的Code。
沒多久,林清詠就利用圖數據庫,配合機器學習/深度學習技術開發出「基因體分析工具——Graphen Adam Genome」。他分享,這套工具的策略不是讓程式去讀所有的Paper,而是使用Google搜尋引擎中使用的「超文本標記語言(HTML)」基礎技術,來排名出有公信力的醫學數據。
林清詠說,HTML是一種用於建立網頁內容並將其呈現在網路瀏覽器上的標準標記語言,HTML碼會定義網頁中,包含了一個標題和一段文字。
因此,當這個HTML被越有權威的人物引用過,他被搜尋的優先順序就會越前面,Google也因為這套語言系統成為搜尋引擎市場的龍頭。
林清詠和幾個Graphen的同事,也都在Graphen Adam Genome系統上親身體驗,並驗證了疾病風險預測的精準性,但這套系統還沒被市場驗證過。
開發首個「COVID-19基因演化分析AI」提早全球警示危險變異株
2020年,正當全球受到新冠疫情肆虐,新冠病毒株基因不斷出現演化,林清詠快速在他原本建立的基因分析引擎,開發出全球首個「COVID-19基因演化路徑分析」。
「COVID-19基因演化路徑分析」系統,會納入世界各地上傳數百萬筆的病毒全基因定序,動態性的預測病毒基因演化的序列變化。
林清詠在幾次關鍵的病毒變異前,都向世界發出警訊,包括:英國變異株Alpha (B.1.17),Graphen就比英國政府早兩個半月,警訊變異株的出現。
還有發現南非變異株E48K的影響,「E48K的變異,會使病毒和抗體結合力,由正負相吸轉為正正相斥,這種變異恐大幅影響疫苗的效力。」他說。
經過疫情洗禮,Graphen也正式通過了市場的考驗。
但林清詠心想,「Graphen只能做到這樣嗎?如果算命仙已經把你的命都算出來了,但如果真實世界中沒有對應的治療或藥物,我們就只能坐以待斃嗎?」
蛋白質預測模型 媲美DeepMind
林清詠決定釜底抽薪,他在疫情間一方面監控病毒變異,一方面持續開發「目標蛋白質結構功能預測模型——Graphen Atom」。
林清詠說,過去,蛋白質結構的預測只能在濕式實驗室(Wet Lab)透過核磁共振、X射線、冷凍電鏡等方法,花費數年時間完成。
但隨著3~4年前深度學習技術成熟,Google姊妹公司DeepMind已將其應用到蛋白結構的預測,並在2021年開發出Alphafold演算法,其發表在《Nature》的數據顯示可預測人類蛋白質體中將近60%的氨基酸位置。
Alphafold不只破解了近50年的蛋白質結構預測難題,也打破其他乾式實驗室(Dry Lab)過往只有40%的預測準確率,Alphafold精確度已提升到快90%,該演算法也獲選當年《Science》期刊最佳科研突破。
林清詠說,AI在生物學翻天覆地的變化,帶動了更多AI領域的科學家一起投入。但以後進之姿投入的Graphen,開發出的Graphen Atom也不甘示弱。
2020年,Graphen Atom第一次參加結構預測重要比賽CASP,準確率就達到89%,在當年排名僅次Alphafold2,但Graphen Atom卻只用了Alphafold2約1/50的硬體。
在林清詠帶領下,Graphen Atom進一步的調整與優化,在2022年CASP15的預測,也突破2020年成績,拿下第一名。
首個End to End 藥物開發系統 藥物成功率大增
目前,Graphen Atom已涵蓋12種預測工具,包括原子網絡(Atom Network)、蛋白質結構預測、蛋白質功能預測、分子交互作用、親和力預測、生物網絡(Biology Network)、藥物代謝動力學預測(ADME)、抗體開發、藥物生成(Drug Generation)、突變預測(Mutation Intelligence)、疾病進展/抗藥性預測、多體學分析等。
他也表示,這些AI雖然市場上都有類似的產品,但都是以「單一功能」存在,Graphen的Graphen Atom準確率不只比已公開的工具都還高,還是全球首個藥物開發從設計、開發到製造的「端到端(End to End)」系統。
林清詠指出,如果是生成式AI,一個蛋白質初步可以撈出150萬個化合物,但不一定每個化合物都能使用,有些化合物就會潛藏較高的副作用,當這些藥物在進到臨床時失敗率就會升高。
他並特別強調,這正是先前外媒評論提及,「第一批AI設計的藥物多以失望告終」的主要原因。
林清詠進一步說明,「事實上,這些由成立超過10年的第一代AI藥物公司開發的藥物,他們使用的工具某種程度上都不是現在所謂的『深度學習、生成式AI』,這些工具都是單一功能,也不夠強大」。
所以,若能加上過濾高副作用化合物的工具,最初的150萬個候選藥物再經篩選後,就會再減少到30萬個。
「接著,若再把藥物代謝動力學加進來,候選藥物會再縮小範圍到2,500個;我們的系統還可以再納入預測藥物在動物體內的動力學表現,候選藥物就會剩下100個;再導入病人的突變因子,篩選標的可再從100個降到30個;再進行藥物合成可能性的篩選,藥物標的選取最後約為10個。」
「這個挑揀過程,就像職人逐步雕琢一把可打開藥物成功大門的鑰匙。」林清詠說,這10個藥物將不只有很高的藥物毒殺功效、副作用也低,此外,與傳統藥物開發時間相比,時間可縮短1/27、成本也降低1/9,000。
目前,Graphen已篩選出20種新藥,包括:脂肪肝、胰臟癌、三陰性乳癌、關節炎、胃癌跟直腸癌等候選藥物。
這些藥也都已委託加州的Thermo Fisher進行Wet Lab的實驗,「每個藥物完成細胞毒性測試後,基本上就是要開香檳慶祝。」林清詠興奮道。
Thermo Fisher 對Graphen也有很高的評價,「一些Wet Lab委託他們進行的化合物測試,通常10個中會有3~4個做的出來,Graphen給的10個化合物會有9個做出來。」
成立子公司 轉型為製藥公司
向來低調的林清詠,做幾分事情說幾分話,原本要等藥物測試結果累積更多數據,才要在今年成立子公司,沒想到幾個候選藥物的細胞試驗表現超乎預期,他於是提早在2023年底,成立一家以激酶(Kinase)為目標的Graphen Drugomics。
林清詠說,Kinase是細胞訊號傳遞的樞紐角色,根據市場調查數據,目前194個Kinase家族中,僅有20個Kinase具有對應的藥物獲得批准,此外,約有60~70%疾病與Kinase異常有關,此異常多會促成心臟、癌症、代謝、神經方面疾病。
目前,Graphen以蛋白激酶藥物開發出發,現在已經開發出針對胰臟癌、腎臟癌、頭頸癌、肝癌等適應症的多個可合成候選藥物。
去年底,Graphen Drugomics參與了紐約最大AI年會——紐約人工智能峰會暨展覽會(The AI Summit New York),公司技術已獲得許多製藥公司、投資人的青睞,也加深林清詠的信心。
Graphen Drugomics目前最新進展,在臨床前的動物研究上,預計今年Q1會有新結果,Graphen也將再募2,000萬美元,該筆資金計畫用於20個先導藥物的細胞與動物研究。同時,也計畫2025年後進行B輪募資,並在未來3~4年規劃於納斯達克(NASDAQ)上市。
去年底,林清詠再成立以激酶為目標的子公司Graphen Drugomics,轉型為製藥公司。(圖/本刊資料中心)
AI與AI藥物發展歷程
說起人工智慧發展,其概念早在1950年就開始,不過「AI」一詞事實上是在近10年才有被開始大量使用。
林清詠說,1950年是電腦剛問世的年代,由於電腦能解答代數與數學問題,那時電腦被認定具有「智慧」,但整體來說電腦計算速度低,又不能回答人類不知道的問題,AI在當時還沒有被發展起來。
一直到1980年,包括專家系統(Expert System)、淺層深度學(SVN、決策樹)等技術興起,帶來第二次的AI研究熱潮。但在這波熱潮下,Apple和IBM生產的桌上型電腦不斷升級,在專家系統維護費用居高不下情況下,AI再次進入寒冬。
AI發展到1993年才又開始復甦,不過在此階段,AI一詞仍未被廣泛使用,多數還是稱為「電腦輔助(CAD)」工具。
林清詠說,約2000年左右,IBM就發現那時的電腦視覺發展的限制,一張照片標的與分析往往就需要一個博士來負責。因此,「面對巨量資料時,還有什麼是更有利的方法?」他想。
後來,IBM領先全球第一個把「機器學習」,帶進了電腦視覺。
但大家這時期還是沒有把「機器學習」以AI來統稱,直到在2010~2012年左右問世的「深度學習」,其在電腦視覺應用上準確率提高勝過「機器學習」後,AI技術才慢慢被大家認可。
不過,AI真正顛覆大家想法的,是2016年,Google的AlphaGo擊敗世界棋王,翻轉人工智慧勝過人腦智慧後,深度學習才被認定是一條可走的路,且可以用在許多領域。
至於大型語言模型——生成式AI (Generative AI),又是到2018年才出現。所以,林清詠認為,成熟AI被廣泛應用到生技製藥領域,絕對是這5年內的事情。
林清詠說,1950年是電腦剛問世的年代,AI在當時還沒有被發展起來。(攝影/彭梓涵)
產品戰線寬 未來成立多家子公司
林清詠不只將延長人類生命作為目標,他也把人口老化、少子化造成的勞動力不足問題,作為公司發展的策略之一。
Graphen產品線中已有一款適合日常生活的「數位人類」—— Aiia Kiosk,Aiia提供多種語言支持和場景應用,可提高客戶服務、零售店體驗、電子商務等生產力,以解決體力勞動缺乏或流失的問題,提高企業效率。
他透露,Aiia Kiosk 已在我們熟知的生活場景中落地應用,像是在美國設立分店的手搖飲Co Co、臺灣小吃店四海遊龍等。臺灣彰化基督教醫院也在去年6月與Graphen簽署合作備忘錄,將Aiia Kiosk導入醫療場景中。
Graphen在不同項目中都陸續開花結果,林清詠表示,由於Graphen的產品戰線寬,公司在整體募資上,比較難吸引特定的投資人,因此,他已計畫將不同代表性的產品線,切出獨立成不同公司。
Profile:林清詠
現職 | • 圖策科技 執行長 |
經歷 | • 哥倫比亞大學 客座教授 • IBM 傑出研究員兼首席科學家 • IBM網路科學 首席研究員 • 紐約大學 客座教授 • 華盛頓大學 副教授 • IBM Watson研究中心 研究員 |
學歷 | • 哥倫比亞大學電機工程學系博士 • 臺灣大學電機工程學系碩士 • 臺灣大學電機工程學系學士 |
>>本文刊登於《環球生技月刊》Vol. 115