此次CZI與NVIDIA擴大合作,主要建構生命科學領域中規模最大的高效能運算集群之一,為了開發這套預測模型,CZI 將以現有資料集作為訓練模型,以加速模型開發的速度。這套高效能運算模型的新專案,搭載逾千個NVIDIA H100 GPU,將不同細胞類行與組織包括正常和病變細胞,建立虛擬細胞模型,讓研究者能以 AI 進行細胞內機制模擬、基因變化分析與臨床相關預測。
這次合作的新亮點,包括擴展資料處理規模、加速模型開發,以及增加對AI模型和資料的存取能力。
不過這些訓練模型所須要耗費的成本較昂貴,這也使得國內的許多研究團隊,都因無法負擔過高的成本而選擇放棄。對此,CZI作為由祖克柏夫婦成立的機構,手頭上可以運用的資金,基本上也都來自祖克柏夫婦自身的貢獻,而團隊為了加速醫學領域的研究進程,也將預測模型及相關工具將開放給研究人員使用,加速醫學研究。
CZI認為,若成功將「虛擬細胞模型」開發完成,不僅能為生物醫學提供大規模支援 AI 和大型語言模型,並能協助全球科學家解決各項醫學領域的複雜挑戰,同時也能助科學家們,進一步創造出更多、更好的藥物和疫苗,有助於治癒、預防許多疾病。
事實上,大型生物資料集的生成和整合使用仍然是生命科學中人工智慧應用的瓶頸。而為了彌補這一差距,CZI也於今年2月啟動的10億細胞計畫(Billion Cells Project),與10x Genomics、Ultima Genomics合作,將建立史無前例的10億個細胞資料集,繪製不同細胞類型和組織的基因擾動圖譜(Gene Perturbation Profiles),提升AI模型在新生物情境中的表現。
CZI的VCP是一個開源平台,提供由CZI開發的資料、模型和AI驅動的生物分析工具供科學界使用,包括rBio、GREmLN和TranscriptFormer等虛擬細胞模型。此次合作將首次在平台上提供NVIDIA Clara Open Models、基於MONAI的影像模型,以及RNA基礎模型CodonFM,進一步擴大虛擬細胞模型的規模和應用範圍。
NVIDIA生命科學全球業務發展資深總監Rory Kelleher表示,透過支持CZI建立開放且社群驅動的資源,確保全球科學家都能運用這些強大工具解決醫學難題。CZI科技副總裁Ram Balasubramanian則指出,結合CZI在生物資料生成和模型開發的專業,以及NVIDIA在加速運算的領導地位,將為研究人員提供所需的基礎設施和工具,推動人類生物學的新發現,最終解決疾病問題。
資料來源:https://www.genengnews.com/topics/artificial-intelligence/nvidia-and-chan-zuckerberg-initiative-collaboration-scales-virtual-cell/
(編譯/吳康瑋)