編譯/巫芝岳
近日,加州大學爾灣分校(UC Irvine)的科學家發表了一項人工智慧(AI)深度學習框架(deep learning framework),可用於預測單一細胞層級的基因調控,突破過去轉錄因子(transcription factor)結合預測技術,僅能針對整群細胞進行的限制。研究論文於2020年12月18日發表於期刊《Science Advances》。
由UC Irvine華裔資訊科學系教授謝曉輝領導的研究團隊,開發了這項「單細胞因子分析網絡」(single-cell factor analysis network, scFAN)的演算框架,該框架經由可分析數百至數千個細胞全基因體染色質的「ATAC-seq」定序、染色質免疫共沉澱定序(ChiP-seq)等技術訓練,能精準預測出單顆細胞轉錄因子的結合情形。
(編按:轉錄為基因表現的第一個步驟,其過程需經轉錄因子調控。轉錄因子可透過與特定DNA序列結合,或是與其他轉錄因子形成轉錄複合體,來影響基因轉錄。)
轉錄因子結合偏好的預測,是許多基因、蛋白質研究中不可或缺的一環,也是生物資訊中十分重要的領域之一。近年在深度學習技術的發展下,雖已開發出經由大量染色質數據預測轉錄因子結合位置的技術,但都仍只能在「細胞群」的尺度下進行。
謝曉輝表示,其挑戰在於細胞群間,單一細胞數據量稀少,且具有內在雜訊(intrinsic noise)的問題。
為了克服這些限制,在生物學、資訊科學、數學系等跨科別專家的合作下,他們以「卷積神經網路」(CNN)這項深度學習方法作為基本結構,結合ATAC-seq、ChiP-seq定序技術,經大量數據訓練出scFAN。
他們也創建了一項稱為「轉錄因子活動分數」(TF activity score)的評估指標,來表示每顆細胞的轉錄特徵,並經實驗驗證,不同細胞群間的分數表現具有明顯差異。
研究團隊表示,透過scFAN,科學家將能揪出對疾病治療極重要的微小細胞群體,也得以快速了解不同細胞亞群間,基因調控機制的差異;像是識別出含有不同亞群癌症幹細胞中的關鍵訊號。
參考資料:
1.論文原文:https://advances.sciencemag.org/content/6/51/eaba9031