MD安德森開發正常細胞、癌細胞識別演算法 加速單細胞RNA定序研究

撰文記者 吳培安
日期2021-01-19
(圖片來源:網路)
編譯 / 吳培安

美國時間18日,德州大學MD安德森癌症中心(The University of Texas MD Anderson Cancer Center)研究團隊,於《Nature Biotechnology》發表一項新的轉錄體(transcriptome)演算法「CopyKAT」。

團隊表示,這套演算法能夠根據取自腫瘤樣本的單細胞RNA定序(single-cell RNA sequencing)資料庫,以99%的高準確度辨別細胞屬於癌症細胞或是正常細胞,甚至在某些癌種中可將癌細胞進一步分類成亞族群(subpopulations)。
 
研究團隊表示,CopyKAT為「非整倍體腫瘤副本數核型分析」(Copy number karyotyping of aneuploid tumors)的縮寫,其演算法透過在單細胞RNA定序資料庫中,搜尋非整倍體(aneuploidy)的存在。
 
由於非整倍體是大多數的癌症中普遍存在的染色體數目異常,因此可以將腫瘤細胞的轉錄體資料,與其他同時存在於腫瘤中的免疫細胞或基質細胞(stromal cells)區分開來。
 
經過全基因體定序資料(whole-genome sequencing)比對,以及在胰臟癌、三陰性乳癌和甲狀腺未分化癌(Anaplastic thyroid cancer)的資料庫,CopyKAT展現出準確地辨別混合樣本中的腫瘤細胞和普通細胞的能力。研究團隊表示,其分辨的準確度可高達99%。
 
此研究資深作者、MD安德森癌症中心副教授Nicholas Navin表示,過去腫瘤一直是以細胞的混合體來研究,但腫瘤內有許多細胞並不是癌細胞。
 
直到單細胞RNA定序在近年崛起後,科學家得以用單顆細胞的基因表現尺度來分析腫瘤、藉此檢驗個別細胞,進而描繪出腫瘤輿圖、也含納了圍繞腫瘤的微環境。不過,還是需要一種可信賴的運算途徑,來辨別腫瘤細胞或普通細胞。
 
Navin表示,這項運算工具將使科學家更容易從數千顆基因表現各異的細胞所構成、大規模單細胞RNA定序實驗複雜資訊中,進一步檢查複雜的資料。
 
除了辨別癌細胞和正常細胞,Navin進一步表示,這項工具目前在三陰性乳癌資料庫中,也能幫助將癌症細胞更進一步分成更精細的亞族群。但他也表示,亞族群分類可能不適用於所有癌症。
 
參考資料:
https://www.eurekalert.org/pub_releases/2021-01/uotm-nct011521.php