由美國國家衛生研究院(NIH)從2015年發起的百萬名美國人全基因體數據庫計畫「All of Us」,於17日宣布首次釋出近十萬筆的全基因體定序(whole genome sequencing)數據庫,供美國科學家研究使用,進而讓美國人獲得更精準的醫療照護途徑。
值得注意的是,其中50%的數據,是來自過去研究中代表性不足的種族(racial)或族裔(ethnic)。這些資料將使得美國的科學家能夠探索健康或疾病的未解之謎,帶來新的突破、加速科學發展。
All of Us執行長Josh Denny表示,迄今超過90%的大型基因體學研究,調查的對象都是歐洲人後代(European descent),在研究上缺乏多樣性,也阻撓了科學的進展。All of Us透過多元受試者的共襄盛舉,為醫學研究帶來更公平的代表性。
現在,美國的科學家可透過All of Us建置的雲端平台Research Workbench取得資料。Denny也表示,All of Us現在僅是起步階段,未來他們將會持續擴展資料規模,並且導入新的工具,讓這個資料庫成為健康研究不可或缺的數據庫。
根據NIH公開資訊,Research Workbench除了全基因體數據,也涵納了來自16.5萬人的基因型陣列分析(genotyping arrays)資料。相較於全基因體定序涵蓋近乎全部的個體遺傳組成,基因型陣列分析資料的使用更為廣泛,是透過基因檢測工具,來捕捉特定基因體的子集合資訊。
此外,除了遺傳資料,Workbench平台也包含了許多患者的電子病歷(EHR)、Fitbit穿戴裝置和抽樣調查結果,並連結到由美國人口普查局執行的美國社區問卷調查(Census Bureau’s American Community Survey),能為科學家提供患者所居住社區的更多細節。這些資料綜合起來,能夠讓科學家更好的理解基因如何在其他健康決定因子的脈絡下,導致疾病或對疾病造成影響。
為了保護患者的隱私,這項計畫移除了所有直接的身分辨別資訊,並要求使用這些資料的科學家謹守嚴格的規範;此外,在開放給科學家使用之前,參與此計畫的患者都有機會無償獲得個人的DNA資料。
目前為止,All of Us已經將有關遺傳祖先(genetic ancestry)和遺傳特徵分析結果提供給超過10萬名參與者。NIH也表示,他們預計在今年稍晚再釋出一波與健康相關的DNA結果,包括遺傳性疾病風險、藥物基因檢測數據等。
如今,All of Us的基因體中心以每週5千人的速度,執行基因體數據的產出和加工,並與國際上其他大型基因體研究並列,包括UK Biobank、美國百萬退伍軍人計畫(the Million Veteran Program)、NIH另一項精準醫學跨體學計畫(Trans-Omics for Precision Medicine)等。
西雅圖華盛頓大學醫學院醫學遺傳學部門負責人Gail Jarvik醫師表示,All of Us有別於同領域的其他資料庫,提供了獨特的資料深度和維度。此外,他也肯定All of Us的規劃中導入了科學思維,讓科學家可以開放、合作的方式探索議題。隨著這個平台逐漸成熟,它將會創造無窮的可能性,為基因及其變體(variants),以及其他和基因一起影響健康和疾病的因子,帶來新的理解和發現。
參考資料:
https://www.nih.gov/news-events/news-releases/nih-s-all-us-research-program-releases-first-genomic-dataset-nearly-100000-whole-genome-sequences
All of Us 研究資料雲端平台:
https://www.researchallofus.org/
(編譯 / 吳培安)
下一篇