近(20)日,英國人體生物資料庫(UK Biobank)投資者之一的安進(Amgen)子公司Decode Genetics、冰島雷克雅維克大學(Reykjavik University)及其他研究中心組成的團隊,在知名學術期刊《Nature》上發表了以超過15萬名參與者為基礎的全基因體定序(WGS),證明大規模蒐集所得的遺傳變異資訊,能夠找出以往未發現的特徵(trait)及疾病關聯。
研究團隊表示,透過大規模定序研究,能夠廣泛地增加我們對非編碼基因體(noncoding genome)功能及影響的認識。當這些研究成果和UK Biobank中豐富的表型多樣性資訊結合,就能大幅改善我們對人類基因體變異,以及它們和表型多樣性之間關聯的了解。
在最新發表的研究中,參與UK Biobank的冰島、丹麥研究團隊,敘述了有關單核苷酸變異(single nucleotide variants)、微小的插入和刪除(indel),以及在數據中發現的較大型的結構變異,並指出了UK Biobank中,三大祖先類群及其相關的單倍型特色(haplotype features)。
這三大類群,分別為較大的英國愛爾蘭人類群、較小的非洲人類群,以及南亞人類群。研究團隊表示,透過這些單倍型參考組(haplotype reference panel),能讓我們針對由三個以上定序個體所帶有大多數變異,執行可靠的試算(imputation)。
此外,這項研究也帶來了許多收穫,包括:超過5億8500萬個單核苷酸變異,超過5870萬的插入或刪除資訊,約89萬5100個結構變異,以及超過250萬個微衛星(microsatellites),再加上祖先單倍型,就可以用來研究許多人體的罕見變異。
其中也包含了許多疾病,例如:第一型腦偏癱偏頭痛(type 1 hemiplegic migraines)、肌肉強直症(myotonic dystrophy)、癲癇、第二型陣發性不協調(episodic ataxia type 2)、第六型脊髓小腦退化性動作協調障礙(spinocerebellar ataxia type 6)等等。
研究團隊表示,這些發現可說是強而有力的新資源,讓他們找出一些具有巨大影響的罕見變異。這些變異關聯在過去的研究方法中並未發現,例如全外顯子體定序或試算。
此外,有了這些資料,可讓關聯性分析(association analyses)得以再往前一步,例如在擁有相似祖先背景的個體之間,區分出基因體遺傳多樣性,以及過往難以研究、卻相當重要的缺失區域(depletion region)。
根據2021年在美國人類遺傳學會年會(American Society of Human Genetics)參與UK Biobank計畫的Decode及英國惠康桑格研究所(Wellcome Sanger Institute)的發表內容,該計畫已經定序了15萬119人的WGS深度定序,平均深度超過30倍。
研究團隊也預計在未來幾年內,完成共計50萬名全數參與者的基因體定序。這項工作也獲得了安進、阿斯特捷利康(AZ)、葛蘭素史克(GSK)、嬌生(J&J)及英國政府的支持。
參考資料:
https://www.genomeweb.com/sequencing/analysis-150k-uk-biobank-genomes-leads-discovery-new-variants-trait-associations#.YtjwoHZBzD6
(編譯 / 吳培安)
下一篇