負責擔任OHDSI APAC會議當地主辦委員會主席、臺北醫學大學數據處臨床數據中心主任徐之昇表示,臺灣正式參與全球最大的健康數據聯盟「國際觀察性健康資料科學與資訊學聯盟」(OHDSI)始於2020年。
徐之昇表示,作為OHDSI與臺灣連結的樞紐代表,北醫體系在北醫大數據處歷經半年的籌備之下,完成北醫臨床研究資料庫(TMUCRD)與OHDSI-CDM的資訊接軌工程後,於2020年12月15日正式成立OHDSI Taiwan Chapter辦事處,帶領臺灣加入OHDSI聯盟、成為OHDSI APAC的第6個正式會員國,並在今年8月正式成立「臺灣觀察性健康資料研究學會 (OHDSI Taiwan Society)」。
臺灣全民健保、衛福部資料 供健康大數據研究
在OHDSI APAC的跨國研究中,擁有豐富健康大數據和技術力的臺灣,展現出的熱情與研究成果也毫不遜色。作為本次大會主辦方,北醫數據處臨床數據中心助理研究員Alex PA. Nguyen,在演講中介紹臺灣政府在健康資料開放上的情形。
Alex PA. Nguyen表示,臺灣於1995年開辦全民健保,覆蓋率超過99%,其蒐集到的龐大健康資料,由國家衛生研究院建置「全民健康保險研究資料庫」(NHIRD),並自2000年每5年提供「承保抽樣歸人檔」(LHID)供學界研究。(註:該計畫已經於2016年結束。)
另一方面,衛福部設置的「衛生福利資料科學中心」(HWDC),2010至今則已累積多達8493篇學術期刊論文,衛福部並透過下轄的10個研究分中心,提供研究者進行統計分析的獨立作業區。
北醫數據處臨床數據中心助理研究員Alex PA. Nguyen。攝影/賴俊睿
Alex PA. Nguyen表示,臺灣政府提供的資料,提供了大數據研究的機會,例如:防疫措施、抗凝血劑與心房顫動嚴重出血風險之關聯、史他汀類藥物(statins)對於癌症患者的EGFR-TKI耐藥性的影響等,已有多篇研究發表於國際期刊。
Alex PA. Nguyen認為,臺灣加入OHDSI,將既有資料嫁接至OHDSI採用的CDM,能使這些資料更容易用於研究,並節省時間、金錢和改善資料的品質與一致性,以及增加臺灣與其他國家研究單位的合作。
徐之昇:北醫資料庫接軌OHDSI-CDM 高品質促跨國研究
徐之昇也在13日的演講中,介紹TMUCRD在創新臨床數據目前取得的成果。他表示,TMUCRD是北醫整合了3家附屬醫院:北醫附醫、萬芳醫院、雙和醫院的各類臨床數據所建置,於2020年起提供研究者申請使用。
徐之昇表示,TMUCRD現累積1996年至2021年共25年間,全臺灣約412萬名病患的非結構化數據和結構化數據,且相較於健保資料庫,還多提供了實驗室檢驗數據、生理檢測數據、放射線影像報告等。
此外,該資料庫也與衛福部的癌症登記和死亡登記資料庫連結,因此對於癌症治療效果、患者死亡時間和原因能有更詳細的分析。
徐之昇強調,北醫不僅是蒐集大量的資料樣本,更著重於改善資料品質,像是增加資料正確性、資料多元性、資料完整性(integrity)、資料標準化、資料可近性(accessibility)、保護個人隱私和資料治理(Data Governance)等;也透過搜尋或自然語言處理(NLP),將非結構化數據轉換成結構化數據。
北醫也創建了多種新型資料,如心臟超音波、腦癌轉移、營養報告、細菌檢驗報告等,以及專門主題的資料庫,如COVID-19、失智、肺癌等,並和臺灣多家醫院執行跨機構的資料研究合作,及學術、產業界合作。
臺北醫學大學數據處臨床數據中心主任徐之昇。攝影/賴俊睿
至今,該資料庫已促成豐富的研究成果,包含9個大型研究計畫、23篇碩博士論文和25篇期刊論文,涵蓋觀察性研究用於估計(estimation)或介入治療(intervention),或是以機器學習研究用於預測(prediction)。
其中,北醫臨床資料庫參與OHDSI應用於多項跨國研究,例如今年3月一篇發表於《JAMA Network Open》的論文,為跨8國的世代(Cohort)研究,分析用於治療高血壓的雙聯療法。
徐之昇特別指出,未來發展健康大數據研究需注意三大項目。其一,為資料方面,包含電子病歷(EMR)和醫療保險資料(Claim),需使用通用資料模型。其二,為研究使用的科技,例如以OHDSI開發的工具建立估計或預測模型。最後,最重要的是團隊合作,透過國內和國際合作達成多中心資料研究,因此當我們加入OHDSI能有更多跨國研究的機會。
(報導/劉馨香)