資訊爆炸的時代,你準備好了嗎?

善用大數據,醫療更精準–《醫療大數據》

撰文記者 林以璿
日期2017-09-21
EnglishFrenchGermanItalianPortugueseRussianSpanish
《醫療大數據》

醫療實務與涵括醫療實務的產業正在經歷急遽轉變。不過,雖然健康照護體系的變化已廣泛受到關注與討論,健康照護這個產業在5年、10年、甚至15年內的發展,卻還是所知甚少。

文/馬科尼、萊曼    責任編輯/林以璿


綜觀歷史演進,創建資料的工作,是推動科學進步的重要環節,卻經常因為成本考量而受到阻礙。第谷(Tycho Brahe, 1546-1601)花費數十年蒐集天體觀測資料,後來克卜勒(Johannes Kepler, 1571-1630)才得以利用這些資料,推論出行星運動定律。

過去一個世紀以來,各領域開始大量地投資「數據蒐集」這項工作,發展出的工具包羅萬象,例如促進現代粒子物理學發展的大型加速器、監測地球與宇宙的人造衛星、應用於基因體定序工程的技術;公共衛生領域的世代研究及社會科學調查,參與人數動輒高達幾十萬;在電子病歷的全面實施方面,大量國家部門與公司,也投注了大量的心力。

隨著基礎建設逐漸完備、生物醫學數據蒐集成本大幅下降,再加上群眾外包模式極具發展,資料創建工作不再受限於成本,反而蓬勃發展。資料可用性的概念已然跳脫既有範疇,如何更有效控制、管理、分析與解讀這些數據,成為關鍵。

健康照護體系的發展方向,與電腦資訊技術息息相關。許多此類書籍的作者,著重的是電腦技術的革新,但《醫療大數據》著重的是目前與未來,可以如何使用這些經過電腦處理的材料,亦即數據與數據分析技術。

本書作者群談到將個人健康資訊整合進「大數據」之中的方法,目的在於改進健康照護服務產業的品質、增進與顧客間的互動。健康照護服務產業才剛開始體認到健康照護服務的資訊錯綜複雜,卻具備無窮的發展潛力。

作者之一的強森(Bruce Johnson)明確指出:「大數據這個概念的重點,在於任一機構,深入分析手上的資料後,能夠獲得的價值利益。換言之,大數據的概念不在於某個資料庫或資料架構,而是各種用以分析、搾取資料價值的方法。在健康照護領域中,機構必須真正瞭解該如何取得、管理和利用資料,才能發揮大數據的功效。」

目前,社會上要求滿足這項新興需求的聲浪日漸高漲。學術界已經出現「資料科學」學科,產業界更是爭相網羅資料科學家。

各國政府帶頭 積極為「大數據」布局

美國國家科學基金會(NSF)與國家衛生研究院(NIH)等政府機構,投資數億美元培養人才、建立流程、規劃方法、並製造工具,蒐集兆位元組以外的龐大數據,希冀能發揮「大數據」的優勢。

例如,美國國家衛生研究院便設置新的資料科學主管來監管「大數據知識(BD2K)計畫」,預計利用大量補助經費來挹注資金,協助生物醫學科學家,更妥善地利用這些研究機構蒐集的大數據。

2013年,美國產官學界已公開徵求資訊說明書,並舉辦工作坊,召集大數據專家與產業領袖,討論各領域資金分配的優先順序,另也針對人力的訓練與發展,制定方向。

幾經磋商後,得出的一項清楚共識,即為「大數據所需的科學知識必須跨領域」,不僅融入電腦科學、統計學、應用數學、工程學、資訊科學、醫學、物理學、公共衛生學,甚至還得涵括生物學、神經科學、社會科學等不同領域的科學。

另一項共識則為訓練目標不能侷限於培養這些學門的專家,甚至不能只是具備運用大數據技能的專家。最急切的目標應是,打造能整合各領域且能有效合作的團隊,以及訓練出了解2種以上學門知識或具備π型(跨領域)特質的人才。

最後,可以發現,現今趨勢往「數據密集」的方向發展,各領域的科學勢必將處理大量數據,因此培訓內容必須面面俱到,稱職的資料科學專家,還要能因應迫切需求,提出全新方法與工具。隨著資料的數量與複雜程度日益增加,此類專業技能必須不斷精進。

大數據時代 為專業讀者尋找新定位

《醫療大數據》的目標讀者,是即將需要發揮大數據潛能的關鍵人才,例如健康照護與醫學領域的專業人士、科學家及學生。

本書闡述了健康照護人員與機構面臨的現況,呈現目前將資料充分應用在醫療實踐上的方法。蒐羅了運用病例與行政紀錄而推出創新方式的案例,為讀者的醫療大數據知識基礎扎根。

全書分成了3個部分,醫療資料的來源與使用、營業實務及人力訓練,以及資料分析及分析架構。

第一部勾勒了生物醫學類大數據的全貌,說明醫療資料的來源與使用。7名專家從不同的側重點,展現豐富多樣的資料來源與類型,解答如何促進現代健康照護的實踐,與研究環境的發展,同時指出資料在有效整合與分發方面的艱鉅挑戰與急切需求。

此7章也呈現使用資料的多種方式,資料不僅可以應用在臨床決策、風險評估;透過有效使用,還可用於推廣健康照護轉型的引導訓練;或可用於評估健康狀況不佳造成的社會風險,規劃介入與投資的因應措施。

第二部檢視了與資料使用息息相關的議題,內容涵蓋資料治理與資料架構,影響健康照護方式與有效程度的公共政策,以及如何運用新興的資訊擷取技術,來處理現有及新累積的資料。

複雜資料內,特定模式之間的互動方式,是個難以釐清的問題。本書最後一部,針對這個困境,舉出分析工具的運用範圍,介紹了互動視覺化領域的應用成果、開放原始碼領域如R統計軟體計畫的開發、影像與文字報告等為結構化資料的運用方法。

透過本書作者群提供的資訊,讀者能夠掌握瞭解與醫療大數據相關的議題。

美國國家科學院(National Academy of Science)曾經提到,應如何教導學生擷取大數據的價值。這背後的涵義,其實是我們應該要知道學生該具備那些知識。

在健康照護產業中,投入大數據及醫療分析技術的我們,目前面臨的主要挑戰,正是如何向不同的醫療專業人員,展現醫療大數據分析技術的附加價值。

醫療大數據
著者           馬科尼、萊曼
譯者           何承恩等
出版社       遠見天下文化出版股份有限公司
出版日期    2017年7月31日
定價           600元
頁數           424頁
ISBN          978-986-479-270-2

>>本文刊登於《環球生技月刊》Vol. 47