物聯(lián)傳媒 旗下網站
登錄 注冊

AI醫(yī)療來襲,患者、機構、數(shù)據科學家分別有哪些新機會?

作者:Jeremy Howard/安妮 編譯
來源:公眾號/量子位
日期:2017-09-27 10:07:04
摘要:技術給醫(yī)護人員和病患提供所需的準確信息,偏遠地區(qū)的醫(yī)務工作者看到世界各地的醫(yī)療研究,讓發(fā)達地區(qū)的醫(yī)生診斷更高效準確,在醫(yī)療診斷中更方便地了解病人及親屬。

  貫穿整個人類史,醫(yī)學一直是門自帶藝術氣質的學科。相較于建立一套標準的診斷治療流程,醫(yī)學的重點一直在每個醫(yī)生的技巧和經驗上。

  雖然近年來,實證醫(yī)學(EBM)和精準醫(yī)學的先驅已經向醫(yī)療領域注入數(shù)據驅動的嚴謹實踐,上面的情景已經改變。但是,大多數(shù)醫(yī)療觀念還是公元前希波克拉底學說的延伸。

  △ 古希臘公元前醫(yī)師希波克拉底雕像,他建立了健康和疾病的平衡學說

  那目前的醫(yī)療現(xiàn)狀如何呢?事實上,世界人口稠密地區(qū)的實際醫(yī)生數(shù)量不足需求十分之一,需要百年時間才能填補。不僅醫(yī)務人員缺口大,并且醫(yī)療水平有限。誤診、延診和過度診斷造成數(shù)百萬病患死亡和數(shù)百億資金的流失。

  好在我們有科技。技術給醫(yī)護人員和病患提供所需的準確信息,偏遠地區(qū)的醫(yī)務工作者看到世界各地的醫(yī)療研究,讓發(fā)達地區(qū)的醫(yī)生診斷更高效準確,在醫(yī)療診斷中更方便地了解病人及親屬。

  這股醫(yī)療科技的中堅力量就是人工智能。尤其是深度學習,已經成為一種強有力的檢測工具,在醫(yī)學影像領域表現(xiàn)驚人。比如谷歌的視網膜病變診斷系統(tǒng)、斯坦福的AI診斷皮膚病算法、Enlitic將深度學習運用到癌癥等結節(jié)檢測里。

  放眼整個AI醫(yī)療布局,患者、醫(yī)務工作者和數(shù)據科學家都面臨著怎樣的機遇和挑戰(zhàn)?未來的醫(yī)療形勢怎樣?那就接著往下看——

  一、挑戰(zhàn)

  1. 標記過的歷史數(shù)據

  有種廣為流傳的普遍說法是,深度學習算法需要大量數(shù)據才有效,這種說法不一定是對的。舉例來說,Enlitic的肺癌算法只掃描了1000多名癌癥患者的數(shù)據,盡管數(shù)據集很小,但它具有有效建模的關鍵特征:

  首先,數(shù)據集中包含了每個病人至少三年的年度掃描數(shù)據,在構建診斷算法時,病情隨時間的變化情況至關重要。

  其次,數(shù)據中包含了放射科醫(yī)生提供的診斷意見,里面包含肺部結節(jié)的位置,算法可以從中快速找到重要信息。

  最后,數(shù)據集中包含確診肺癌三年后每個病人的康復情況,能夠說明患者存活率等信息,幫助構建診斷系統(tǒng)。

  這個項目無法顯示的信息也可能很實用,比如醫(yī)生的治療建議。因為數(shù)據集中不包含對病人的治療干預及病患反應等縱向數(shù)據,因此構建的算法只對診斷有效,不牽扯治療計劃。

  目前,傳統(tǒng)檢測方法仍無法發(fā)現(xiàn)肺部40毫米大小的結節(jié),因此肺癌患者死亡率高達90%。驚喜的是,Enlitic開發(fā)的系統(tǒng)能發(fā)現(xiàn)小于5毫米的結節(jié),使患者的生存率能增加10倍。

  △ 圖中箭頭所指為肺結節(jié)(Lung Nodule)

  目前,這些醫(yī)療數(shù)據信息還零散地分布在多個機構中的不同部門中。不知我們還要多久才能實現(xiàn)跨地區(qū)醫(yī)療記錄整合,可以將多年內所有的檢測、診斷及治療措施全部包含在里面。

  2. 法律保守主義

  不管數(shù)據是集中獲取還是多來源拼湊起來的,一般來說,數(shù)據持有機構對將數(shù)據共享給數(shù)據科學家還非常謹慎。據司法人員透露,泄露病患隱私可能會終結數(shù)據科學家的職業(yè)生涯,還會連帶機構損失數(shù)百萬美元。

  那么,病人是如何看待分享私人數(shù)據的呢?在被問及如果將來可能幫到他人,是否愿意分享自己的數(shù)據時,大多數(shù)病人欣然同意——特別是聽說可能會為自己將來的治療帶來更好選擇時。

  二、患者的新機遇

  1. 病人可控的數(shù)據

  患者有個很清晰的機遇可以選擇:即從不同渠道收集自己的醫(yī)療數(shù)據,包括可穿戴設備、自我報告等。數(shù)據科學家和機構可以讓病人自己選擇將數(shù)據分享給哪些數(shù)據科學家或項目,給他們一個安全的數(shù)據環(huán)境。

      作為回報,他們可以為患者提供:提前享受到醫(yī)學最新突破的治療、財物補貼、數(shù)據怎樣被利用幫助其他患者的信息。

  這是患有罕見或無法治療疾病的患者家屬的新機會:聯(lián)合其他情況相似的病人提供各種數(shù)據。越多病人加入數(shù)據共享,越可能盡快發(fā)現(xiàn)疾病的關鍵信息。

  2. 區(qū)塊鏈

  不同數(shù)據的重要性不能一概而論。

  罕見疾病患者的數(shù)據對治療至關重要,多年長期觀測的數(shù)據比短時間內的數(shù)據更具價值。這就會帶來一些潛在問題,比如有人想通過偽造數(shù)據獲得報酬。

  區(qū)塊鏈技術能讓醫(yī)療數(shù)據記錄變得清晰可查找。根據這一記錄,數(shù)據提供者可根據數(shù)據實用程度獲得獎勵。因此,病人提供的數(shù)據越完整、準確、相關,報酬就越高。

  這也為機構提供了一些有趣的機會。獲得病人許可的機構可為研究人員提供完整的數(shù)據集,從中獲得財物或技術回報。從長期看,病人可以授權機構通過區(qū)塊鏈將數(shù)據傳遞給數(shù)據科學家。

  三、數(shù)據科學家的機會

  數(shù)據科學家都希望拿數(shù)據做些有意義的事,但只有少數(shù)人有這樣的機會,大部分對口工作集中在廣告技術、對沖基金交易和產品推薦領域。

  數(shù)據科學家的挑戰(zhàn)通常包括尋找數(shù)據獲取途徑、了解待解決問題、提供可實現(xiàn)的解決方法。

  為了讓數(shù)據更實用,他們需要進行一系列處理,在實踐中這些步驟通常重復多次:數(shù)據清理、探索性數(shù)據分析(EDA)、創(chuàng)建驗證集、構建模型、分析并檢驗模型。

  為了完成上述步驟,數(shù)據科學家需要一個豐富的分析環(huán)境,在里面可以選擇他們的工具、庫、可視化解決方案。目前,大多數(shù)人用的是R語言或Python。

  通過提供預裝數(shù)據和環(huán)境,數(shù)據科學家能快速找到有意義的數(shù)據。也可能是多人獨立處理一個問題,根據工作效果分得獎勵。

  四、AI醫(yī)療來襲,我們應該怎么做

  1. 數(shù)據收集

  我們需要賦予每個病人收集和維護個人醫(yī)療數(shù)據的能力,包括:實驗室的檢測和影像學研究、診斷、用藥處方、非處方藥和補充劑、其他醫(yī)療干預措施、飲食和鍛煉記錄、家族病史(理想情況下,自動通過鏈接家庭成員自動維護這些數(shù)據)、自我報告進展,比如精力水平、幸福感等,還有基因組學和其他測試。

  這意味著患者數(shù)據也可以從醫(yī)療服務提供者那下載。不論是來自用戶還是服務提供者的數(shù)據,都需要在計劃開始時下載一次,之后可以用API定期追蹤患者情況,或者用各種可穿戴設備的APP獲取他們的數(shù)據了。

  2. 數(shù)據分享

  每個病患都需要處理他們收到的數(shù)據請求,請求一旦增多,病人處理每個單獨請求也會很麻煩。在這種情況下,我們可以為病人設置接收規(guī)則,自動判斷接受、拒絕還是需要人工干預。

  每份數(shù)據都需用能溯源的方式打上來源標簽。當然,一些醫(yī)療數(shù)據存儲量很大,它不一定被存儲在病人的設備上。

  一旦患者允許項目訪問他們的數(shù)據,這些數(shù)據就需要對研究者公開。研究人員需要的分析環(huán)境要足夠豐富。這將向他們展示問題的全面信息,并展示如何訪問項目數(shù)據。

  3. 巨大的機會

  讓病人控制數(shù)據,讓數(shù)據科學家有地方施展拳腳是個不錯的想法。

  還有一個更大的機會,即當模型可被持續(xù)更新時時,將所有的模型組合在一起。每個數(shù)據科學家的特征工程步驟可被保存,并提供給后續(xù)研究使用(當被復用時,他們將得到獎勵)。此外,他們預先訓練的模型激活函數(shù)可被自動引入新模型預測能力是否提升。

  讓新數(shù)據持續(xù)提升現(xiàn)有模型需要所有數(shù)據源的含義和格式相同。雖然這很復雜,但有經驗的數(shù)據產品經理需要有先前經驗預先確定數(shù)據源格式或語義的更改,并且持續(xù)測試模型。

  通過復用預先訓練的模型,我們從組合數(shù)據集中受益,且沒有任何邏輯或隱私問題。

  這也意味著我們也可以高效攻破數(shù)據量稀少的罕見疾病和兒科疾病。在這些情況中,可用預訓練模型分析數(shù)據,只需要很少的參數(shù)就能組合它們。

  隨著醫(yī)療行業(yè)的進步,這種收集和分析數(shù)據的方法將帶來新的見解,并為醫(yī)務工作者和患者提供所需信息的清晰集合。

人物訪談