張桐碩
武警特色醫(yī)學中心
人工智能正在把我們拉入一個由數據驅動的世界,醫(yī)學服務的發(fā)展邏輯也被智能時代的潮流深刻影響。關于人工智能未來如何推動檢驗醫(yī)學的變革,可翻看筆者此前的介紹:人工智能呼嘯吹來,檢驗醫(yī)學何以御風而行。
機器學習是人工智能研究領域的一個分支,也是當下實現人工智能的主要手段。
拋開那些專業(yè)名詞堆砌成的教科書式定義,形象地來說,機器學習通過計算機模擬了一個勤奮的孩子自學成才的過程:找來某個課題已有的數據素材,從中反復歸納潛在規(guī)律,培養(yǎng)洞察力,以后面對同樣課題出現的未知數據,便能做出貼近實際的判斷和預測。
從已知提煉新知,進而推測未知,機器學習是這類算法的總稱。
圖1 機器學習是一門從統(tǒng)計學和計算機科學的混合土壤中茁壯成長起來的學科
就像孩子們各有各的學習天賦和擅長科目,不同種類的機器學習算法也有各自的數據處理方式和適用場景。機器學習的豐富性使它可以嵌入到生活的方方面面,在醫(yī)療健康領域更是前景廣闊,而這需要保質保量的數據做支撐。如此一來,影像科和檢驗科這類數據大戶的優(yōu)勢凸顯:
第一,手握標準化的原生數據,獲取省時省力;
第二,備有臨床診斷結果作為數據標簽。
醫(yī)學影像分析已成為機器學習競相進軍的主陣地,相比而言,檢驗醫(yī)學還是一片藍海市場。有志于精進業(yè)務的檢驗工作者值得接觸一些機器學習的知識,學科交叉的電光火石間,或許能為職業(yè)發(fā)展另啟一扇大門。
筆者在此聊聊對機器學習的心得,供檢驗界同道入門之用。
數據如礦產,封藏入土的狀態(tài)并不創(chuàng)造價值,挖掘出來應用到實際場景中才有價值。把數據轉化為效益的思路演變?yōu)榇笮衅涞赖倪\營模式——數據變現。
“數據變現”興起于大數據和互聯(lián)網行業(yè),大有遷移至各行各業(yè)的燎原之勢。檢驗醫(yī)學“數據變現”的目標,不僅包括經濟上開源節(jié)流,重點在于提高服務質量和科研水平。
自動化檢驗技術突飛猛進,檢驗實驗室每天流經的“數據”很多,問題是“變現”的路徑很少,難以發(fā)揮與自身數據大戶地位相匹配的貢獻。
報告單的發(fā)出往往就意味檢驗工作的終結,空留一堆龐雜的信息,卻苦于缺乏挖掘數據財富的技術,感覺有點像守著金礦的乞丐。檢驗在醫(yī)院學科群體中的影響力和學術地位偏低,與之不無關系。
圖2 檢驗醫(yī)學的尷尬處境:家里有礦,奈何沒有趁手的掘金利器
結合機器學習的性能特點和已發(fā)表的研究案例,筆者可以預見,機器學習加持下的檢驗醫(yī)學將跨出現有的一畝三分地,服務范圍從圍繞標本的測定,延伸到檢驗前和檢驗后的整個鏈條。
針對不同疾病篩選最優(yōu)標志物,或優(yōu)化標志物的組合模式,指導臨床醫(yī)師合理選擇檢驗項目。
賦能計算機視覺,提高對各種體液標本和骨髓中細胞形態(tài)的鑒別能力。形態(tài)學檢驗高度依賴人工經驗,乃自動化分析最后的難關,開始被深度學習算法所撬動。
建立輔助診斷模型,給出與數值結果緊密配套的個體化報告解讀:發(fā)病風險、進展趨勢、預后評估、追加相關檢查的建議等。提供咨詢服務,與臨床科室深層次地合作。
不僅于此,機器學習在自動審核和危急值預警中的應用呼聲也很高。整合病人的歷史檢驗數據和臨床信息要素,尋找多個項目間的關聯(lián)模式,從而制定出個性化的參考區(qū)間和更加完善的審核規(guī)則,突破LIS系統(tǒng)僅依據單一項目結果進行異常提醒的局限。
退一步講,即便機器學習工具難以超越經驗豐富的人類專家,但它運行狀態(tài)穩(wěn)定,不知疲倦地為檢驗工作者提供決策參考,我們的時間和精力便能被解放出來,投身到更具挑戰(zhàn)性的目標中去。
這一輪人工智能的算法革命接近完成,成熟的機器學習工具已經走出實驗室,轉向應用的細分領域。檢驗界應該抓緊機器學習落地和推廣的黃金時間,直接拿來現有的成果,找到它在檢驗工作中的運用空間。
欲將機器學習為檢驗所用,必先認清我們的能力邊界。
要檢驗人搞清楚硬核的機器學習理論推導和代碼著實困難,但這并不妨礙我們把它用好。對非專業(yè)人士而言,了解各種機器學習算法擅長解決的問題或適用的業(yè)務場景,還是有可能的,剩下就是有的放矢地借助專業(yè)平臺,探索領域內關心的問題。
筆者梳理了檢驗領域最常用的多指標聯(lián)合診斷的方法體系,按產生年代和復雜程度,劃分為四個層級。以此為例,帶大家扒一扒機器學習所處的段位,摸一摸檢驗人運用它的抓手。
圖3 多指標聯(lián)合診斷模型家族“四世同堂”,一代更比一代強
互補性指標提高診斷效率的策略林林總總,編入大學教材屬于必學內容的唯這一種。聯(lián)合試驗是診斷模型家族中的初級版,其方法有兩類。
?平行試驗(俗稱“并聯(lián)”):多個指標中只要一個呈陽性即診斷為陽性。靈敏度高、誤診率低。
?系列試驗(俗稱“串聯(lián)”):全部指標皆呈陽性才診斷為陽性。特異度高、漏診率低。
聯(lián)合試驗簡單粗暴,用不著公式計算,憑一雙眼就能輕松駕馭,但缺點也明顯:每個指標的界值必須事先確定,靈活性大打折扣診;靈敏度和特異度不能兼顧,誤診和漏診難以平衡。
以logistic回歸、線性判別分析為代表的多元統(tǒng)計分類法穩(wěn)居主流,時常翻閱臨床研究類文獻的同學肯定對其臉熟。
這類進階版診斷模型的原理簡明——構建一個函數,將多個指標的診斷信息融合成一個新指標,使其診斷準確度優(yōu)于單個指標。
世界三大統(tǒng)計軟件SPSS、SAS、Stata均可完成,檢驗工作者稍加培訓便能熟練操作。
統(tǒng)計學對追求對函數的線性簡化,固然便于對復雜問題的數學描述,但處理現實中那些非線性變化的檢驗指標就力不從心了。比如某些癌癥患者隨病情進展,血清球蛋白水平呈倒“U”型變化,早期受病灶刺激上升,晚期則在機體免疫抑制狀態(tài)下回落,對模型擾動很大。
機器學習脫胎于統(tǒng)計學,但不同于統(tǒng)計學的模型驅動的路子,機器學習是典型的數據驅動的思維方式,它拋棄了因果邏輯、數據分布假定和嚴謹明確的數學形式,曾被視為直接從一堆數據出發(fā)做預測分析的“野路子”。
在數據膨脹、計算能力極大提升的新時代,接地氣、重實戰(zhàn)的機器學習技術突飛猛進,強勢逆襲。神經網絡、貝葉斯網絡、支持向量機、隨機森林等一批經典的機器學習算法涌入檢驗診斷領域,在高水平的SCI論文中蔚然成風,被封為診斷模型中的高階版。
機器學習擅長處理模糊數據和非線性映射問題,另一個優(yōu)勢在于,支持不斷累加的數據對當前模型迭代改進,而無需重復訓練歷史數據(流式學習算法),能實時“刷新”診斷水準。
不少軟件能拿來做機器學習。
名揚醫(yī)學界的SPSS軟件就自帶神經網絡和決策樹的功能模塊,MeV等生物信息學分析工具也能做一些簡單的機器學習,它們是機器學習工具中的傻瓜相機,只需按步驟點擊對話框,但畢竟對話框里只有基礎選項,無法比擬編程語言的臨機應變。
R語言、Python和Matlab幾款編程語言在生物科研圈人氣漸盛,玩轉機器學習不在話下。它們建有活躍的線上社區(qū),遍地共享程序包,我們搜到所需的直接調用即可。當然,至少要看懂程序的大體架構,別人的代碼總要微調一下,才能運行自己的數據。
深度學習是一種特殊的機器學習,從傳統(tǒng)的人工神經網絡衍生而來,儼然一顆人工智能領域最耀眼的明星,后一節(jié)將有詳細介紹。
深度學習對小樣本問題無法入手,但隨著樣本規(guī)模增大,深度學習愈發(fā)展現出勝于傳統(tǒng)機器學習的強大性能。
初始檢驗指標或形態(tài)學圖像經多個隱含層網絡結構的拆解、過濾、轉化,對診斷結果有更本質的刻畫,從而形成優(yōu)異的樣本分類能力。
如果說經典機器學習距離醫(yī)學生的高度,一己之力跳一跳還能夠著,那么只有借用爬梯,才能摘取深度學習的果實。
深度學習算法消耗的計算資源和時間驚人,依賴高端硬件,而經典機器學習算法用普通個人電腦就能運行;操作上也面臨高門檻,需要將患者的檢驗結果和對應的診斷信息正確提交給深度學習平臺,比如TensorFlow、H2O、Weka等,而掌握這類面向深度學習量身開發(fā)的服務平臺并非易事。
因此,實現環(huán)節(jié)一般交由專業(yè)人士或機構,并借用大公司的硬件軟件系統(tǒng)和云平臺。檢驗工作者學習深度學習的主要目的,不在于親自操刀,而是與外援團隊順暢溝通,評估乙方提供方案的合理性。
機器學習種類紛繁、知識零散,走馬觀花,難免抽象枯燥。但當我們探向縱深,了解了這些機器學習算法的演進脈絡,知道了它們曾經如何被塑造,又將如何改變世界,必然嘆服于困難和瓶頸所催生出的種種解決方案的精妙,對機器學習產生親切感。
眾多算法流派中,筆者擷取著名的兩支作為案例,帶大家領略一下機器學習的沿革。
圖4 神經網絡和隨機森林的發(fā)展簡史——花開兩朵,各表一枝
人工神經網絡算法是一種仿生方法,以工程技術手段模擬人腦的神經網絡,利用大量的非線性處理器來模擬眾多的神經元,用處理器之間的連接關系來模擬神經元之間的突觸行為。
神經網絡的數學本質是一個多層復合函數,由輸入層、輸出層,以及兩者間的隱含層構成。
當隱含層只有一個神經元時,類似古老的logistic回歸的作用,是神經網絡進化的起點;
當一個隱含層有多個神經元時,可看作logistic回歸的分身術,根據萬能逼近定理可以擬合任一函數,便是通常意義上的神經網絡,但在產業(yè)應用中受限而轉入低潮;
隱藏層比較多(3層以上)的神經網絡叫做深層神經網絡,亦稱深度學習,它可以逐層完成數據特征提取,完成更加艱難的任務。其概念于2006年提出后大放光芒,駛入應用快車道,如今深度學習已開枝散葉,家族繁盛,主要有以下幾類。
?卷積神經網絡:用于圖像識別,如醫(yī)學影像讀片。
?循環(huán)神經網絡:用于語音識別和文本語言處理。
?生成對抗網絡:用于風格遷移,如模仿梵高繪畫風格,明星自動換臉。
?深度強化學習:用于決策和博弈,如自動駕駛,訓練出擊敗人類圍棋冠軍的阿爾法狗,在星際、魔獸等電競比賽中身手不凡。
……
決策樹是一種解決多類分類問題的判別模型,它很符合人類的思維習慣。
通過訓練制定出一組嵌套的規(guī)則,這種決策分支結構很像一棵樹的枝干。決策過程從根節(jié)點開始,待測數據與每個決策節(jié)點進行比較,選擇進入下一級比較分支,直到葉節(jié)點作為最終的決策結果。
可惜“獨木不成林”,實現決策樹的算法幾經改進,依舊克服不了固有缺陷。直到2001年提出決策樹的擴展版——隨機森林,通過匯總大量決策樹提高模型的分類精度。
首先對訓練樣本和特征變量隨機抽樣,生成千萬棵決策樹,再以少數服從多數的投票機制,聯(lián)合預測結果。
隨機森林對離群值、過擬合和多重共線性不敏感,穩(wěn)定性強,可謂林海莽莽,不懼風雨摧折。
從一個神經元到一張神經分布網,從一棵樹到一片森林,兩家算法相似的底層機理一同詮釋了“大量出奇跡”,但與海量互相牽涉的組成單元伴隨而來的,是可解釋性被剝奪,算法系統(tǒng)幕后的運作細節(jié),觀察和追蹤起來非常困難。
機器學習的“黑箱”中,充滿了人類無法描述的“暗知識”,而治病救人的醫(yī)學,恰恰最需要確鑿無疑、令人信服的因果聯(lián)系做支撐。如何接受醫(yī)學標準的審視,是橫在機器學習面前的難關。
雖說機器學習具備從數據中反復訓練、自動學習的能力,但并不意味著我們“喂”給機器數據后,就可以當甩手掌柜了。
機器學習經常做費力不討好的盲目訓練,有必要引入宏觀調控手段:一是降維,二是參數優(yōu)化,兩者貫穿于幾乎所有機器學習類型。大家應趁早建立起降維和參數優(yōu)化的意識。
用以描述樣本的特征變量的數目(維數)在大數據時代普遍增多,機器學習模型的復雜度和訓練所需的樣本量隨之呈指數倍增,終將不堪重負,遭遇棘手的“維數災難”。
降維,顧名思義,把高維數變換到低維數,也就是減少變量而盡量保留原有重要信息。
降維的方法眾多,思路迥異,仿佛游目于山水幻象之間,在不同的人眼中還原成不同的風光……
圖5 降維,如同對這煙云籠罩的山水進行一番去粗取精、去偽存真的偵辨
聚類分析的目標是將相似性(距離或相關系數)高的變量歸為同一類或簇。以筆者所做的一項卵巢癌輔助診斷的研究為例,收集了二十多項檢驗指標。如圖6,這些指標大體分為三類,再從每類中挑選一二個指標,作為下一步建模的輸入變量。聚類分析不產生新變量,只是幫助找出有代表性的變量。
圖6 檢驗指標的層次聚類分析結果
主成分分析將初始變量線性組合,合成少數幾個新的綜合變量(主成分)。繼續(xù)上面卵巢癌診斷的案例,筆者選取特征值排名前三的主成分代表初始檢驗指標的信息,列舉第一個主成分的表達式:
P1=0.615×CA125+0.06×CA15-3+0.657×CA72-4+…-0.123×TC+0.144×LDL-C/HDL-C
主成分與初始變量的聯(lián)系一目了然,檢驗指標的權重系數反映了其對主成分的影響力。主成分1主要反映了可歸納為婦科腫瘤標志物和激素水平,主成分2反映了血糖和血脂代謝情況,主成分3反映了炎癥狀態(tài)。
t-SNE是一種非線性降維方法,它基于鄰域圖上隨機游走的概率分布,適合對高維數據的二維或三維可視化。筆者利用t-SNE將20多個檢驗指標轉換為3個新變量,繪制成三維散點圖,圖7可見卵巢癌組與各對照組的區(qū)域劃分較明顯。
新變量與初始變量之間復雜的多項式關系,致使我們難以直觀地理解新變量的專業(yè)意義。
圖7 檢驗指標經t-SNE降維后將樣本分成幾簇
參數是影響機器學習性能的關鍵,機器學習的訓練過程本質上是一個尋找最優(yōu)參數的過程。
比如神經網絡模型,就有隱含層神經元的數量、學習速率、連接權值和閾值等一系列參數需要正確配置。
奈何開啟不了上帝視角,不能一步到位給定每個參數的最佳值,既然你我皆凡人,那就腳踏實地去搜索吧——根據專業(yè)知識和經驗預估出參數初始值,然后在運算過程中反復試錯調整,逐步逼近最優(yōu)參數。
理論上“條條大路通羅馬”,算法一通七拐八繞總能到達最優(yōu)參數的目的地,但既耗時又占內存,中間還易陷入局部最小。
與其盤曲小徑跑斷腿,不如規(guī)劃路線切入筆直大道。因此,通常會引入優(yōu)化算法,來縮小參數集的范圍,自適應地提升參數搜索效率。
現代智能算法的用途主打參數優(yōu)化,包括:模擬退火算法、免疫算法、遺傳算法、蟻群算法、粒子群算法等。聽聽命名便知,這些算法的開發(fā)靈感來自于自然現象或生物學行為,屬于啟發(fā)式算法,具體原理不做贅述。
回到主題,身在檢驗醫(yī)學行業(yè)的我們,借力機器學習完成“數據變現”的優(yōu)勢何在?
依筆者看來,不在于算法,因為各大科技公司競相推出了開放性人工智能平臺,算法往往是開源的;不在于算力,因為云計算服務越來越便宜;
我們的核心優(yōu)勢要構建在數據供應上、在對工作問題的發(fā)覺上、在把行業(yè)痛點跟機器學習工具的對接上。
檢驗乃至其他醫(yī)務工作者,下功夫去了解機器學習的概念、流派、發(fā)展簡史,未必就能上手運行算法以解應急之需。
跨出自己的知識圈,擁抱機器學習的真正意義,是培養(yǎng)數據思維。深刻地認識日常工作中產生的數據,日后才可能以數據指引業(yè)務的改善,形成“數據變現”的成長模式。
一時一地的代碼調試受挫,不必沮喪,機器學習背后的蘊含的數據思維和方法論,才讓我們長期受用。
說明:本文為原創(chuàng)投稿,不代表國際檢驗醫(yī)學傳媒、檢驗醫(yī)學微信平臺觀點。轉載時請注明來源及原創(chuàng)作者姓名和單位。
編輯:徐少卿 審校:陳雪禮