對(duì)于大部分臨床醫(yī)生來(lái)說(shuō),往往是沒(méi)有能力去做基礎(chǔ)科研的,因?yàn)闆](méi)有時(shí)間、經(jīng)費(fèi)和實(shí)驗(yàn)室。但是每家單位對(duì)文章的要求又是這么強(qiáng)硬,沒(méi)有文章就無(wú)法進(jìn)職稱,該怎么辦?
臨床醫(yī)生最大的優(yōu)勢(shì)就是手握第一手的臨床資料,比如此次新冠疫情,最初掌握的臨床資料已經(jīng)衍生出一大批lancet、nejm頂級(jí)期刊,給疫情防控貢獻(xiàn)了巨大力量,所以,只要你會(huì)合理的統(tǒng)計(jì)分析方法,就用你身邊“稀松平?!钡呐R床數(shù)據(jù)一樣能發(fā)表頂級(jí)研究成果。從本篇文章開(kāi)始,我們會(huì)推出一系列的教程,教大家如何從一堆無(wú)意義的數(shù)據(jù)入手,挖掘出有臨床意義的統(tǒng)計(jì)模型,換回高分SCI文章。本篇內(nèi)容,我們就從導(dǎo)論開(kāi)始講起。
對(duì)于醫(yī)生來(lái)說(shuō),如果有某種“特定功能”來(lái)預(yù)測(cè)患者是否會(huì)有未知結(jié)果,那么許多醫(yī)療實(shí)踐模式或臨床決策都會(huì)改變。幾乎每天我們都會(huì)聽(tīng)到這樣的嘆息:“如果我能提前知道,我當(dāng)然不會(huì)這樣做!”。例如,如果我們可以預(yù)測(cè)患有惡性腫瘤的患者對(duì)某種化療藥物耐藥,那么我們將不會(huì)選擇給患者服用該藥物。如果我們可以預(yù)測(cè)患者在手術(shù)過(guò)程中可能出現(xiàn)大出血,那么我們將謹(jǐn)慎操作并為患者準(zhǔn)備足夠的血液制品;如果我們可以預(yù)測(cè)高脂血癥患者不會(huì)從某些降脂藥物中受益,那么我們可以避免許多無(wú)意義的醫(yī)療干預(yù)。
作為一種評(píng)估風(fēng)險(xiǎn)和收益的定量工具,臨床預(yù)測(cè)模型可以為醫(yī)生,患者和衛(wèi)生管理人員的決策提供更客觀,準(zhǔn)確的信息,因此其應(yīng)用變得越來(lái)越普遍。在這種剛性需求下,臨床預(yù)測(cè)模型的研究方興未艾。
當(dāng)前的醫(yī)學(xué)實(shí)踐模式已經(jīng)從經(jīng)驗(yàn)醫(yī)學(xué)發(fā)展到循證醫(yī)學(xué),再到精準(zhǔn)醫(yī)學(xué)。數(shù)據(jù)的價(jià)值從未如此重要。在大數(shù)據(jù)時(shí)代,數(shù)據(jù)采集,數(shù)據(jù)存儲(chǔ)和分析以及預(yù)測(cè)技術(shù)的飛速發(fā)展使得個(gè)體化醫(yī)療的愿景變得越來(lái)越清晰。從醫(yī)療實(shí)踐模式的演變來(lái)看,準(zhǔn)確預(yù)測(cè)某種臨床結(jié)果的可能性也是當(dāng)前精準(zhǔn)醫(yī)療模式的內(nèi)在要求。
因此,我們將從臨床預(yù)測(cè)模型的概念、應(yīng)用現(xiàn)狀、構(gòu)建方法和過(guò)程、臨床預(yù)測(cè)模型的分類、開(kāi)展臨床預(yù)測(cè)模型研究的必要條件和存在的問(wèn)題等方面對(duì)臨床預(yù)測(cè)模型的研究進(jìn)行講解。
臨床預(yù)測(cè)模型是指使用參數(shù)/半?yún)?shù)/非參數(shù)數(shù)學(xué)模型來(lái)估計(jì)受試者當(dāng)前患有某種疾病的概率或?qū)?lái)發(fā)生某種結(jié)果的可能性。可見(jiàn),臨床預(yù)測(cè)模型是通過(guò)已知來(lái)預(yù)測(cè)未知的,該模型是一個(gè)數(shù)學(xué)公式,即利用已知特征通過(guò)該模型計(jì)算未知結(jié)果發(fā)生的概率。
如果把未知定義為Y,已知定義為X,那么這個(gè)關(guān)系即像我們即將講到的回歸分析一樣?;貧w分析的統(tǒng)計(jì)性質(zhì)是尋找“定量因果關(guān)系”。簡(jiǎn)單來(lái)說(shuō), 回歸分析是X對(duì)Y的影響程度的定量表征。回歸分析包括很多種統(tǒng)計(jì)模型,所以,下面的文章中,統(tǒng)計(jì)將會(huì)是我們講解到的主要內(nèi)容,這是數(shù)據(jù)建模和項(xiàng)目設(shè)計(jì)的關(guān)鍵,也是數(shù)據(jù)分析技術(shù)中最苛刻(要求最高)的部分。
根據(jù)我們研究的臨床問(wèn)題,臨床預(yù)測(cè)模型主要包括診斷模型、預(yù)后模型和疾病發(fā)生模型。從統(tǒng)計(jì)學(xué)的角度來(lái)看,只要臨床問(wèn)題的結(jié)果(Y)可以被特征(X)量化,就可以構(gòu)建預(yù)測(cè)模型。
橫斷面研究中常見(jiàn)的診斷模式是側(cè)重于研究對(duì)象的臨床癥狀和特征,以及診斷某一疾病的概率。
預(yù)后模型側(cè)重于特定疾病在特定時(shí)間段內(nèi)復(fù)發(fā)、死亡、殘疾和并發(fā)癥等結(jié)果的概率。這種模型在隊(duì)列研究中很常見(jiàn)。
還有另一種類型的預(yù)測(cè)模型,叫做疾病發(fā)生模型,它是根據(jù)受試者的一般特征來(lái)預(yù)測(cè)未來(lái)是否會(huì)發(fā)生某種疾病,這在隊(duì)列研究中也很常見(jiàn)。
診斷模型、預(yù)后模型和疾病發(fā)生模型之間有許多相似之處。其結(jié)局事件通常是二分類數(shù)據(jù),其效應(yīng)指標(biāo)是結(jié)局發(fā)生的絕對(duì)風(fēng)險(xiǎn),即發(fā)生的概率,而不是結(jié)局發(fā)生的相對(duì)風(fēng)險(xiǎn),比如相對(duì)風(fēng)險(xiǎn)(RR)、比值比(OR)或風(fēng)險(xiǎn)比(HR)等指標(biāo)。在模型的技術(shù)層面,我們將面臨預(yù)測(cè)因子的選擇、建模策略的制定,以及模型性能的評(píng)估和驗(yàn)證。
背景部分介紹了臨床預(yù)測(cè)模型在醫(yī)學(xué)研究和實(shí)踐中的廣泛應(yīng)用。借助臨床預(yù)測(cè)模型,臨床研究人員可以更準(zhǔn)確地選擇合適的研究對(duì)象,患者可以做出對(duì)自己更有利的選擇,醫(yī)生可以做出更好的臨床決策,衛(wèi)生管理部門(mén)可以更好地監(jiān)控和管理醫(yī)療服務(wù)質(zhì)量,更合理地配置醫(yī)療資源。臨床預(yù)測(cè)模型的效能幾乎完全反映在疾病的三級(jí)預(yù)防體系中:
臨床預(yù)測(cè)模型可以根據(jù)當(dāng)前的健康狀況,為患者和醫(yī)生提供未來(lái)診斷特定疾病的量化風(fēng)險(xiǎn)值(概率),為健康教育和行為干預(yù)提供更直觀和更有力的科學(xué)工具。例如,基于弗雷明漢心臟研究的弗雷明漢心血管風(fēng)險(xiǎn)評(píng)分(the Framingham Cardiovascular Risk Score)闡明了降低血脂和血壓可以預(yù)防心肌梗死。
診斷模型通常采用無(wú)創(chuàng)、低成本、易獲取的指標(biāo)來(lái)構(gòu)建具有高靈敏度和特異性的診斷手段,踐行“早發(fā)現(xiàn)、早診斷、早治療”的理念,具有重要的衛(wèi)生經(jīng)濟(jì)學(xué)意義。
預(yù)測(cè)模型提供了疾病復(fù)發(fā)、死亡、殘疾和并發(fā)癥發(fā)生概率的定量估計(jì),指導(dǎo)對(duì)癥治療和康復(fù)計(jì)劃,預(yù)防疾病復(fù)發(fā),降低死亡率和殘疾,促進(jìn)功能恢復(fù)和生活質(zhì)量。
臨床實(shí)踐中有幾種成熟的預(yù)測(cè)模型。例如,F(xiàn)ramingham、QRISK、PROCAM和ASSIGN scores都是著名的預(yù)測(cè)模型。惡性腫瘤的TNM分期系統(tǒng)是最具代表性的預(yù)測(cè)模型。TNM的最大優(yōu)勢(shì)在于它簡(jiǎn)單快捷,但最大的問(wèn)題是預(yù)測(cè)不夠準(zhǔn)確,這與臨床醫(yī)生的期望值相差甚遠(yuǎn)。臨床實(shí)踐中,對(duì)預(yù)測(cè)工具的使用需求遠(yuǎn)遠(yuǎn)不局限于預(yù)測(cè)疾病的發(fā)生或預(yù)測(cè)患者的預(yù)后這兩方面。如果我們能提前預(yù)測(cè)病人的病情,比如肝癌病人,如果我們能提前預(yù)測(cè)其是否有微血管浸潤(rùn),這可能有助于外科醫(yī)生在標(biāo)準(zhǔn)切除和擴(kuò)大切除這兩個(gè)完全不同的切除方式之間作出選擇。術(shù)前新輔助放化療是T1-4N 中低位直腸癌的標(biāo)準(zhǔn)治療方法。然而,在臨床實(shí)踐中發(fā)現(xiàn),根據(jù)術(shù)前影像學(xué)檢查判斷的淋巴結(jié)狀態(tài)不夠準(zhǔn)確,具有較高的假陽(yáng)性或假陰性。在放療和化療之前,是否有可能根據(jù)已知的特征準(zhǔn)確預(yù)測(cè)患者的淋巴結(jié)狀態(tài)?這些臨床問(wèn)題都可以通過(guò)構(gòu)建合適的預(yù)測(cè)模型來(lái)解決。
冠心病的疾病預(yù)防
臨床預(yù)測(cè)模型并不像擬合統(tǒng)計(jì)模型那么簡(jiǎn)單。從模型的建立、驗(yàn)證、評(píng)價(jià)到應(yīng)用,有一個(gè)完整的臨床預(yù)測(cè)模型研究過(guò)程。許多學(xué)者討論了臨床預(yù)測(cè)模型的研究方法?!缎呐K雜志》(Heart Magazine)最近發(fā)表了一篇綜述,作者以心血管疾病風(fēng)險(xiǎn)評(píng)分(CVD)為例,探討了如何借助可視化圖形和六個(gè)重要步驟構(gòu)建疾病預(yù)測(cè)模型:
(一)選擇一組預(yù)測(cè)因子作為潛在的心血管疾病影響因素,并將其納入風(fēng)險(xiǎn)評(píng)分;
(二)選擇合適的統(tǒng)計(jì)模型,來(lái)分析預(yù)測(cè)因子與心血管疾病的關(guān)系;
(三)從現(xiàn)有預(yù)測(cè)因子中選擇具有顯著意義或足夠重要的變量,將其納入風(fēng)險(xiǎn)評(píng)分;
(四)構(gòu)建風(fēng)險(xiǎn)評(píng)分模型;
(五)評(píng)價(jià)風(fēng)險(xiǎn)評(píng)分模型;
(六)解釋風(fēng)險(xiǎn)評(píng)分在臨床實(shí)踐中的應(yīng)用。
作者結(jié)合文獻(xiàn)報(bào)道和個(gè)人研究經(jīng)驗(yàn),總結(jié)了如圖所示的研究步驟。(這個(gè)思維導(dǎo)圖非常重要?。?/p>
臨床問(wèn)題決定研究類型選擇,臨床預(yù)測(cè)模型可以回答疾病的病因、診斷、治療反應(yīng)和預(yù)后等問(wèn)題。不同的問(wèn)題需要不同類型的研究設(shè)計(jì)。例如,對(duì)于病因?qū)W研究,隊(duì)列研究可用于根據(jù)潛在原因預(yù)測(cè)疾病是否發(fā)生。對(duì)于診斷準(zhǔn)確性的問(wèn)題,適用橫斷面研究設(shè)計(jì),因?yàn)轭A(yù)測(cè)因素和結(jié)果同時(shí)出現(xiàn)或在短時(shí)間內(nèi)出現(xiàn)。為了預(yù)測(cè)患者對(duì)治療的反應(yīng),可以應(yīng)用隊(duì)列研究或隨機(jī)對(duì)照試驗(yàn)(RCT)。對(duì)于預(yù)后問(wèn)題,隊(duì)列研究是合適的,因?yàn)橛蓄A(yù)測(cè)因子和結(jié)果的縱向時(shí)間邏輯。評(píng)估病因的隊(duì)列研究,需要合理選擇研究對(duì)象和控制混雜因素。在診斷模型的研究中,需要一個(gè)“金標(biāo)準(zhǔn)”或參考標(biāo)準(zhǔn)來(lái)獨(dú)立診斷疾病,并且參考標(biāo)準(zhǔn)的診斷應(yīng)該采用盲法。也就是說(shuō),參考標(biāo)準(zhǔn)診斷不能依賴預(yù)測(cè)模型中的預(yù)測(cè)因子信息,以避免診斷回顧偏倚。評(píng)估患者對(duì)治療的反應(yīng)是一種介入性研究,也要合理選擇研究對(duì)象,控制非試驗(yàn)因素的干擾。在預(yù)后模型的研究中,預(yù)測(cè)因子和結(jié)局之間存在垂直關(guān)系,研究人員通常期望在自然狀態(tài)下獲得疾病的預(yù)后情況,因此前瞻性隊(duì)列研究是最常見(jiàn)的預(yù)后模型和最好的研究設(shè)計(jì)類型。
(一)目前還沒(méi)有針對(duì)具體臨床問(wèn)題的預(yù)測(cè)模型。為了構(gòu)建一個(gè)新的模型,通常需要一個(gè)訓(xùn)練集來(lái)構(gòu)建模型,并需要一個(gè)驗(yàn)證集來(lái)驗(yàn)證模型的預(yù)測(cè)能力。
(二)目前已有預(yù)測(cè)模型。為了構(gòu)建新的模型,使用驗(yàn)證集來(lái)構(gòu)建新模型,并使用相同的訓(xùn)練數(shù)據(jù)集來(lái)分別驗(yàn)證現(xiàn)有模型和新模型的預(yù)測(cè)能力。
(三)為了更新現(xiàn)有模型,使用相同的驗(yàn)證集來(lái)驗(yàn)證兩個(gè)模型的預(yù)測(cè)能力。
關(guān)于訓(xùn)練數(shù)據(jù)集和驗(yàn)證數(shù)據(jù)集的生成,可以前瞻性地或回顧性地收集數(shù)據(jù),其中前瞻性收集的數(shù)據(jù)集具有更高的質(zhì)量。對(duì)于建模人群,樣本量應(yīng)盡可能大。對(duì)于前瞻性臨床研究,相關(guān)文件的編制應(yīng)包括研究方案、研究者操作手冊(cè)、病例報(bào)告表和倫理批準(zhǔn)文件。還應(yīng)進(jìn)行數(shù)據(jù)收集的質(zhì)量控制和管理。如果數(shù)據(jù)是回顧性收集的,還應(yīng)評(píng)估數(shù)據(jù)質(zhì)量,識(shí)別異常值,并正確處理缺失值,如填充或刪除。最后,根據(jù)實(shí)際情況確定建模的訓(xùn)練數(shù)據(jù)集和驗(yàn)證的驗(yàn)證集。由于現(xiàn)實(shí)的原因,有時(shí)我們只能在同一個(gè)數(shù)據(jù)集上建模和驗(yàn)證,這是允許的,但是模型的外部適用性會(huì)受到一定程度的影響。
在建立預(yù)測(cè)模型之前,有必要澄清以往文獻(xiàn)中報(bào)道的預(yù)測(cè)因子,確定選擇預(yù)測(cè)因子的原則和方法,并選擇所應(yīng)用數(shù)學(xué)模型的類型。通常將使用參數(shù)或半?yún)?shù)模型,例如logistic回歸模型或Cox回歸模型。有時(shí)會(huì)用機(jī)器學(xué)習(xí)的算法來(lái)建立模型,但是這些模型大多是非參數(shù)的,導(dǎo)致模型和實(shí)際操作起來(lái)比較困難。我自己就遇到過(guò)這樣的問(wèn)題,機(jī)器學(xué)習(xí)做出來(lái)的模型跟臨床醫(yī)生完全沒(méi)辦法解釋,人家跟我要評(píng)分模型的計(jì)算公式,我只能說(shuō)沒(méi)有。正是因?yàn)楹芏鄼C(jī)器學(xué)習(xí)的模型,最終不會(huì)生成一個(gè)帶參數(shù)的計(jì)算公式。目前,預(yù)測(cè)模型中常用的有四種呈現(xiàn)形式:
(一)公式。直接使用數(shù)學(xué)公式作為預(yù)測(cè)模型工具。臨床上很常用。
(二)列線圖(Nomogram)。通過(guò)適當(dāng)?shù)臄?shù)學(xué)變換,將回歸模型的回歸系數(shù)轉(zhuǎn)化為分?jǐn)?shù),并作為預(yù)測(cè)模型工具繪制列線圖。
(三) 網(wǎng)絡(luò)計(jì)算器。其本質(zhì)也是通過(guò)適當(dāng)?shù)臄?shù)學(xué)運(yùn)算將回歸模型的回歸系數(shù)轉(zhuǎn)換成分?jǐn)?shù),并將其制作成網(wǎng)站供在線使用。以前少,現(xiàn)在日漸增多。
(四)評(píng)分系統(tǒng)。通過(guò)適當(dāng)?shù)臄?shù)學(xué)運(yùn)算,將回歸模型的回歸系數(shù)轉(zhuǎn)化為一個(gè)可量化的評(píng)分系統(tǒng)。這個(gè)也很常用,諸如此類的很多評(píng)分量表。
第1種(公式)形式主要是線性回歸模型,即確定性回歸。后面3種(列線圖、網(wǎng)絡(luò)計(jì)算器、評(píng)分系統(tǒng))形式則是基于參數(shù)或半?yún)?shù)模型,其統(tǒng)計(jì)性質(zhì)是模型參數(shù)的可視化表示。研究人員可以根據(jù)實(shí)際情況做出選擇。模型建立后,如何評(píng)價(jià)模型的優(yōu)劣?模型的評(píng)價(jià)和驗(yàn)證采用了較高的統(tǒng)計(jì)分析技術(shù)。例如,評(píng)價(jià)預(yù)測(cè)模型的區(qū)分度、校準(zhǔn)度、臨床有效性和其他指標(biāo),以確定模型的性能。
預(yù)測(cè)模型的效果會(huì)隨著應(yīng)用場(chǎng)景和人口的變化而變化。因此,對(duì)預(yù)測(cè)模型的完整研究應(yīng)該包括模型的驗(yàn)證。驗(yàn)證的內(nèi)容包括模型的內(nèi)部有效性和外部有效性。內(nèi)部有效性反映了模型的可重復(fù)性,這可以通過(guò)交叉驗(yàn)證和自助抽樣(重抽樣)的方式,利用研究本身的數(shù)據(jù)進(jìn)行驗(yàn)證。外部有效性反映了模型的可推廣性,需要用不同于研究本身的數(shù)據(jù)集進(jìn)行驗(yàn)證,這些數(shù)據(jù)集在時(shí)間和地理上是獨(dú)立的,或者是完全獨(dú)立的。
模型的內(nèi)部驗(yàn)證和外部驗(yàn)證是評(píng)估模型穩(wěn)定性和適用性的必要步驟。用于內(nèi)部驗(yàn)證和外部驗(yàn)證的數(shù)據(jù)集應(yīng)該是完全異構(gòu)的,但不是在一定程度上異構(gòu)。通常,來(lái)自原始機(jī)構(gòu)的數(shù)據(jù)被用作模型構(gòu)建的訓(xùn)練集,并且隨機(jī)選擇一部分內(nèi)部數(shù)據(jù)來(lái)作為內(nèi)部驗(yàn)證集。選擇其他機(jī)構(gòu)的數(shù)據(jù)作為外部驗(yàn)證集。當(dāng)然,最好進(jìn)行外部數(shù)據(jù)集驗(yàn)證。
下面,我將介紹幾種驗(yàn)證內(nèi)部有效性的方法。
(一)對(duì)半分割法。將現(xiàn)有數(shù)據(jù)隨機(jī)分成兩部分,一部分用于構(gòu)建模型,另一部分用于驗(yàn)證模型。采用半分割法將數(shù)據(jù)分為兩部分進(jìn)行“內(nèi)部驗(yàn)證”。由于只有一半的數(shù)據(jù)用于構(gòu)建模型,因此模型相對(duì)不穩(wěn)定。小樣本研究不適合這種方法。
(二)交叉驗(yàn)證方法。這種方法是對(duì)半分法的進(jìn)一步發(fā)展。通常使用半折疊交叉驗(yàn)證和N倍折疊(N-fold)交叉驗(yàn)證。半折疊交叉驗(yàn)證方法是將原始數(shù)據(jù)分成兩部分,一部分用于建立模型,另一部分用于驗(yàn)證模型。然后交換兩部分的卷,并相互驗(yàn)證。N折疊交叉驗(yàn)證方法是將數(shù)據(jù)分成N個(gè)部分,用N-1部分建立模型,剩下一部分驗(yàn)證模型。用這種方法建立并驗(yàn)證模型N次,就可以構(gòu)造出一個(gè)相對(duì)穩(wěn)定的模型。(常用的N多為5或者10)
(三)自助抽樣法(重抽樣法,Bootstrap)。傳統(tǒng)的Bootstrap內(nèi)部有效性分析方法是從原始數(shù)據(jù)集中隨機(jī)抽取一定數(shù)量的可放回案例建立模型,然后利用原始數(shù)據(jù)對(duì)模型進(jìn)行驗(yàn)證。通過(guò)500-1000次隨機(jī)抽樣、建立和驗(yàn)證,可以得到500-1000個(gè)模型,并總結(jié)出模型的參數(shù)分布。因此,可以確定模型的最終參數(shù)值。自助抽樣法是近年來(lái)發(fā)展迅速的一種方法,是在計(jì)算機(jī)運(yùn)算量增加的背景下發(fā)展起來(lái)的。結(jié)果表明,用該方法得到的模型比用前兩種方法得到的模型具有更高的穩(wěn)定性??梢酝茰y(cè),自助抽樣法將越來(lái)越多地應(yīng)用于預(yù)測(cè)模型的內(nèi)部有效性分析。當(dāng)然,如果條件滿足,我們應(yīng)該盡可能多地對(duì)預(yù)測(cè)模型進(jìn)行外部驗(yàn)證,以提高模型的外部適用性。
臨床預(yù)測(cè)模型的最終目的是改變醫(yī)患雙方的行為,改善患者的預(yù)后或成本效應(yīng),這是臨床預(yù)測(cè)模型的臨床效應(yīng)研究。從方法論的角度來(lái)看,通常是根據(jù)新的預(yù)測(cè)模型來(lái)劃分訓(xùn)練集和驗(yàn)證集。例如,為了預(yù)測(cè)二分類結(jié)局,我們可以通過(guò)評(píng)估模型的敏感性和特異性來(lái)評(píng)估臨床效果。
臨床預(yù)測(cè)模型的臨床效益研究,其最終目標(biāo)是研究其是否會(huì)改變醫(yī)患的行為,改善患者的預(yù)后以及提高成本效益。方法學(xué)上,通常根據(jù)新的預(yù)測(cè)模型分為訓(xùn)練集和驗(yàn)證集。例如,對(duì)于預(yù)測(cè)二分類結(jié)果,我們可以通過(guò)模型的敏感性和特異性來(lái)評(píng)估臨床有效性。我們通常根據(jù)預(yù)測(cè)模型評(píng)估患者的預(yù)后好壞來(lái)預(yù)測(cè)生存結(jié)局。例如,通過(guò)Nomogram計(jì)算每個(gè)受試者的得分,并根據(jù)一定的臨界值將患者分為預(yù)后良好組和預(yù)后不良組,然后繪制Kaplan-Meier生存曲線。決策曲線分析也是預(yù)測(cè)模型臨床有效性的常用方法。從預(yù)測(cè)模型構(gòu)建和研究設(shè)計(jì)的最終目的來(lái)看,設(shè)計(jì)隨機(jī)對(duì)照試驗(yàn)的臨床有效性評(píng)估最好,并且通常使用整群隨機(jī)對(duì)照試驗(yàn)來(lái)評(píng)估應(yīng)用預(yù)測(cè)模型是否可以改善患者預(yù)后并減少醫(yī)療費(fèi)用。
由于疾病風(fēng)險(xiǎn)因素、無(wú)法測(cè)量的風(fēng)險(xiǎn)因素、治療措施和治療背景隨著時(shí)間推移產(chǎn)生變化(稱為校準(zhǔn)漂移),即使是已經(jīng)充分驗(yàn)證的臨床預(yù)測(cè)模型,其性能也會(huì)日益下降。因此,臨床預(yù)測(cè)模型需要不斷地發(fā)展和更新。同樣的,最常用的惡性腫瘤TNM分期系統(tǒng)也因上述原因而不斷更新。
1. 構(gòu)建具有傳統(tǒng)臨床特征、病理特征、體格檢查結(jié)果、實(shí)驗(yàn)室檢查結(jié)果等的預(yù)測(cè)模型。此類模型的預(yù)測(cè)變量臨床上更加便于獲取,并且此類模型的構(gòu)建更加可行。
2. 隨著影像組學(xué)研究方法的成熟,越來(lái)越多的學(xué)者意識(shí)到影像學(xué)的某些表現(xiàn)或參數(shù)代表了特定的生物學(xué)特征。使用彩色多普勒超聲、CT、MR以及PET的大量成像參數(shù)結(jié)合臨床特征來(lái)構(gòu)建預(yù)測(cè)模型,往往可以進(jìn)一步提高預(yù)測(cè)模型的準(zhǔn)確性。此類建?;谟跋窠M學(xué)特征的掃描。此類建模的前期工作量比第一種方法大得多,并且需要臨床和影像部門(mén)之間的緊密合作。
3. 隨著基因組學(xué)和蛋白質(zhì)組學(xué)等高通量生物技術(shù)的廣泛應(yīng)用,臨床研究人員正在探索特征性的生物標(biāo)志物,并由這些大量生物信息構(gòu)建預(yù)測(cè)模型。這種預(yù)測(cè)模型是基礎(chǔ)醫(yī)學(xué)向臨床醫(yī)學(xué)轉(zhuǎn)化的良好切入點(diǎn),但是由于需要對(duì)臨床樣本進(jìn)行各種組學(xué)測(cè)試,因此需要強(qiáng)大的經(jīng)濟(jì)支持。但是,科學(xué)研究的投入和產(chǎn)出是成正比的。俗話說(shuō):“舍不得孩子套不著狼?!北M管沒(méi)有人愿意將狼與孩子困在一起,但原因是相同的。一旦愿意將錢(qián)投入到能很好地轉(zhuǎn)化為臨床的組學(xué)分析研究中,通常這些研究就可以產(chǎn)出具有高影響因子的文章。
1. 建立單個(gè)疾病的隨訪數(shù)據(jù)庫(kù),并盡可能完整地收集患者信息,包括但不限于以下各項(xiàng):人口統(tǒng)計(jì)學(xué)特征、既往史、家族史、個(gè)人史;疾病相關(guān)信息,例如治療前重要的體格檢查和實(shí)驗(yàn)室檢查結(jié)果、疾病嚴(yán)重程度、疾病臨床階段、病理階段、組織學(xué)等級(jí);治療信息,如手術(shù)方法、放化療方案、劑量和強(qiáng)度;預(yù)后:癌癥患者需要進(jìn)行持續(xù)隨訪才能獲得其預(yù)后,此任務(wù)較為困難和復(fù)雜。其他信息:如果有,例如遺傳信息。數(shù)據(jù)庫(kù)的建立為核心。
2. 從先前發(fā)表的預(yù)測(cè)模型文章中,大多數(shù)都是基于回顧性數(shù)據(jù)集的,而其中有一部分是基于預(yù)期數(shù)據(jù)集的。這類研究與RCT相比更容易進(jìn)行,屬于我們現(xiàn)在提出的現(xiàn)實(shí)世界研究領(lǐng)域?,F(xiàn)實(shí)世界研究和RCT應(yīng)該是臨床研究皇冠中的兩顆同樣璀璨的珍珠,且能互相彌補(bǔ)不足。過(guò)去,我們過(guò)分強(qiáng)調(diào)RCT的重要性,而忽略了實(shí)際數(shù)據(jù)本身的巨大價(jià)值。毫無(wú)疑問(wèn),RCT數(shù)據(jù)具有最高的質(zhì)量,但對(duì)數(shù)據(jù)進(jìn)行了嚴(yán)格的篩選,因此證據(jù)的外推受到限制?,F(xiàn)實(shí)世界的數(shù)據(jù)來(lái)自我們的日常臨床實(shí)踐,它更全面地反映了臨床干預(yù)的有效性,而且具有更好的外部適用性。但是,現(xiàn)實(shí)世界研究的最大問(wèn)題是數(shù)據(jù)質(zhì)量參差不齊,并且存在太多難以識(shí)別的混雜因素。因此,有必要使用更復(fù)雜的統(tǒng)計(jì)方法從繁復(fù)的混雜因素中找出真相。沙里淘金并不容易,可靠的統(tǒng)計(jì)學(xué)基礎(chǔ)就像沙中淘金的篩子。我們需要了解混雜因素是客觀存在的,因?yàn)槿魏闻R床結(jié)果的發(fā)生都不是單一因素作用的結(jié)果。對(duì)于混雜因素,有兩個(gè)校正級(jí)別。一種是在實(shí)驗(yàn)設(shè)計(jì)階段進(jìn)行的校正,這是頂層校正,例如通過(guò)隨機(jī)化和足夠的樣本量來(lái)均衡組間的混雜因素。這也是RCT受歡迎的原因:只要樣本量足夠大且隨機(jī)化正確,混雜因素就可以一勞永逸地解決。第二種是通過(guò)統(tǒng)計(jì)學(xué)方法進(jìn)行的結(jié)果校正,顯然不如RCT校正那么徹底,但第二種情況更接近我們臨床的實(shí)際情況。
3. 樣本量。因現(xiàn)實(shí)研究中存在許多混雜因素,所以辨別混雜因素對(duì)結(jié)果的影響,需要一定的樣本數(shù)量。通過(guò)多變量分析篩選變量的一種簡(jiǎn)單可行的原則是,如果在多變量分析中包括一個(gè)變量,則應(yīng)有20個(gè)端點(diǎn)樣本,即“ 1:20原理”。
4. 臨床研究洞察力。建立臨床預(yù)測(cè)模型是為了解決臨床問(wèn)題。要發(fā)現(xiàn)有價(jià)值的臨床問(wèn)題,就要進(jìn)行廣泛閱讀和臨床實(shí)踐。
1. 臨床轉(zhuǎn)化率低。主要原因是預(yù)測(cè)模型的臨床應(yīng)用需要平衡模型的準(zhǔn)確性和簡(jiǎn)便性。想象一下,如果有一個(gè)模型可以像TNM分級(jí)一樣易于使用,但是比TNM分級(jí)更準(zhǔn)確,那么您會(huì)做出哪些選擇?
2. 大多數(shù)臨床預(yù)測(cè)模型都是基于回顧性數(shù)據(jù)集構(gòu)建和驗(yàn)證的,很少在前瞻性數(shù)據(jù)中進(jìn)行驗(yàn)證。因此,模型預(yù)測(cè)的穩(wěn)定性相對(duì)較差。
3. 多數(shù)臨床預(yù)測(cè)模型的驗(yàn)證基于內(nèi)部數(shù)據(jù)。多數(shù)文章僅一個(gè)數(shù)據(jù)集。即使有兩個(gè)數(shù)據(jù)集,一個(gè)用于構(gòu)建模型,另一個(gè)用于驗(yàn)證,但兩個(gè)數(shù)據(jù)集通常來(lái)自同一研究中心。如果預(yù)測(cè)模型的驗(yàn)證可以進(jìn)一步擴(kuò)展到另一個(gè)研究中心的數(shù)據(jù)集,則該模型的應(yīng)用價(jià)值將得到極大的擴(kuò)展。我自己在臨床工作中遇到過(guò)這樣的問(wèn)題,同樣的肝硬化評(píng)分APRI、FIB-4在不同人群中統(tǒng)計(jì)效能千差萬(wàn)別。這項(xiàng)工作非常困難,需要多中心合作。此外,大多數(shù)國(guó)內(nèi)中心沒(méi)有用于驗(yàn)證的完整數(shù)據(jù)庫(kù),這又回到了前面討論的“數(shù)據(jù)庫(kù)重要性”主題。
臨床預(yù)測(cè)模型的初衷是使用少量易于收集的低成本預(yù)測(cè)因子來(lái)預(yù)測(cè)疾病的狀態(tài)和預(yù)后。因此,大多數(shù)預(yù)測(cè)模型都很簡(jiǎn)短。在信息技術(shù)不發(fā)達(dá)且數(shù)據(jù)收集、存儲(chǔ)和分析成本高昂的時(shí)代,這是合情合理的。但是,隨著經(jīng)濟(jì)的發(fā)展和技術(shù)的進(jìn)步,數(shù)據(jù)收集和存儲(chǔ)的成本已大大降低,數(shù)據(jù)分析技術(shù)也在不斷進(jìn)步。因此,臨床預(yù)測(cè)模型應(yīng)突破固有的概念,應(yīng)用大量數(shù)據(jù)(大數(shù)據(jù))和更復(fù)雜的模型以及算法(機(jī)器學(xué)習(xí)和人工智能)來(lái)為醫(yī)生、患者和醫(yī)療決策者提供更準(zhǔn)確的結(jié)果。
另外,從臨床醫(yī)生的角度出發(fā),進(jìn)行臨床預(yù)測(cè)模型的研究應(yīng)把握以下四個(gè)原則:
建立更好的臨床預(yù)測(cè)模型也是精準(zhǔn)醫(yī)學(xué)的內(nèi)在要求;
如何獲得高質(zhì)量的數(shù)據(jù)?建立數(shù)據(jù)庫(kù)是核心競(jìng)爭(zhēng)力,而預(yù)測(cè)模型只是一種技術(shù)方法;
我們需要認(rèn)識(shí)到現(xiàn)實(shí)研究與RCT同樣重要。兩者都是提供可靠的臨床證據(jù)的方法。
模型的驗(yàn)證需要內(nèi)部和外部的合作,因此,我們應(yīng)該加強(qiáng)科學(xué)研究的內(nèi)部合作,提高對(duì)多中心科學(xué)研究合作的認(rèn)識(shí)。
參考文獻(xiàn):Zhi-Rui Zhou, Wei-Wei Wang, Yan Li, et al. In-depth mining of clinical data: the construction of clinical prediction model with R.Annals of Translational Medicine.
更多科研新鮮資訊、文獻(xiàn)精讀和生物信息技
聯(lián)系客服