對信息模型的研究和分析一直是衛(wèi)生信息標準化研究的重要組成部分。發(fā)達國家早在上個世紀九十年代就對衛(wèi)生信息模型進行了系統(tǒng)化的研究,并且形成了一些在一定領(lǐng)域和范疇之內(nèi)得到廣泛認可、經(jīng)歷了實踐檢驗并不斷完善的信息模型。
我們以美國公共衛(wèi)生概念數(shù)據(jù)模型(PHCDM)為重點,對國外一些主要的衛(wèi)生信息模型進行了分析與研究,并對這方面工作已有的研究成果和先進經(jīng)驗進行了總結(jié)和借鑒。
國際主要衛(wèi)生信息模型基本框架
1.美國HL7的參考信息模型
在HL7的參考信息模型(Reference Information Model,RIM)中,主題域包括實體(Entity)、角色(Role)、角色鏈接(Role link)、參與(Participation)、動作(Act)和動作關(guān)(聯(lián))系(Act Relation-ship)。其中“動作”(Act)是這個主題域的核心部分,也是RIM的靈魂。目前很多國家衛(wèi)生信息模型都參照或以RIM為元模型,建立自己的模型,例如美國的PHCDM,加拿大的CHIM等等。
2.加拿大的衛(wèi)生信息模型
加拿大衛(wèi)生信息模型(Canadian Health Information Model, CHIM)較側(cè)重于管理和資源,把管理和資源作為重要的主題域單獨提取出來。加拿大衛(wèi)生信息模型的主要實體包括: 人、管理、資源、環(huán)境和事件,模型主框架如圖2所示:
● 人: 衛(wèi)生系統(tǒng)所關(guān)注的個人、群體,以及他們的特征。
● 環(huán)境: 某個特定場所一系列特征,包括地形地貌的、微生物的或人造的物理環(huán)境特征。
● 管理: 為了規(guī)范和約束人們行為所確立的具體準則。
● 資源: 指有價值的事物,例如包括人力資源、財務資源、設(shè)備資源等。
● 事件: 指已經(jīng)或正在發(fā)生的事件。
3.澳大利亞的國家衛(wèi)生信息模型
澳大利亞自1989年出版了“衛(wèi)生保健基本數(shù)據(jù)集”后,認識到編制數(shù)據(jù)字典時,如果僅僅按照衛(wèi)生保健字典來編制字典的話,容易造成遺漏或雜亂無章的現(xiàn)象,于是就提出了通過研發(fā)信息模型來對衛(wèi)生數(shù)據(jù)字典提供支持這一現(xiàn)實的迫切需求。澳大利亞國家衛(wèi)生信息模型(National Health Information Model, NHIM)目前已經(jīng)發(fā)展到了第2版,其功能已經(jīng)遠遠超出了“組織字典”而成為國家衛(wèi)生信息的基本架構(gòu),并且在澳大利亞的許多國家級大型項目中起著結(jié)構(gòu)性的支撐作用。圖3是澳大利亞國家衛(wèi)生信息模型第2版的宏觀結(jié)構(gòu)圖:
● 參與者狀態(tài): 衛(wèi)生部門中的人或團體所扮演的角色,以及他們可觀察到并且能夠進行定義和測量的特征。
● 狀態(tài)變化事件: 在衛(wèi)生部門內(nèi)或相關(guān)團體間發(fā)生的事情或事件,以及它們的特征。
● 環(huán)境因素: 管理的、物理的或社會的環(huán)境,指的是在生活中或衛(wèi)生部門工作中所處的實際環(huán)境。
● 分類體系: 能夠用于分類、編碼或評價衛(wèi)生因素、狀態(tài)或事件。它包括了值域、編碼體系和工作指標。
美國公共衛(wèi)生概念模型
1.PHCDM的研究目標
美國的公共衛(wèi)生概念數(shù)據(jù)模型(PHCDM)是為國家電子疾病監(jiān)視系統(tǒng)(NEDSS)項目的啟動而進行研究和開發(fā)的,它的總體目的是整理、歸檔公共衛(wèi)生所需的信息資料,并作為NEDSS起步的一部分,促進數(shù)據(jù)標準化的發(fā)展。其主要作用包括: (1)為組織數(shù)據(jù)標準和指南提供一個框架; (2)降低公共衛(wèi)生信息系統(tǒng)的開發(fā)強度; (3)通過一致性來增強數(shù)據(jù)共享; (4)滿足在國家標準框架中描述公共衛(wèi)生數(shù)據(jù)的需求; (5)促進CDC與政府和地方合作者間在公共衛(wèi)生領(lǐng)域的協(xié)作。
2.PHCDM中提出的模型層級理論
PHCDM提出的信息模型層級結(jié)構(gòu),將信息模型劃分為主題域模型、類關(guān)系模型、概念數(shù)據(jù)模型、邏輯數(shù)據(jù)模型、數(shù)據(jù)庫設(shè)計模型和物理數(shù)據(jù)庫模型,分別處于上、中、下三個層級。這幾種模型的定義與功能如下:
● 主題域模型(SAM): 主題域模型只包含了主題域和它們的關(guān)系,通常作為一個大型域(例如一個主要功能域)的模型。它可以被用于工程范圍內(nèi)的高層次計劃和設(shè)計。
● 類關(guān)系模型(CRM): 類關(guān)系模型只包含主題域、類和關(guān)系,通常描述一個有限的領(lǐng)域(例如單個項目領(lǐng)域)。它被用于項目層次的高層面分析與評估。
● 概念數(shù)據(jù)模型(CDM): 概念數(shù)據(jù)模型包含主題域、類、屬性、數(shù)據(jù)類型、關(guān)系和一個計劃項目領(lǐng)域(如公共衛(wèi)生、財政、物資管理)的通常模型。它是由相對細節(jié)層面的分析組成,而且經(jīng)常是一個首先交付的項目。
● 邏輯數(shù)據(jù)模型(LDM): 包含主題域、規(guī)格化類、極小屬性、關(guān)系和候選/主鍵。經(jīng)常作為項目領(lǐng)域中的企業(yè)詳細執(zhí)行的內(nèi)容。它表示了最詳細層次數(shù)據(jù)分析的完成和數(shù)據(jù)庫設(shè)計啟動。
● 數(shù)據(jù)庫設(shè)計模型(DDM): 包括表空間、表、列、數(shù)據(jù)類型和主/外鍵,通常表示一個計算機信息系統(tǒng)現(xiàn)存或者正在設(shè)計的數(shù)據(jù)庫。它表示了數(shù)據(jù)庫構(gòu)建的開始和數(shù)據(jù)庫設(shè)計的開始。
● 物理數(shù)據(jù)庫模型(PDM): 包含生成表和索引所需的數(shù)據(jù)定義語言(DDL),還包括數(shù)據(jù)庫管理系統(tǒng)(DBMS)強迫的約束。它是一個計算機信息系統(tǒng)現(xiàn)存的或者計劃的數(shù)據(jù)庫處理規(guī)范,對應于數(shù)據(jù)庫設(shè)計和構(gòu)建的最終步驟。
如果根據(jù)這六種模型的目標對象和細節(jié)描述水平從上到下排列,又根據(jù)它們規(guī)范說明的嚴格精密程度從左向右排列,就可以得到如圖4所示的排列方式:
PHCDM是概念數(shù)據(jù)模型的一個特殊例子,其優(yōu)勢在于: (1)它可以獨立于技術(shù)之外被多部門使用; (2)避開了通常在創(chuàng)建物理數(shù)據(jù)模型中諸如數(shù)據(jù)結(jié)構(gòu)、主鍵和外鍵、字段規(guī)范等等經(jīng)常出現(xiàn)的許多技術(shù)細節(jié),確保了對公共衛(wèi)生重要概念的充分描述和記錄; (3)由于PHCDM使用了一個合理的、高層面抽象的方式來記錄公共衛(wèi)生概念,所以擴展了模型的應用范圍,并使得對維護的需求降到最小。
3.PHCDM的開發(fā)過程
PHCDM的開發(fā)始于1999年5月,首先是構(gòu)造一個高級數(shù)據(jù)模型用于描述PHCDM所包含的主題域。主題域數(shù)據(jù)模型是在對美國疾病控制中心(CDC)的電子疾病監(jiān)測系統(tǒng)、HL7 RIM和其它有關(guān)衛(wèi)生數(shù)據(jù)模型進行分析的基礎(chǔ)之上發(fā)展起來的。
1999年6月,PHCDM的開發(fā)者創(chuàng)建了該模型的第一個“類”圖; 1999年7月,CDC流行病學家對類圖進行了評價,在意見反饋基礎(chǔ)上對其進行了修訂; 同年8月,屬性被增加到這個類模型中; 1999年9月到10月初,CDC內(nèi)部以及國家、地方相關(guān)部門的專家共同對類模型進行了研討和評價,并基于此作出了通過以下方式繼續(xù)完善和增強該數(shù)據(jù)模型的決定: (1)開發(fā)一個公共衛(wèi)生程序模型,為數(shù)據(jù)模型提供語境和分類范圍; (2)采用HL7 RIM表示相關(guān)衛(wèi)生行為; (3)通過建立一個原型數(shù)據(jù)庫(基于CDC對疾病管理和監(jiān)測系統(tǒng)子集的信息需求)的方法,來驗證這個數(shù)據(jù)模型的正確性。
2000年1月,有關(guān)模型的基本原理、目標的詳細描述和出版物得到公認。PHCDM是滿足NEDSS數(shù)據(jù)標準化目標啟動的關(guān)鍵,其各種模型的活動有著多重目標,但主要強調(diào)應用其處理CDC及合作伙伴的數(shù)據(jù)標準化問題。
4.PHCDM的主要內(nèi)容
(1)主題域
主題域是一個聚合類模型劃分出來的、具有一定意義的部分,是在允許范圍內(nèi)用子集的方式把一個模型劃分為若干更容易理解的區(qū)塊。PHCDM中有四個主題域: 衛(wèi)生相關(guān)活動、位置場所、客體和參與者。
● 衛(wèi)生相關(guān)活動主題域: 包含健康服務、健康環(huán)境和影響健康行為的信息。一個衛(wèi)生相關(guān)活動可以是一個觀察、干預、治療安排/處置或者信息發(fā)布通告。
● 位置場所主題域: 包含與參與者、衛(wèi)生相關(guān)活動或者客體相關(guān)聯(lián)的地點信息??梢允且粋€郵政地址、一個通訊地址或者一個物理地址。
● 客體主題域: 包含與衛(wèi)生相關(guān)活動和參與者有關(guān)的物資、設(shè)備和產(chǎn)品信息。如食物、藥品以及與公共健康相關(guān)的物理實體和其他有形內(nèi)容。
● 參與者主題域: 包含衛(wèi)生相關(guān)活動的參與對象信息。他可以是一個獨立的個人和非人生命有機體,或者一個正式或非正式組織。
(2)PHCDM的類與關(guān)聯(lián)
類可以是人、地點、物品、概念或者事件等能夠被采集的信息。
PHCDM種共包含有29個類,其中包含四個核心類。這四個核心類對應于四個主題域,其內(nèi)容是衛(wèi)生相關(guān)活動、位置、客體和參與者,圖5是四個核心類的示意圖:
PHCDM中的29個類的信息都是互相關(guān)聯(lián)的,PHCDM使用了UML建模語言定義了三種類關(guān)聯(lián)方式:
● 父/子類關(guān)聯(lián)
在父/子類關(guān)聯(lián)中,更普通、泛化的類被指定為父類,可以有一個或多個具體、特化的子類。父/子類關(guān)聯(lián)在數(shù)據(jù)模型圖中用連接父類和子類的連線表示。線的箭頭指向父類。圖6為PHCDM四個核心類的父/子類關(guān)聯(lián)示意圖:
● 關(guān)系關(guān)聯(lián)
關(guān)系關(guān)聯(lián)是一個特殊關(guān)系類型,用以反映同一個核心類或其子類中某個實例與另一個實例之間的關(guān)系。圖7為表示關(guān)系關(guān)聯(lián)一個例子的模型圖,兩邊的長方形代表關(guān)系類,通過一對關(guān)聯(lián)線連接關(guān)系類(活動關(guān)系)和與之類相關(guān)的核心類(衛(wèi)生相關(guān)活動):
上圖中,“活動關(guān)系”中每一個實例與且只與一個“衛(wèi)生相關(guān)活動”關(guān)聯(lián),而每個“衛(wèi)生相關(guān)活動”可能與零個或更多的“活動關(guān)系”關(guān)聯(lián)。
● 參與關(guān)聯(lián)
參與關(guān)聯(lián)是PHCDM中專用于描述核心類之間相互關(guān)系的關(guān)聯(lián),每個核心類與其他核心類之間都有著多對多的關(guān)系。參與關(guān)聯(lián)用參與類來描述,PHCDM中有五個參與類: 個體參與、對象參與、參與者位置參與、材料責任和材料位置參與。
(3)屬性與數(shù)據(jù)類型
屬性是特殊的數(shù)據(jù)條目,每個屬性都有其名稱、描述和賦予的數(shù)據(jù)類型: 名稱表明了屬性含義; 描述包括了屬性的定義、示例以及相關(guān)的討論; 數(shù)據(jù)類型是屬性值允許格式的說明,它同時擴展了屬性的定義。
屬性和賦予它的數(shù)據(jù)類型在數(shù)據(jù)模型圖中描述類的長方形框的下部分列出(圖8):
要說明的是,一個父類屬性必定被其子類所繼承。在上述例子中,參與者父類中的“參與者標識”屬性也同時是參與者個體子類(以及所有參與者其他子類)的屬性。
屬性名稱依照以下格式:
[Class Name][{qualifier name}]Attribute-Type Name
由括號中的Class Name表示屬性的簡稱; 大括號、中括號中的Qualifier Name表示可以有0個、1個或者多個限定名; 每一個屬性都有一個“屬性-類型名稱(Attribute-Type Name)”,它提供了屬性傳送的數(shù)據(jù)類型標識。用于PHCDM中的屬性-類型名稱有: 數(shù)量、代碼、日期、種類、標識符、名稱、數(shù)據(jù)、量、文本、時間范圍和值域。
在數(shù)據(jù)模型圖中,數(shù)據(jù)類型采用屬性名稱后面用冒號隔開的數(shù)據(jù)類型標識符描述,PHCDM中的數(shù)據(jù)類型是以下三種形式之一: (1)屬性名: 數(shù)據(jù)類型名; (2)屬性名: SET〈數(shù)據(jù)類型名〉; (3)屬性名: IVL〈數(shù)據(jù)類型名〉。PHCDM收錄的數(shù)據(jù)類型來自于HL7定義的數(shù)據(jù)類型集。
數(shù)據(jù)類型名稱前置“SET”并且被括在括號里,表明該屬性可以重復,也就是說該屬性可以有一組含有一個或者更多的值。例如,參與者標識符屬性是一個集,這表明一個參與者類中的單個實例可以有多個標識符。
數(shù)據(jù)類型名稱前置“IVL”,表明這個屬性描述了一個從低到高的值域區(qū)間。PHCDM中,一個數(shù)據(jù)類型前置IVL就限定了間隔次數(shù)。例如,日期時間范圍屬性是一個間隔值域,其含義表示相關(guān)日期時間描述了一個從開始到結(jié)束的范圍。
(計算機世界報 2006年10月16日 第40期 B21、B22)