一、國家衛生信息概念數據模型 2
二、需求分析 5
三、業務表信息的歸類 5
四、業務表信息的抽象 6
五、數據元提取 8
六、確定數據類型和定義數據元屬性 14
七、數據元著錄 17
八、國家衛生信息數據字典的演進 17
九、國家數據字典與衛生統計調查制度改革 21
十、國家數據字典與衛生統計調查歷史數據的管理 22
附錄1衛生信息概念數據模型實體分類 23
附錄2 國家衛生統計調查制度資源部分其他統計表的數據項對象圖 29
附錄3 國家衛生統計調查制度部分其他統計表的抽象對象圖 32
附錄4 國家衛生統計調查制度資源部分其他表的數據元 35
附錄5 遵循的上位標準 44
國家衛生信息數據字典研究建立在衛生信息概念數據模型的基礎上,以國家衛生信息的需求分析為基本出發點,通過原始數據項的收集、整理和歸類,數據
元的抽象和提取、數據元的規范和著錄等步驟完成。研究過程和基本研究方法如
圖1所示。現以國家衛生統計調查中的第1部分——衛生資源統計為例介紹研究
方法。
圖1 國家衛生信息數據字典研究基本方法示意圖
一、國家衛生信息概念數據模型
為了保證信息及其分析結果能夠互相比較,必須通過數據模型定義數據實體、屬性及其相互關系。數據模型通過對超級實體(super-entity,或稱主要實體)、實體(entity)、子實體(sub-entity)和屬性(attribute)的劃分和說明來描述研究對象不同類型的數據模型有其不同的應用目的,而且在表達的詳細程度上也不同。圖2表示數據模型的承接關系模型、概念模型、邏輯模型及物理層模型之間的關系。越近底層模型越詳細。承接關系(contextualdatamodel)數據模型確立所關注的信息范疇,展示主要的對象以及它們之間的關系。概念數據模型(conceptualdatamodel)完善上下
圖2 數據模型的層次關系
承接關系數據模型中的研究對象,即補充說明每個研究對象與其它實體的關系,以便更全面地了解研究對象。邏輯數據模型(10gicaldatamodel)和物理數據模型(physicaldatamodel)以概念數據模型為起點,更加詳細和具體,與信息系統的設計和運行有關。國家衛生信息數據字典的主要目的是對相關數據元進行規
范,為各種渠道的數據收集和后期分析利用提供基本依據。所以,數據字典的研主要涉及概念數據模型。
圖3 衛生數據的承接關系模型
國家衛生數據的承接關系模型包括人員、事件、環境、管理、支撐條件5
個主要實體,如圖3所示。概念數據模型是根據承接關系數據模型提出的,但對主要實體做了更詳細的層次劃分,并描述了實體之間上下左右的關系,列舉了表示最底層實體屬性的數據元素。概念模型是收集、管理、分析衛生相關數據,并提供決策信息必不可少的。概念數據模型將所有信息劃分為11個超級實體(最高層)和182個實體(或子實體),見附錄1。11個超級實體分別為參與者、參與者角色、衛生服務需求、衛生服務計劃、事件、位置、費用、結局、環境因素、業務因素、支撐條件。如圖4所示。在11個超級實體中除事件以外,其他10個超級實體反映的是狀態信息,是相對靜止的,而事件反映的是導致狀態改變的過程信息, 所以它們均是
以事件為中心的。衛生數據的承接關系模型和概念模型略圖見圖5。
圖4 衛生數據概念模型的超級實體
圖5 承接關系模型和概念模型略圖
二、需求分析
建立國家衛生信息數據字典必須首先明確字典中應該包括的基本數據項,也就是說,首先要進行需求分析。本研究以國家衛生統計調查制度(2002)中現有
的信息為需求分析的起點(initiatives)。首先收集和整理所有統計報表中的數據項,以國家衛生信息概念數據模型為依據,對這些數據項按實體歸類,用UML繪制每一個實體的對象圖;然后在每個對象圖的基礎上抽象出數據元。
現有國家衛生統計調查制度中共有調查報告表59個,分為5個部分:衛生資源統計、醫療統計、衛生監督統計、疾病控制統計、婦幼保健統計。共涉及基
本數據條目1759個。
三、業務表信息的歸類
根據國家衛生信息概念數據模型的實體分類,將每個統計表中的基本數據項逐一歸類,并以UML對象圖表示。衛生機構基本情況統計表(衛統表1)及其
數據項見圖6.資源部分其他統計表的數據項對象圖見附錄2。
|
|