前言:想要寫出一篇引人入勝的文章?我們特意為您整理了醫院數據挖掘管理運用范文,希望能給你帶來靈感和參考,敬請閱讀。
1數據挖掘技術綜述
1.1數據挖掘的概念
數據挖掘(DataMining[1])是從大量的、不完全的、有噪聲的、模糊的、隨機的數據集中識別有效的、新穎的、潛在有用的,以及最終可理解的模式的非平凡過程。數據挖掘可粗略地理解為三部分:數據準備(DataPreparation)、數據挖掘,以及結果的解釋評估(InterpretationandEvaluation)。將數據挖掘技術應用到醫學信息數據庫中,可以發現其中的醫學診斷規則和模式,從而輔助醫生進行疾病診斷,實現臨床決策支持的效果。
1.2數據挖掘的功能[2-6]
1.2.1關聯分析
數據關聯是數據庫中存在的一類重要的可被發現的知識。若兩個或多個變量的取值之間存在某種規律,就稱為關聯。關聯可分為簡單關聯、時序關聯、因果關聯。
1.2.2分類
分類就是找出一組能夠描述數據集合典型特征的模型(或函數),以便能夠分類識別未知數據的歸屬或類別,即將未知事例映射到某種離散類別之一。
1.2.3聚類
數據庫中的記錄可被化分為一系列有意義的子集,即聚類。
1.2.4概念描述
對含有大量數據的數據集合進行概述性的總結并獲得簡明、準確的描述,這種描述就稱為概念描述。
1.2.5預測
數據挖掘自動在大型數據庫中尋找預測性信息,以往需要進行大量手工分析的問題如今可以迅速直接由數據本身得出結論。
1.2.6異常檢測
一個數據庫中的數據一般不可能都符合分類預測或聚類分析所獲得的模型,那些不符合大多數數據對象所構成的規律的數據對象就被稱為異常數據。
1.3數據挖掘的過程
數據挖掘過程[7-9]是在設計者的主動參與下進行的知識發現過程,是在積累了大量的數據后,從中識別出有效的、新穎的、潛在的、最終可以理解并加以有目的運用的知識。一般分為以下步驟:問題定義:清晰地定義出業務問題,認清數據挖掘的目的是數據挖掘的重要一步。數據準備:①數據理解---將數據轉換成一個分析模型。這個分析模型是針對挖掘算法建立的。②數據的選擇及簡化—是根據用戶的需要從原始數據庫中抽取的一組數據。③數據的預處理--研究數據的質量,為進一步的分析做準備。數據挖掘:對所得到的經過轉換的數據進行挖掘。結果分析:解釋并評估結果。知識的優化:將分析所得到的知識集成到業務信息系統的組織結構中去。
2.1醫療數據挖掘主要分類
2.1.1從數據挖掘的處理過程、功能模型、算法研究,可以將醫用數據挖掘按功能模型和挖掘對象兩個方面進行如下分類[10-14]。
2.1.1.1按照功能模型分類:常用的數據挖掘技術可以分成統計分析類、知識發現類、和其他類型的數據挖掘技術三大類。①統計分析類:統計是數據搜集和描述數學的一個分支。在醫療數據挖掘中的應用如:聚類分析方法可以對DNA分析、醫學影像數據自動分析、多生理參數監護數據分析、中醫診斷和方劑的研究、疾病危險因素分析等。②知識發現類:知識發現是用一種間接的方式從數據中抽取信息的一種技術,而這些信息是隱含的、未知的,并且具有潛在應用價值。其中可分為:a.關聯規則型知識挖掘技術,是醫用數據挖掘的一種主要形式。b.神經網絡型知識挖掘技術。c.遺傳算法型知識挖掘技術。d.粗糙集型知識挖掘技術。如關聯分析可以用來分析預測手術術后和藥物治療的效果,可以對某種疾病的相關發病因素進行分析以指導患者如何預防該疾?。豢梢詫РNA和健康組織的DNA基因序列進行比較,以識別出兩類基因的差別,從而得出致病因素;可以對患者的生理參數進行分析,分析各種生理參數之間的關系進而得出有意義預防與治療方案等。e.機器學習類,歸納學習方法又可分為決策樹、規則歸納等。如決策樹用于前庭區與頭暈有關的疾病診斷規則的提取。③其他類型:除以上陳述的數據挖掘技術外,近年來,隨著各種數據處理工具、先進的數據庫技術與因特網技術的迅速發展,還出現了一些其他數據挖掘技術。如文本挖掘技術、Web挖掘技術、分類分析技術、地理信息系統與空間數據挖掘技術以及分布式數據挖掘技術等。
2.1.1.2按照挖掘對象分類:按照不同的數據類型,數據挖掘研究在時間序列數據、空間數據、文本數據、多媒體數據等方面展開。①時間序列數據(TimeSeriesData)是與時間有關的一系列數據。對時間序列數據的挖掘主要是發現序列中事物出現的周期和規律,以及不同時間序列間的同步關系。如應用時間序列預測方法可以對醫院藥品進、銷、存產生的數據進行統計分析。②序列(Sequential)模式序列模式與關聯模式相仿,其目的也是為了挖掘數據之間的聯系,但是序列模式分析的側重點在于分析數據之間的前因后果。如:對醫院門診和住院患者量進行預測,可以分析某種疾病發病率的變化趨勢,病死率預測等。③文本數據(TextData)就是我們一般的文字,如報刊雜志、設備維護手冊、故障描述等的內容。④多媒體數據(MultimediaData)是隨著多媒體技術而日益涌現的聲音、圖形、圖像、超文本等數據。應用領域例如針對大量CT、MR圖像的存儲和查詢問題而興起的基于內容的圖像問題。由于與傳統的文本數據不同,因此必須采用新的挖掘手段來發現內容和形式間的內在聯系。
2.1.2按應用層面可醫院數據挖掘可分為診療信息挖掘和管理信息挖掘。診療應用如:中山大學腫瘤防治中心的研究人員通過腫瘤分子信息和數據挖掘方法可以預測早期非小細胞肺癌5年內是否死亡,這一預測的總正確率達87.2%,該技術一旦成熟,今后每個肺癌患者開刀做完手術后,可借此預測其5年存活情況,而且檢測費用遠比國外的基因檢測便宜;上海同濟大學附屬醫院分析糖尿病患者肌肉組織和脂肪含量與骨密度之間的聯系,得出高肌肉和高脂肪含量可以降低患者髖骨骨折的危險性;第四軍醫大利用數據庫和數據挖掘技術建立了惡性血液病數據庫分析系統等。管理應用如:北京協和醫院開展數據挖掘在臨床醫療管理上的研究,為醫院業務管理等提供支撐,并輔助領導決策;廣州南方醫院采用數據挖掘查詢系統查詢醫生有否開大處方,患者是否花了不該花的醫藥費,且患者有望提前治愈出院。
2.2醫療數據挖掘的應用研究
2.2.1診療信息挖掘
診療信息挖掘主要目的是通過患者信息分析,提供有參考作用的醫療方案。①建立患者隨訪信息庫。②臨床疾病分析、輔助診斷:如:a.判別分析:用于心臟疾病的分類;用于闌尾炎4種不同類型的判別。b.人工神系統網絡:用于顱內星形膠質細胞瘤良、惡性的影像診斷;用于肺內孤立結節的影像鑒別診斷。c.決策樹:糖尿病分類規則建立;前庭區與頭暈有關的疾病診斷規則的提取。
2.2.2管理信息挖掘
2.2.2.1財務管理[15,16]
①患者費用構成分析:患者費用由藥品、治療、檢查、手術、化驗等組成。利用數據挖掘技術可以分析醫院、科室乃至各個病區??苾鹊幕颊哔M用構成,從而能有針對性地控制費用比例,探究醫療費用項目結構的合理性,使醫院管理者有針對性的控制醫療費用。②同期費用對比分析:利用數據挖掘技術可以按不同的時間對各個科室或各個病區同期的各種費用進行對比分析,并以各種專業報表、視圖的形式反映給醫院管理者,分析變化趨勢及可能原因。③成本效益分析:利用數據挖掘技術可以把各個不同系統如物資設備系統、財務系統等的數據匯總到數據倉庫,然后對醫院的成本效益情況進行全面分析,以便能真正把握醫院的經營狀況,提高醫院的經濟效益。例如:對醫院資金運轉情況作財務分析,了解醫院財務狀況和資金流向,分析醫院運營風險,利用數據挖掘中的環基比和定基比技術分析醫院財務資金的增長速度,并用曲線擬合來預測未來的資金需求量,為管理者決策和促進資源的有效配置提供依據。④醫保費用構成分析:利用醫院業務數據結合醫保中心返還數據對醫保分科的定額結算進行分析,指導醫院各科室合理、高效的利用醫保資源,在醫保定額下提供更好的醫療服務。
2.2.2.2醫療質量管理[17-19]
①單病種分析:以ICDlO疾病分類為標準,利用數據挖掘技術對單病種進行分析,包括住院費用、住院天數、轉歸、病情、治療方案等方面,為醫療質量管理提供依據,使醫生能夠及時總結經驗,找出最佳治療手段,既縮短了患者的就診住院時間,減輕了患者的負擔,同時提高了醫療工作效率,增加了醫院經濟效益。②手術室感染管理:a.手術室無菌物品及一次性用品智能備庫系統;b.總結消毒滅菌工作與消毒效果的規律;c.預測術后切口感染合理安排手術并防止抗生素的濫用;d.利用HIS中知識解決消毒滅菌難點并杜絕差錯;e.對參觀手術人員和進修生實習生的管理;f.對手術室消毒滅菌和醫院感染常規工作動態監測。③藥學管理:a.備藥量預測:用時間序列預測方法,對HIS中現有的藥品用量信息進行計算模擬,得出藥品消耗模型。b.制劑最佳批生產量預測:在分析醫院制劑歷年用量及近期消耗趨勢下,得出該制劑效期內用量,并通過計算得出該制劑的最佳批生產量預測模型。c.治療藥物監測:對藥物監測(TDM)歷史數據分析、提取、加工、整合,更深層次挖掘(或發現)一些新知識,如開展藥物群體藥動學研究、藥物濃度影響因素相關度分析等,為臨床提供更多有價值的資料,實現給藥個體化、提高藥物療效、降低藥物毒副反應等。d.抗生素合理應用自動監控:對HIS中相關信息進行提取、分析、挖掘,對抗生素的用量、耐藥性、聯合用藥、療程、圍手術期用藥、預防用藥、用藥途徑及治療效果等指標實行自動監控,從而實時、有效地監測抗生素使用情況。
2.2.2.3醫院經營目標管理[20]
①患者構成分析:運用數據挖掘技術中的秩和比法對醫院門診和住院患者的地區分布、性別分布、身份分布、職業分布、年齡分布等方面進行分析,從而得到不同類型患者的經濟狀況、需求的主要醫療服務類型等信息,了解患者差異對醫院收益的影響,從而能夠有針對性的采取措施來提高服務質量,增加門診量和住院量。②患者流動情況分析:該功能可以分析門診患者從掛號到取藥再到離開醫院的時間分布以及住院患者從入院到出院各個就醫環節的時間分布。分析出患者的就醫瓶頸,掌握影響患者診療效率的因素,以便能針對這些因素采取措施來幫助醫院管理者進行業務流程的更新和改進,提高患者的就診效率。
2.2.2.4經營決策管理[21]
①患者就診時間分析:由于患者的入院季節性較強,可以通過分析每月、每季度的門診人次、住院人次、床位周轉率,通過時間維度分析,建立灰色預測模型,來預測下一時期的門診和住院人次。根據預測信息,醫院管理者可以提出有針對性的措施,確定最優的服務項目時間表,從而作出終止或開拓某種醫療服務項目的決定,實現對人力資源、醫療設施、醫療設備的適當配置。②醫療工作量影響分析:科學合理地評價醫療工作量,找出影響醫療工作量變化的主要因素,是進行醫療工作量影響分析的目的。例如:醫院收治患者數是醫院工作量的重要指標之一,直接影響醫院的經濟效益和社會效益。利用數據挖掘技術中的灰色關聯分析方法對醫院收治患者數的影響因素進行分析:病床周轉次數、住院患者手術人次、年收治患者人數、平均開放病床數和年平均醫生人數與年收治患者數關聯程度等。
2.2.2.5醫院資源管理
①科室綜合評價分析:利用數據挖掘技術對醫院各科室進行綜合評價分析,選出代表性強、獨立性好,能反映科室工作效率、治療質量、經濟效益、綜合管理等的多項指標進行綜合評價分析,找到科室的薄弱環節,并采取相應的措施,以提高科室的綜合水平。②醫療設備績效預測分析:從HIS中的患者信息中提取病種、數量、診療類別等信息后與醫療設備使用信息相關聯,利用數據挖掘技術對所得到的信息進行深層次的數據挖掘,構建數據挖掘模型,利用已建立的數據挖掘模型,在醫療設備購置前對其績效進行預測,使醫院領導的決策更為準確、科學;在醫療設備投入使用后,對其績效進行準確評價,提高醫療設備的完好率和使用率。通過進一步的數據挖掘,實現對醫療設備從購置前的可行性論證到淘汰報廢的全程決策支持,使醫療設備的全壽命期都納入管理者的統籌管理之中,較好地解決醫療設備效益、代價、風險等互相制約的管理難題,充分發揮醫療設備的社會效益和經濟效益。因此本研究具有明確的推廣應用前景及重大應用意義。
2.3醫療數據挖掘的熱點及前景
當前,數據挖掘的研究方興未艾,其研究與開發的總體水平相當于數據庫技術在20世紀70年代所處的地位,迫切需要類似于關系模式、數據挖掘系統和SQL查詢語言等理論和方法的指導,才能使數據挖掘的應用得以普遍推廣。其研究可能會集中到幾個方面,而生物信息或基因的數據挖掘則是熱點之一。數據挖掘在醫院管理中的應用將會涉及醫療及管理的各個部分及層面,數據挖掘將形成系統,并通過廣泛深入的數據挖掘產生醫療方案數據庫,為合理診斷、完善臨床路徑,提供有效幫助;通過數據挖掘分析達到人力資源合理配置;通過數據挖掘為區域性衛生系統構建提供有效依據等。
3結論
數據挖掘技術是一門發展迅速新興的學科,它的產生與的發展是數據庫技術發展自然演化的結果,數據挖掘技術被專家預測可能是繼網絡技術之后的下一個技術熱點。隨著醫院信息管理的不斷發展,數據挖掘技術的應用必將在醫院的管理和決策中起著越來越重要的作用。目前我們正處于一個“信息爆炸、知識貧乏”的時代,如何從紛繁蕪雜的數據中找到我們需要的知識?只能是通過數據挖掘,去偽存真,發現現象背后的本質。通過對醫院豐富的數據進行數據挖掘,找出有利于治療、護理等方面的知識,提高我們的醫療水平,是我們醫院信息化工作者迫切的任務。