国产丁香婷婷妞妞基地-国产人人爱-国产人在线成免费视频麻豆-国产人成-91久久国产综合精品-91久久国产精品视频

公務員期刊網 論文中心 正文

淺談多維數據挖掘和決策樹粗糙集理論

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了淺談多維數據挖掘和決策樹粗糙集理論范文,希望能給你帶來靈感和參考,敬請閱讀。

淺談多維數據挖掘和決策樹粗糙集理論

摘要:隨著信息技術和數據庫技術的發展,數據存儲被越來越多的企業使用,機構和部門,這需要更多的智能和數據挖掘的更準確的方法。多維數據挖掘技術,包括聯機分析處理技術和數據挖掘技術的基礎上,建立了日益完善的數據倉庫技術和OLAP技術,使得用戶可以更方便的選擇和分析。本文主要研究和分析了粗糙集的多維數據挖掘,包括多維數據集的概念,決策樹技術和粗糙集的集成,以及基于粗糙集數據挖掘的多維設計。

關鍵詞:多維數據挖掘;粗糙集;決策樹技術

1概念的多維數據和粗糙集

1.1基本的OLAP多維數據集的概念

多維數據庫和多維數據集的多維數據庫中提出的物流方式。多維是人們觀察數據的特定。層次是指部門描述在不同程度的數據,例如,時間維度包括日,月,這樣的水平,年度和季度。成員的價值觀。數據單元數的多維數組的維數可以挑選出的成員,這些成員可以確定一個特定的值。度量,一般數值度量指標,用于描述數據。多維分析是一系列分析(切片,旋轉等)的數據(以多維的方式獲得)來觀察和控制更加全面而詳細的數據,并把信息和物質。數據層指的是多維數據集的一個子集,是由一個或幾個維度的維度的成員有限的任命。數據旋轉意味著改變尺寸的位置去觀察用戶從其他角度的多維數據。

1.2數據挖掘的概念

數據挖掘的功能是發現蘊含在其中的是很難找到的數據信息和技術。隨著人們日益增長的對信息的價值的知識,數據挖掘是逐步發展。這種技術可以解決信息不完全的數據過多的問題,建立關系模型和做出正確的預測。它具有傳統加工方法的特點和優勢,如處理大型數據庫;隨機信息查詢;有用的規則和合理的預測基于數據挖掘技術;及時響應和決心改變數據,包括尋找規律和管理,維護。這些規則是不斷更新新的數據進入,他們并不適合所有的數據,因為數據庫是非常大的,如果他們同意在一定范圍內適用。

1.3數據挖掘過程

數據挖掘主要包括四個環節:業務對象的確定和主題分析;數據預處理包括數據選擇,清洗,轉換和加載;對選定的知識水平直接相關的數據挖掘;驗證結果分析得到新的,可用的和可理解的數據;知識同化避免矛盾。

1.4粗糙集理論的基本知識

粗糙集理論已被應用于許多領域(機器學習,決策,流程分析,數據挖掘)。粗糙集理論是分類成集嵌入知識,并把它的一部分。在工業應用中,一些知識庫可能是如此復雜和龐大,多余部分應消除為了簡化知識。簡化的過程包括還原兩域。知識依賴也應該控制。在信息系統中的數據(決策表)的智能系統,可以以多種方式呈現,如語言形式和數字形式。不準確的數字形式會使獲得的信息不完全和不均勻,這個問題需要通過知識表示方法解決。這表示一般的信息系統(信息表)在粗糙集理論。知道的知識表示系統的概念可以很容易地以表格的形式表示的系統,即知識表示系統或信息系統的屬性值表。決策表,重要的和特殊的表,可以準確地描述一些復雜的邏輯和簡潔。這一決策表可以連接獨立的術語與幾個動作直接得到明確表示。

1.5粗糙集理論的五大特征

第一,它能處理各種數據,包括零碎的數據和數據的多變量;其次,它可以處理不精確的、模糊的數據,包括確定性和非確定性;第三,它可以計算出知識和知識水平的不同粒度最小的表示;第四,它可以揭示出的管理模式與簡單的概念;第五,它可以產生精確的規則易于檢查和驗證,特別適用于自動生成規則的智能控制。此外,粗糙集理論的最重要的優點是它能提供的先驗信息,除了數據集需要解決的問題。當然,這個理論不是萬能的。

2決策樹

2.1概述決策樹算法

數據分類是最常用的數據挖掘分析方法。具體地說,它是建立一個分類函數或模型圖的數據記錄到預先假定類和基于訓練集的了解數據的預測。高高的可理解性和決策樹方法簡單的計算成本,使得它越來越受歡迎。不過,有一定的隨機性和不確定性這一方法。決策樹是一種用于計算凈現值的期望值大于零,通過決策樹和價值上的所有情況的概率是已知的前提下,其可行性概率決策分析方法。這是一個直觀的使用概率分析的圖解法。它被稱為決策樹由于其決策機構圖看起來像一棵樹。在機器學習中,決策樹是一種表示對象的屬性和對象值之間的映射關系預測模型。決策節點的幾種可能方案的選擇,即最終優化方案。狀態節點代表的經濟效應(期望值)的替代方案。通過比較所有節點地位的經濟效果,最佳的方案可以在一些決策標準的選擇。結果節點代表自然條件下各方案的損益值。評價指標具體包括以下五個環節:預測精度,分類意義地模型來預測新的數據類型的能力;簡潔地描述,這一評價指標的決策取決于理解水平和對問題的描述方式;計算復雜,主要是指空間和實踐地復雜性因為他們都是計算成本密切相關;模型的魯棒性,這種評價指標是準確預測的基礎數據分類互補的能力,尤其是當有噪聲或數據不完整的治療手段;可擴展性,準確性和能力建設(分類)模型數據庫非常大的。

2.2基于粗糙集和決策樹的數據挖掘算法設計的集成

2.2.1描述算法分類是預測和評估新的案件類型的相似性通過根據現有的類型以掌握客觀事物存在的規則。分類主要是把相同的元素的特性(包括一些基本特征,在這種特征的對象的值)在一起。粗糙集離不開分類機制的支持。分類是一種等價關系,等價關系分類是這個空間的分類。決策樹是一種用實例來提高分類,歸納算法預測未知數據的處理和挖掘。粗糙集理論的數據預處理和對海量數據的處理和消除冗余屬性約簡的生命比其他方法更容易。然而,粗糙集理論沒有交叉驗證的特點,所以它可能不是很準確。決策樹方法具有高速,簡單,易懂的分類規則,但它是適用于數據集的屬性,可能會導致可怕的結構分類。總之,粗糙集和決策樹相互受益,他們都是用來處理離散數據。所以他們可以集成來降低數據的粗糙集消除冗余,然后發現分類規則的決策樹。

2.2.2算法程序基于粗糙集和決策樹相結合的數據挖掘算法的過程是逐步選擇的關鍵屬性,形成一個新的條件屬性集,并不斷重復這個過程直到D組趕上。

2.3比較算法

決策樹,也可稱為分類解析,將通過遞歸集合訓練直到所有的或大部分的記錄在每一個子集都是同一類型。主要的決策樹算法目前使用的方法基于信息理論和最小的基尼指數法。通常,歸納學習系統將得到一個決策樹的應用具有幾個優點:理解用戶;生成決策樹和處理大規模訓練集的能力的時間少;決策樹,也可稱為分類解析,將通過遞歸集合訓練直到所有的或大部分的記錄在每一個子集都是同一類型。主要的決策樹算法目前使用的方法基于信息理論和最小的基尼指數法。通常,歸納學習系統將得到一個決策樹的應用具有幾個優點:理解用戶;生成決策樹和處理大規模訓練集的能力的時間少;生成算法簡單的檢查;明確規定順序決策方法確定案件的類型;高精度。然而,有一些缺點和決策樹很容易被不相關的屬性的干擾。為了解決這一問題,粗糙集技術要求。根據決策樹的評價標準,這兩種技術的結合可以大大減少計算的復雜性和描述。

3基于粗糙集數據挖掘的多維設計

不斷提高數據倉庫技術和OLAP技術,多維技術(包括聯機分析處理和數據挖掘)創建。下面的過程是通過粗糙集理論和決策樹技術研究實現數據挖掘系統的設計。

3.1系統設計目標

本系統是通過在SQL服務器分析服務器環境VB.NET開發。應用該系統可以實現對數據的多維數據集,在這樣的環境中建立數據挖掘。在用戶選擇數據的維度和維度的層次結構,他們將得到不同的和全面的決策樹,通過本系統的內隱知識。此外,該系統還具有模型驗證功能。據此,用戶可以選擇最合適的挖掘模型,得到高精度的信息。

3.2系統設計

該系統有6個數據挖掘:數據準備;數據抽取;數據篩選;數據預處理;訓練數據集的決策樹分析;通過檢查數據集分析結果檢驗。數據準備需要建立多維數據集在SQL服務器分析服務器環境分析。ADOMD技術用于數據選擇。在選擇正確的尺寸和維度的層次結構和多維數據集的度量值,系統可生成MDX語句,得到相應的數據集。數據抽取是隨機抽取數據的隨機函數生成分析數據表,在前面的步驟中產生的數據是不準確的,足夠短暫。在這一環節產生的數據是未經預處理的,所以其決策屬性是連續的,有相當多的決策屬性。數據預處理是離散和減少訓練集。確保所有的連續屬性離散的等頻率離散化的措施。然后減少離散數據,并將數據集分成訓練數據和檢驗數據集。進行決策分析,對預處理后的數據集,包括建立數據挖掘模型,該模型加載選定的數據集和分析這些訓練集的決策樹。

4結論

總之,基于粗糙集和決策樹相結合的基礎上,該系統可以通過對多維數據集的數據挖掘算法的數據分析產生更全面的知識,以提高決策者的決策的準確性。目前,多維數據挖掘是不完善的,需要改進。例如,在知識約簡過程注意是不均勻的;該算法只適用于離散屬性值;有很多算法(時序分析)可用于多維數據挖掘。

參考文獻:

[2]高靜,徐章艷,宋威,等.一種新的基于粗糙集模型的決策樹算法[J].計算機工程,2008,34(3):9-11.

[4]羅秋瑾,陳世聯.基于值約簡和決策樹的最簡規則提取算法[J].計算機應用,2005,25(8):1853-1855.

[5]馬秀紅,宋建社,董晟飛.數據挖掘中決策樹的探討[J].計算機工程與應用,2004,40(1):185-185,214.

[6][德]M.巴斯蒂安.武森,高學東,譯.數據倉庫與數據挖掘[M].北京:冶金工業出版社,2003.

[7]翟俊海,王熙照,張滄生.基于粗糙集技術的決策樹歸納[J].計算機工程與應用,2009,45(18):45-47.

[8]黃宇穎.基于粗糙集的決策樹算法在體檢系統中的研究[J].計算機工程與應用,2008,44(25):78—80.

作者:戴艷麗 單位:宿遷高等師范學校

主站蜘蛛池模板: 欧美亚洲第一区 | 日韩一级片在线免费观看 | 国产黄色大片网站 | 亚洲国产欧洲精品路线久久 | 日韩freesex呦交 | 中文成人在线视频 | 131美女爱做免费毛片 | 日本欧美一区二区三区视频 | 欧美一区二区三区久久久人妖 | 国产91香蕉| 日韩一级在线播放免费观看 | 在线国产一区二区 | 亚洲精品国产专区91在线 | 成人免费久久精品国产片久久影院 | 国产综合精品久久久久成人影 | 91精品国产91久久久久青草 | 亚洲国产www | 亚洲一区二区三区免费 | 91精品国产色综合久久不 | 亚洲一区二区中文字幕 | 天天干亚洲| 国产亚洲欧美一区 | 成人毛片免费播放 | 一级毛片在线播放 | 欧洲亚洲综合一区二区三区 | 日本天堂免费 | 成人午夜天| 欧美国产精品一区二区免费 | 毛片搜索| 草草影音 | 亚洲二区在线播放 | 亚洲欧美视频在线 | 一级毛片免费视频观看 | 国产免费一级精品视频 | 国产亚洲一区二区三区在线观看 | 在线另类视频 | 免费国产不卡午夜福在线观看 | 黄网址在线看 | 亚洲人成网站在线观看播放 | 七七国产福利在线二区 | 男女性高清爱潮视频免费观看 |