粗糙集

用手机看条目

出自 MBA智库百科(https://wiki.mbalib.com/)

粗糙集(Rough Sets)

目錄

什麼是粗糙集

  粗糙集是一種處理不精確、不確定和不完全數據的新的數學方法。它可以通過對數據的分析和推理來發現隱含的知識、揭示潛在的規律。在粗集理論中,知識被認為是一種分類能力。其核心是利用等價關係來對對象集合進行劃分。

  粗糙集理論提出了知識的約簡方法,是在保留基本知識(信息),同時保證對象的分類能力不變的基礎上,消除重覆、冗餘的屬性和屬性值,實現對知識的壓縮和再提煉。其操作步驟:(1)通過對條件屬性的約簡,即從決策表中消去某些列;(2)消去重覆的行和屬性的冗餘值

粗糙集的特點

  粗糙集最主要的特點是:它無需提供對知識或數據的主觀評價,僅根據觀測數據就能達到刪除冗餘信息,比較不完備知識的程度-粗糙度,界定屬性間的依賴性和重要性的目的。

粗糙集的基本概念

  粗糙集的基本概念有:

  • (1)信息系統。一般地,一個知識表達系統或信息系統可以表達成, 式中,為論域,它是全體樣本的集合;為屬性集合,其中子集是條件屬性集,反映對象的特征,D為決策屬性集,反映對象的類別;為屬性集合,表示屬性r的取值範圍;為一個信息函數,用於確定U中每一個對象的屬性值,即任一。
  • (2)不可分辨關係。當兩個對象由相同的屬性來描述時,這兩個對象在該系統中被歸於同一類,它們的關係稱之為不可分辨關係,即對於任一屬性子集,如果對象,,,當且僅當時,和是不可分辨關係,不可分辨關係簡稱等價關係。
  • (3)下近似集與上近似集。下近似集定義為:根據現有知識R,判斷U中所有肯定屬於X的對象所組成的集合,即,式中,表示等價關係R下包含關係x的等價類;上近似集定義為:根據現有知識R,判斷U中一定屬於和可能屬於X的對象所組成的集合。

粗糙集與模糊集比較

  粗糙集與模糊集都能處理不完備( imperfect) 數據, 但方法不同, 模糊集註重描述信息的含糊(vagueness) 程度, 粗糙集則強調數據的不可辨別( indiscern ib ility) , 不精確( imp recision) 和模棱兩可 (am b igu ity). 使用圖像處理中的語言來作比喻, 當論述圖像的清晰程度時, 粗糙集強調組成圖像象素的大小, 而模糊集則強調象素存在不同的灰度. 粗糙集研究的是不同類中的對象組成的集合之間的關係, 重在分類; 模糊集研究的是屬於同一類的不同對象的隸屬的關係,重在隸屬的程度. 因此粗糙集和模糊集是兩種不同的理論, 但又不是相互對立的, 它們在處理不完善數據方面可以互為補充.

粗糙集在數據挖掘中的應用

  粗集理論在數據挖掘中的應用相當廣泛,涉及的領域有醫療研究、市場分析、商業風險預測、氣象學、語音識別、工程設計等.在眾多的數據挖掘系統中,粗集理論的作用主要集中在以下幾個方面:

  1、數據約簡

  粗集理論可提供有效方法用於對信息系統中的數據進行約簡.在數據挖掘系統的預處理階段,通過粗集理論刪除數據中的冗餘信息(屬性、對象以及屬性值等),可大大提高系統的運算速度。

  2、規則抽取

  與其它方法(如神經網路)相比,使用粗集理論生成規則是相對簡單和直接的.信息系統中的每一個對象既對應一條規則,粗集方法生成規則的一般步驟為:(1)得到條件屬性的一個約簡,刪去冗餘屬性;(2)刪去每規則的冗餘屬性值;(3)對剩餘規則進行合併。

  3、增量演算法

  面對數據挖掘中的大規模、高維數據,尋找有效的增量演算法是一個研究熱點。

  4、與其他方法的融合

  粗集理論與其它方法如神經網路、遺傳演算法、模糊數學、決策樹等相結合可以發揮各自的優勢,大大增強數據挖掘的效率。   

本條目對我有幫助42
MBA智库APP

扫一扫,下载MBA智库APP

分享到:
  如果您認為本條目還有待完善,需要補充新內容或修改錯誤內容,請編輯條目

本条目由以下用户参与贡献

Zxe,Tiffany,KAER,方小莉,Tracy,LuyinT.

評論(共0條)

提示:評論內容為網友針對條目"粗糙集"展開的討論,與本站觀點立場無關。

發表評論請文明上網,理性發言並遵守有關規定。

打开APP

以上内容根据网友推荐自动排序生成

闽公网安备 35020302032707号