亲爱的MBA智库百科用户:


过去的17年,百科频道一直以免费公益的形式为大家提供知识服务,这是我们团队的荣幸和骄傲。 然而,在目前越来越严峻的经营挑战下,单纯依靠不断增加广告位来维持网站运营支出,必然会越来越影响您的使用体验,这也与我们的初衷背道而驰。 因此,经过审慎地考虑,我们决定推出VIP会员收费制度,以便为您提供更好的服务和更优质的内容。


MBA智库百科VIP会员,您的权益将包括: 1、无广告阅读; 2、免验证复制。


当然,更重要的是长期以来您对百科频道的支持。诚邀您加入MBA智库百科VIP会员,共渡难关,共同见证彼此的成长和进步!



MBA智库百科项目组
2023年8月10日
百科VIP
未登录
无广告阅读
免验证复制
1年VIP
¥ 9.9
支付方式:
微信支付
支付宝
PayPal
购买数量:
1
应付金额:
9.9
汇率换算:
1.32
美元(USD)
  • 美元(USD)
  • 加元(CAD)
  • 日元(JPY)
  • 英镑(GBP)
  • 欧元(EUR)
  • 澳元(AUD)
  • 新台币(TWD)
  • 港元(HKD)
  • 新加坡(SGD)
  • 菲律宾(PHP)
  • 泰铢(THB)

按当月汇率换算,

包含手续费

打开手机微信 扫一扫继续付款
立即开通
PayPal支付后,可能会遇到VIP权益未及时开通的情况,请您耐心等待,或者联系百科微信客服:mbalib888。
温馨提示:当无法进去支付页面时,可刷新后重试或更换浏览器
开通百科会员即视为同意《MBA智库·百科会员服务规则》

支付成功

全球专业中文经管百科,由121,994位网友共同编写而成,共计436,064个条目

粗糙集

用手机看条目

出自 MBA智库百科(https://wiki.mbalib.com/)

(重定向自粗集理论)

粗糙集(Rough Sets)

目錄

[隱藏]

什麼是粗糙集

  粗糙集是一種處理不精確、不確定和不完全數據的新的數學方法。它可以通過對數據的分析和推理來發現隱含的知識、揭示潛在的規律。在粗集理論中,知識被認為是一種分類能力。其核心是利用等價關係來對對象集合進行劃分。

  粗糙集理論提出了知識的約簡方法,是在保留基本知識(信息),同時保證對象的分類能力不變的基礎上,消除重覆、冗餘的屬性和屬性值,實現對知識的壓縮和再提煉。其操作步驟:(1)通過對條件屬性的約簡,即從決策表中消去某些列;(2)消去重覆的行和屬性的冗餘值

粗糙集的特點

  粗糙集最主要的特點是:它無需提供對知識或數據的主觀評價,僅根據觀測數據就能達到刪除冗餘信息,比較不完備知識的程度-粗糙度,界定屬性間的依賴性和重要性的目的。

粗糙集的基本概念

  粗糙集的基本概念有:

  • (1)信息系統。一般地,一個知識表達系統或信息系統可以表達成, 式中,為論域,它是全體樣本的集合;為屬性集合,其中子集是條件屬性集,反映對象的特征,D為決策屬性集,反映對象的類別;為屬性集合,表示屬性r的取值範圍;為一個信息函數,用於確定U中每一個對象的屬性值,即任一。
  • (2)不可分辨關係。當兩個對象由相同的屬性來描述時,這兩個對象在該系統中被歸於同一類,它們的關係稱之為不可分辨關係,即對於任一屬性子集,如果對象,,,當且僅當時,和是不可分辨關係,不可分辨關係簡稱等價關係。
  • (3)下近似集與上近似集。下近似集定義為:根據現有知識R,判斷U中所有肯定屬於X的對象所組成的集合,即,式中,表示等價關係R下包含關係x的等價類;上近似集定義為:根據現有知識R,判斷U中一定屬於和可能屬於X的對象所組成的集合。

粗糙集與模糊集比較

  粗糙集與模糊集都能處理不完備( imperfect) 數據, 但方法不同, 模糊集註重描述信息的含糊(vagueness) 程度, 粗糙集則強調數據的不可辨別( indiscern ib ility) , 不精確( imp recision) 和模棱兩可 (am b igu ity). 使用圖像處理中的語言來作比喻, 當論述圖像的清晰程度時, 粗糙集強調組成圖像象素的大小, 而模糊集則強調象素存在不同的灰度. 粗糙集研究的是不同類中的對象組成的集合之間的關係, 重在分類; 模糊集研究的是屬於同一類的不同對象的隸屬的關係,重在隸屬的程度. 因此粗糙集和模糊集是兩種不同的理論, 但又不是相互對立的, 它們在處理不完善數據方面可以互為補充.

粗糙集在數據挖掘中的應用

  粗集理論在數據挖掘中的應用相當廣泛,涉及的領域有醫療研究、市場分析、商業風險預測、氣象學、語音識別、工程設計等.在眾多的數據挖掘系統中,粗集理論的作用主要集中在以下幾個方面:

  1、數據約簡

  粗集理論可提供有效方法用於對信息系統中的數據進行約簡.在數據挖掘系統的預處理階段,通過粗集理論刪除數據中的冗餘信息(屬性、對象以及屬性值等),可大大提高系統的運算速度。

  2、規則抽取

  與其它方法(如神經網路)相比,使用粗集理論生成規則是相對簡單和直接的.信息系統中的每一個對象既對應一條規則,粗集方法生成規則的一般步驟為:(1)得到條件屬性的一個約簡,刪去冗餘屬性;(2)刪去每規則的冗餘屬性值;(3)對剩餘規則進行合併。

  3、增量演算法

  面對數據挖掘中的大規模、高維數據,尋找有效的增量演算法是一個研究熱點。

  4、與其他方法的融合

  粗集理論與其它方法如神經網路、遺傳演算法、模糊數學、決策樹等相結合可以發揮各自的優勢,大大增強數據挖掘的效率。   

本條目對我有幫助56
MBA智库APP

扫一扫,下载MBA智库APP

分享到:
  如果您認為本條目還有待完善,需要補充新內容或修改錯誤內容,請編輯條目投訴舉報

本条目相关课程

本条目由以下用户参与贡献

Zxe,Tiffany,KAER,方小莉,Tracy,LuyinT.

評論(共0條)

提示:評論內容為網友針對條目"粗糙集"展開的討論,與本站觀點立場無關。

發表評論請文明上網,理性發言並遵守有關規定。

打开APP

以上内容根据网友推荐自动排序生成

官方社群
下载APP
告MBA智库百科用户的一封信
亲爱的MBA智库百科用户: 过去的17年,百科频道一直以免费公益的形式为大家提供知识服务,这是我们团队的荣幸和骄傲。 然而,在目前越来越严峻的经营挑战下,单纯依靠不断增加广告位来维持网站运营支出,必然会越来越影响您的使用体验,这也与我们的初衷背道而驰。 因此,经过审慎地考虑,我们决定推出VIP会员收费制度,以便为您提供更好的服务和更优质的内容。 MBA智库百科VIP会员(9.9元 / 年,点击开通),您的权益将包括: 1、无广告阅读; 2、免验证复制。 当然,更重要的是长期以来您对百科频道的支持。诚邀您加入MBA智库百科VIP会员,共渡难关,共同见证彼此的成长和进步!
MBA智库百科项目组
2023年8月10日

闽公网安备 35020302032707号

添加收藏

    新建收藏夹

    编辑收藏夹

    20