無監督離散化
用手机看条目
出自 MBA智库百科(https://wiki.mbalib.com/)
無監督離散化(Unsupervised Discretization)
目錄 |
[編輯]
無監督離散化是指在離散化過程中不使用類信息的方法。無監督離散化方法在離散過程中不考慮類別屬性,其輸入數據集僅含有待離散化屬性的值。早期的離散化方法如等頻率、等寬度離散化等主要是無監督的離散化。
[編輯]
無監督離散化過程劃分一個連續變數時,僅考慮這個屬性數據的分佈特性,而有監督的離散化過程,除此之外還需考慮每一個對象的分類信息。常用的無監督的離散化過程包括:
①等寬區間法;
②等頻區間法;
③串分析方法。
有監督的離散化是為了使被離散化屬性與分類屬性之間的某種關係測度最大化,例如可利用熵測度或信息增益測度(Quinlan,1993;Catlett,1991;Fayyad&Irani,1993)。無監督的離散化演算法運行速度快,而有監督的離散化演算法由於考慮了分類標識,因而可產生精度較高的離散樹。
[編輯]