逐步判別法
出自 MBA智库百科(https://wiki.mbalib.com/)
目錄 |
逐步判別法是利用一些檢驗規則,對變數進行逐步篩選,同時進行判別的一種方法。
逐步判別法的理論基礎是附加信息檢驗。
設有 K 個母體G1,…,GK,它們的分佈是 N ,今從這K個母體分別抽了n1,…nk個樣品,為了對這K個母體建立判別函數,需要檢驗。
H0:μ1 =…= μK
當H0被接受時,說明區分這 K 個總體是無意義的,當假定被否定時,說明這K個母體可以區分,建立判別函數是有意義的。考慮為了區分這K個母體,原來選擇的這 M 個指標是否可以減少而達到同樣的判別效果,也就是說要去掉一些區分 K 個母體不帶附加信息的變數。
逐步判別法的基本思想是:逐步引入變數,每次引入一個"最重要"的變數,同時也檢驗先前引入的變數,如果先前引入的變數其判別能力隨新引入變數而變不顯著,則及時將其從判別式中剔除,直到判別式中的變數都很顯著,且剩下來的變數也沒有重要的變數可引入判別式時,逐步篩選結束。其實逐步判別和逐步回歸的思想差不多,就是不斷的對篩選的變數作檢驗,找出顯著性變數,剔除不顯著變數。
在y1,y2,…ym中先選出一個變數,它使維爾克斯統計量達到最小。不失一般性,假設挑選的變數次序是按自然的次序,即第 r 步正好選中yr,第一步選中y1,則
Λ1=min{Λi}
並考察Λ1是否落入接受域,如不顯著,則表明一個變數也選不中,不能用判別分析;如顯著,則進入下一步。
在未選中的變數中,計算它們與已選中的變數y1配合的Λ值,選擇使Λ1i達到極小的作為第二個變數。
仿此,如已選入了 r 個變數,不防設y1,…yr,則在為選中的變數中逐次選一個與它們配合,計算Λ{1,2,…,r,l} ,選擇使上式達到極小的變數作為第 r+1 個變數,並檢驗新選的第 r+1 個變數能否提供附加信息,如不能則轉入5,否則轉入4
在已選入的 r 個變數中,要考慮較早選中的變數中其重要性有沒有較大的變化,應及時把不能提供附加信息的變數剔除出去。剔除的原則同於引進的原則。例如在已進入的r個變數中要考察yl是否需要剔除,就是計算Λ{l.1,…,l-1,,l+1,…}, r 選擇達到極小的l,看是否顯著,如不顯著將該變數剔除,仍回到4,,繼續考察餘下的變數是否需要剔除,如顯著則回到3。
這時既不能選進新變數,又不能剔除已選進的變數,將已選中的變數建立判別函數。