相關矩陣
出自 MBA智库百科(https://wiki.mbalib.com/)
相關矩陣(Correlation Matrix)
目錄 |
相關矩陣概述[1]
P個相關變數,求兩變數之間的相關係數,共可得個相關係數。如按變數的編號順序,依次將它們排列成一數字方陣,此方陣就稱為相關矩陣。常用字母R表示。
從左上到右下方向的對角線上,均是兩個相同變數的相關,其數值均是1,對角線以上部分的相關係數與以下部分的相關係數是對稱的。
幾種常見的組內相關矩陣[2]
下麵介紹幾種常見的組內相關矩陣結構。以重覆測量資料為例,常見的有等相關、相鄰相關、自相關、非確定相關等。其中最常用的是等相關與自相關。
1.等相關最簡單的組內相關是等相關,又稱為可交換的(exchangeable),或復對稱的(compound symmetry)。即:2.相鄰相關相鄰相關即只有相鄰的重覆觀察值之間是相關的,否則不相關。1階相鄰相關是指相鄰的兩次觀察值間有相關。當各相鄰相關係數都相等時,這種相關稱為1階平穩的(stationary 1-de-pendence),否則稱為1階非平穩的(nonstationary 1-dependence)。
以5次重覆測量為例,1階平穩和非平穩相鄰相關的組內相關結構分別為:不難推廣到k階相鄰相關的情形。顯然,平穩相關是非平穩相關的特例,等相關是平穩相關(當然也是非平穩相關)的特例。
3.自相關(autocorrelation)即相關與間隔次數有關,相鄰的兩次觀察值間相關為ρ,相隔次數越長,相關關係越小,以5次重覆測量為例,其組內相關結構為:4.非確定相關(unstructured,general structure)即相關矩陣的非對角線上的元素均不等。
5.獨立(independent,zero correlation)即塊矩陣A的非對角線上的元素均為0。
雖然組內相關矩陣結構的選擇可藉助於統計學方法進行判斷,但對具體資料,筆者建議按專業知識來確定其結構。
相關矩陣分析法[3]
相關矩陣分析法是20世紀70年代初,聯合國教科文組織在各國專家的協助下,建立和發展起來的一套確定科技優先發展領域的系統性方法。其核心就是在技術專家協助下,編製和分析D/D矩陣(發展目標之間的相關矩陣)、S/D矩陣(學科領域與發展目標的相關矩陣)和S/S矩陣(學科領域之間的相關矩陣),該方法運用的關鍵是:①確定好問題的邊界(發展目標和科技領域條目劃分);②設計好專家調查表(科學、合理、簡便),選擇好咨詢專家;③做好三個相關矩陣的構造和系統分析。
案例一:[4]
通過考查相關矩陣來研究廣告費、銷售量和每加侖價格之間的關係。相關矩陣通過計算各對變數相互間的簡單相關係數來構造。
相關矩陣實例如表1所示。代表變數1和變數2之間關係的相關係數表示為r12。註意,第一個下標1指在表格中所在的行,第二個下標2指在表格中所在的列。這一方法使人一眼就能確定任何兩個變數之間的關係。當然,變數1和變數2之間的相關性與變數2和變數1之間的相關性相同,即r12 = r21。因此,只需要1/2的相關矩陣。此外,一個變數與它本身的相關性總是等於1,例如r11 = r22 = r33 = 1。
用電腦運行數據,所得到的相關矩陣如表2所示。對廣告費、銷售量和每加侖價格之間關係的調查顯示,新的自變數有助於改進預測結果。相關矩陣顯示,廣告費與因變數(銷售量)有很高的正相關性(r13 = 0.89),與自變數(每加侖價格)有比較適度的負相關性(r23 = − 0.65)。這一相互關係的組合可以由廣告費來解釋一些不能被每加侖價格解釋的銷售量的總方差。我們將會看到,當同時使用每加侖價格和廣告費來估算銷售量時,R2增加到了93.2%。
相關矩陣的分析對涉及多個自變數問題的解決是重要的開始步驟。
表1 相關矩陣
變數 | |||
---|---|---|---|
變數 | 1 | 2 | 3 |
1 | r11 | r12 | r13 |
2 | r21 | r22 | r23 |
3 | r31 | r32 | r33 |
表2 數據的相關矩陣
變數 | |||
---|---|---|---|
變數 | 銷售額 1 | 價格 2 | 廣告費 3 |
銷售額1 | 1.00 | -0.86 | 0.89 |
價格2 | 1.00 | -0.65 | |
廣告費3 | 1.00 |