分類資料的統計分析技巧

才智咖 人氣:1.48W

你知道分類資料的統計分析技巧有哪些嗎?你知道什麼是分類資料的統計分析嗎?下面是本站小編為大家帶來的關於分類資料的統計分析技巧的知識,歡迎閱讀。

分類資料的統計分析

1. 樣本資料與總體比較

1)二分類資料:

(1)小樣本資料:用二項分佈進行確切概率法檢驗;

(2)大樣本資料:用U檢驗;

2)多分類資料:用Pearson檢驗(又稱擬合優度檢驗)。

2. 四格表(2×2表)資料

1)完全隨機設計的四格表資料的分析

(1)當樣本量n>40,並且4個格子理論數均大於5時,則用Pearson 檢驗;

(2)當樣本量n>40,並且4個格子理論數均大於1且至少存在一個格子的理論數<5時,則用校正檢驗或用Fisher’s精確概率法檢驗;

(3)當樣本量n£40或存在任一格子理論數<1,則用精確概率法檢驗;

2)配對設計的四格表資料的分析

(1)b+c≥40,則用McNemar配對檢驗;

(2)b+c<40,則用二項分佈確切概率法檢驗;

3. 2×C表或R×2表資料的統計分析

1)列變數為效應指標,並且為有序多分類變數,行變數為分組變數,則可以採用行平均得分差(Row Mean Scores Differ)的CMH 或成組的Wilcoxon秩和檢驗;

2)列變數為效應指標並且為二分類,行變數為有序多分類變數,則可採用普通的Pearson 檢驗比較各組之間有無差別,如果總的來說有差別,還可進一步作兩兩比較,以說明是否任意兩組之間的差別都有統計學意義。

3)行變數和列變數均為無序分類變數:

(1)當樣本量n>40,並且理論數小於5的格子數少於行列表中格子總數的25%,則用Pearson 檢驗;

(2)當樣本量n£40,或理論數小於5的格子數多於行列表中格子總數的25%,則用Fisher’s確切概率法檢驗;

4. R×C表資料的統計分析

1)完全隨機設計的R×C表資料的統計分析

(1)列變數為效應指標,並且為有序多分類變數,行變數為分組變數,則CMH 或Kruskal Wallis的秩和檢驗;

(2)列變數為效應指標,並且為無序多分類變數,行變數為有序多分類變數,則採用普通的Pearson 檢驗比較各組之間有無差別,如果總的來說有差別,還可進一步作兩兩比較,以說明是否任意兩組之間的差別都有統計學意義;

(3)列變數和行變數均為有序多分類變數,可以作Spearman相關分析或者非零相關(none zero correlation)的CMH ;

(4)列變數和行變數均為無序多分類變數:

i. 當樣本量n>40並且理論數小於5的格子數少於行列表中格子總數的25%,則用Pearson 檢驗進行分析;

ii. 當樣本量n£40或理論數小於5的格子數多於行列表中格子總數的`25%,則用Fisher’s 確切概率法檢驗;

2)配對設計的C×C表資料:

(1)配對比較:用McNemar配對檢驗;

(2)一致性檢驗(Agreement):用Kappa檢驗;

Poisson分佈資料

1. 單樣本資料與總體比較:

1)當觀察值較小時:可以用確切概率法進行檢驗。

2) 當觀察值較大時:可以用正態近似的U檢驗。

2. 兩個樣本資料的比較:可以用正態近似的U檢驗。

兩個變數之間的關聯性分析

1. 兩個變數均為連續型變數

1)當兩變數為小樣本並且兩個變數服從雙常態分佈時,可以用Pearson相關係數來衡量兩個變數之間的關聯性;

2)當兩變數為大樣本或兩個變數不服從雙常態分佈,則用Spearman相關係數來衡量兩個變數之間的關聯性;

2. 如果兩個變數均為有序分類變數,可以用Spearman相關係數來衡量兩個變數之間的關聯性;

3. 如果一個變數為有序分類變數,另一個變數為連續型變數,可以用Spearman相關係數來衡量兩個變數之間的關聯性。

TAGS:統計分析