統計研究中的統計資料及其獲得方法探討

才智咖 人氣:2.67W

1資料的型別

統計研究中的統計資料及其獲得方法探討

在研究一個總體時.所要研究的每個特徵(指標或變數),在每個個體上,都有一個反映該特徵的具體描述(數字或文字),這些特徵的具體描述被稱為指標值(變數值)或資料。資料可以是定量的.例如工資收入,也可以是定性的,例如性別,還可以是半定量的,如受教育程度。定量資料和定性資料是對資料的一種分類,詳細劃分如下。

1.l刻度級資料

這是資料的最高階,該級別的資料.只能用數字來表示,是具有一定單位的實際測量值。它又可分為兩個子級別:比率級和間距級。

比率級是資料的最高階的測度級別.這類資料可以做加減運算,也可以作乘除運算,間距級的資料可以做加減運算.但不能夠做乘除運算,例如採用攝氏溫度時.不能說10度是5度的2倍,因為將這兩個攝氏溫度換算為熱力學溫度後.這兩個溫度便不再是2倍的關係。

1.2序次級資料

這是資料的中間級,該級別的資料,可以用數字來表示,也可以用字母來表示。例如受教育程度就是序次級資料.它可以採用數字編碼表示不同的型別,國小學歷=1.國中學歷=2;高中或中專=3;本科學歷=4;研究生學歷=5,各編碼的'序值.代表了受教育程度的高低差異。當然,也可以倒過來表示不同的學歷等級,資訊也不會有損失。這類資料雖然不能準確描述這一差別的大小,但是可以確定其順序.如例子中如果知道了研究生學歷高於本科學歷,則能夠推出本科學歷高於高中學歷。

1.3名義級資料

這是資料的最低階,該級別的資料.可以用數字來表示也可以用字母來表示。它僅僅是一種標誌,用以區分資料的不同值,但沒有序次的關係。例如,性別就是一個名義級的資料,可以用0表示男性.1表示女性:也可以用0表示女性.1表示男性:或是可以用任意兩個不同的數碼.或者文字表示類別。不論上述哪一種編碼,變數所包含的資訊都沒有任何損失。

2不同型別的資料的用途

資料的不同型別,其實也是變數的不同型別。在統計分析中,不同測度型別的資料.扮演著不同的角色,起著不同的作用。一般來說,資料的等級越高,應用範圍越廣泛:等級越低,應用範圍越受損。

2.1作為統計物件直接進入統計處理

首先.不同測度型別的資料都可以作為被統計物件直接進入統計處理。例如.刻度級中的比率級資料可以用來做迴歸分析,可以計算普通相關係數;區間級以上的資料可以用來計算均值:次序級資料可以用來計算等級的相關係數:名義級資料可以用來做相應變數的獨立性分析。例如,當我們獲得不同文化程度的顧客對不同包裝的偏愛資料後.我們可以用統計方法來分析兩個變數(文化程度、喜愛的包裝型別)是否相關。這裡