工資收入差異分析

才智咖 人氣:1.05W

 工資收入差異分析
   為了考察工資收入是否與性別,年齡,學歷,企業規模有關,我們建立計量經濟學模型對其進行分析判斷和預測,因國內資料不好查詢,我們在這個模型中就引用日本的資料建立模型。
 下表列出的15個工人月收入以及相應的性別,年齡層(30多歲與40多歲),學歷(大學畢業,高中畢業,國中畢業),企業規模(大型企業,中型企業,小型企業)之間的關係。根據這些定性資料,通過這些定性資料,通過小面問題分析收入差距的原因。
為了將定性資料作為解釋變數納入模型,引入下面六個虛擬變數。根據下表製作虛擬變數的資料表。
    
      性別 S          S=1     男性         S=0     女性
      年齡A          A=1     40多歲      A=0     30多歲
      學歷(1)          E1`=1   大學畢業     E1=0     其他
      學歷(2)       E2=1    高中畢業     E2=0     其他
      企業規模(1)   F1=1    大型企業     F1=0     其他
 企業規模(2)   F2=1    中小型企業   F2=0     其他
設定模型
Y=α+β1S+β2A+β3 E1 +β4 E2 +β5 F1 +β6 F2 +u
α>0 , β1>0 , β2>0 , β3>0 , β4>0 , β5>0 , β6>0
 估計模型的引數,檢驗引數和整體模型並對模型進行修正
 計算下列屬性所對應的月收入
a)大型企業中40多歲男性大學畢業工人的月收入Ya
    b)中型企業中30多歲女性大學畢業工人的月收入Yb
   c)小型企業中30多歲男性國中畢業工人的月收入Yc
表1        月收入與性別、年齡層、學歷、企業規模之間的關係
月收入(萬日元) 性別 年齡層 學歷 企業規模
25 女性 40多歲 國中畢業 小企業
26 男性 30多歲 國中畢業 小企業
28 女性 40多歲 高中畢業 小企業
30 女性 40多歲 高中畢業 小企業
31 男性 30多歲 國中畢業 中企業
32 男性 30多歲 高中畢業 小企業
34 女性 30多歲 大學畢業 中企業
36 男性 30多歲 高中畢業 中企業
39 女性 30多歲 大學畢業 大企業
40 男性 30多歲 高中畢業 中企業
43 男性 30多歲 大學畢業 小企業
46 男性 30多歲 大學畢業 中企業
52 男性 40多歲 國中畢業 大企業
54 女性 40多歲 大學畢業 大企業
55 男性 40多歲 高中畢業 大企業

工資收入差異分析


表2                     製作虛擬變數處理後的資料表
月收入(萬日元)Y 性別S 年齡層A 學歷 企業規模
   大學畢業E1` 高中畢業E2 大型企業F1 中型企業F2
25 0 1 0 0 0 0
26 1 0 0 0 0 0
28 0 1 0 1 0 0
30 0 1 0 1 0 0
31 1 0 0 0 0 1
32 1 0 0 1 0 0
34 0 0 1 0 0 1
36 1 0 0 1 0 1
39 0 0 1 0 1 0
40 1 0 0 1 0 1
43 1 0 1 0 0 0
46 1 0 1 0 0 1
52 1 1 0 0 1 0
54 0 1 1 0 1 0
55 1 1 0 1 1 0
      

引數估計
表3                 最小二乘估計
Dependent Variable: Y
Method: Least Squares
Date: 12/15/03   Time: 20:14
Sample: 1986 2000
Included observations: 15
Variable Coefficient Std. Error t-Statistic Prob. 
C 11.96613 1.694604 7.061317 0.0001
S 14.38476 1.238761 11.61222 0.0000
A 12.64252 1.519607 8.319597 0.0000
E1 15.87300 1.466859 10.82108 0.0000
E2 5.082785 1.119298 4.541047 0.0019
F1 12.15240 1.326189 9.163398 0.0000
F2 5.543744 1.196137 4.634706 0.0017
R-squared 0.983316    Mean dependent var 38.06667
Adjusted R-squared 0.970802     S.D. dependent var 10.06029
S.E. of regression 1.719035     Akaike info criterion 4.226127
Sum squared resid 23.64064     Schwarz criterion 4.556551
Log likelihood -24.69596     F-statistic 78.58178
Durbin-Watson stat 2.283073     Prob(F-statistic) 0.000001
有表3的資料可以得出以下估計結果:
Y = 11.966 + 14.385S + 12.643A + 15.873E1 + 5.083E2 + 12.152F1 + 5.544F2
    (7.061)  (11.612)  (8.320)   (10.821)   (4.541)   (9.163)    (4.635)
 _
 R2 = 0.9708
(1)經濟意義檢驗
所有的引數都為正數,即性別、年齡、學歷和所在企業的大小對月收入有正面的影響,符合經濟意義。
(2)統計推斷檢驗
 (a)擬和優度檢驗
 可決係數R2 = 0.983316  說明模型在整體上擬和很好,Y 的總差由模型作出了絕大部分解釋。
  _
 R2 = 0.9708也說明模型中各個解釋變數對應變數的聯合影響程度很大
 (b)迴歸引數的顯著性檢驗——T檢驗
     在顯著性水平a=0.01條件下ta/2 (n-k)= ta/2 (15-6) =3.250  模型估計的.各引數的T值都大於3.250。說明各個解釋變數對應變數的影響都是顯著的。即性別,年齡,學歷,企業大小對月收入有顯著影響。
 (c)迴歸方程的顯著性檢驗——F檢驗
 在顯著性水平a=0.01條件下,F0。01(k-1,n-k)= F0。01 (6-1,15-6)=6.06  模型中的F-statistic=78.5819 大於6.06,說明迴歸方程顯著,即各個解釋變數同應變數之間存在顯著的線性關係。
(3)計量經濟學檢驗
(a)多重共線性檢驗
  表4                    Correlation  Matrix
 S A E1 E2 F1 F2
S  1.000000 -0.444444 -0.288675 0.111111 -0.123091 -0.288675
A -0.444444 1.000000 -0.288675 0.166667 0.430820 -0.577350
E1 -0.288675 -0.288675 1.000000 -0.577350 0.213201 0.100000
E2 0.111111 0.166667 -0.577350 1.000000 -0.184637 -0.184637
F1 -0.123091 0.430820 0.213201 -0.184637 1.000000 -1.07E-18
F2 0.288675 -0.57750 0.100000 -1.07E-18 0.426401 1.000000

  由表4可以看出,解釋變數之間不存在嚴重的多重共線性,各解釋變數之間的干擾程度不大,不需要進行修正。
(b)異方差檢驗
 a White 檢驗


表5            White 檢驗
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 12/15/03   Time: 21:54
Sample: 1986 2000
Included observations: 15
Variable Coefficient Std. Error t-Statistic Prob. 
C 14.63007 15.55903 0.940295 0.3746
S 2.538157 11.37371 0.223160 0.8290
A -6.248568 13.95230 -0.447852 0.6661
E1 -0.105573 13.46799 -0.007839 0.9939
E2 -5.147135 10.27685 -0.500847 0.6300
F1 2.974629 12.17643 0.244294 0.8132
F2 -2.860708 10.98235 -0.260482 0.8011
R-squared 0.125144     Mean dependent var 11.39916
Adjusted R-squared -0.530998     S.D. dependent var 12.75592
S.E. of regression 15.78335     Akaike info criterion 8.660512
Sum squared resid 1992.912     Schwarz criterion 8.990936
Log likelihood -57.95384     F-statistic 0.190727
Durbin-Watson stat 2.370596     Prob(F-statistic) 0.970773

 計算n R2  = 15×0.125144 = 1.87716  在顯著性水平a=0.01條件下,X2 0.01 (P>5) 都大於
1.87716 ,即可接受原假設,隨機誤差u 不存在異方差性。
(c)自相關檢驗
       DW檢驗   由表1中估計的結果,DW=2.283073 ,在給定顯著性水平a=0.01 ,查
Durbin-Watson表,n = 15 k = 6 得下限臨界值dL = 0.447  dU  = 2.472  dL  < DW <  dU
無法判斷是否自相關
 圖示法                圖1
 
由圖1可以看出Et 呈線性自迴歸,表明隨機誤差項ut存在一階自相關。

自相關的修正           
 廣義差分法
B = 1-1/2DW=1-1.1515=-0.1415 
表6           廣義差分
Dependent Variable: Y
Method: Least Squares
Date: 12/16/03   Time: 14:40
Sample(adjusted): 1987 2000
Included observations: 14 after adjusting endpoints
Convergence achieved after 6 iterations
Variable Coefficient Std. Error t-Statistic Prob. 
S 21.09362 3.611608 5.840508 0.0006
A 17.71164 2.154693 8.220025 0.0001
E1 18.49486 1.778017 10.40196 0.0000
E2 5.164674 1.203522 4.291300 0.0036
F1 12.32894 1.329580 9.272804 0.0000
F2 5.480673 0.985115 5.563484 0.0008
AR(1) 0.857726 0.140809 6.091408 0.0005
R-squared 0.975461     Mean dependent var 38.35714
Adjusted R-squared 0.954428     S.D. dependent var 10.37458
S.E. of regression 2.214732     Akaike info criterion 4.734993
Sum squared resid 34.33528     Schwarz criterion 5.054522
Log likelihood -26.14495     Durbin-Watson stat 2.055093
Inverted AR Roots        .86

DW=2.055039 仍落在了不能判斷的{dL = 0.447 , dU  = 2.472}內。
表7             Cochrane---Qrcutt迭代法
Dependent Variable: Y
Method: Least Squares
Date: 12/16/03   Time: 13:14
Sample(adjusted): 1987 2000
Included observations: 14 after adjusting endpoints
Convergence achieved after 59 iterations
Variable Coefficient Std. Error t-Statistic Prob. 
C 11.56912 1.862201 6.212606 0.0008
S 14.69725 1.440980 10.19948 0.0001
A 12.32374 1.614937 7.631096 0.0003
E1 16.24810 1.721711 9.437182 0.0001
E2 5.339722 1.406899 3.795384 0.0090
F1 12.54277 1.464528 8.564375 0.0001
F2 5.456586 1.544637 3.532600 0.0123
AR(1) -0.299458 0.470966 -0.635837 0.5484
R-squared 0.982395     Mean dependent var 39.00000
Adjusted R-squared 0.961856     S.D. dependent var 9.742847
S.E. of regression 1.902819     Akaike info criterion 4.420109
Sum squared resid 21.72432     Schwarz criterion 4.785285
Log likelihood -22.94076     F-statistic 47.83089
Durbin-Watson stat 2.414916     Prob(F-statistic) 0.000076
Inverted AR Roots       -.30
DW=2.4149 有所提高但仍落在了不能判斷的{dL = 0.447 , dU  = 2.472}內。
儘管如此,由於此模型中各個解釋變數對應變數的單獨影響和聯合影響都很顯著
且模型沒有多重共線性和異方差,與我們設想的一樣,性別、學歷、年齡和企業大小對工資收入有明顯的影響,因此我們仍用此模型對工資作出預測:
a)大型企業中40多歲男性大學畢業工人的月收入Y1
Y1= 11.966 + 14.385*1 + 12.643A*1+ 15.873*1 + 5.083*0 + 12.152*1 + 5.544*0
  =67.190(萬日元)
    b)中型企業中30多歲女性大學畢業工人的月收入Y2
Y2= 11.966 + 14.385*0 + 12.643A*0+ 15.873*0 + 5.083*1 + 12.152*0 + 5.544*1
  =22.593(萬日元)
    C)小型企業中30多歲男性國中畢業工人的月收入Y3
Y3= 11.966 + 14.385*1 + 12.643A*0+ 15.873*0 + 5.083*0 + 12.152*0 + 5.544*0
  =26.351(萬日元)