影響糧食產量的相關因素分析

才智咖 人氣:2.4W

影響糧食產量的相關因素分析
   為了研究中國影響糧食產量的各種因素,通過經濟理論分析得出糧產量與以下四個因素有關 ,現建模如下:y=α+β1X1+β2X2+β3X3+β4X4+U
X1:農業機械總動力(萬千瓦)
X2:有效灌溉面積(千公頃)
 X3:化肥施用量(萬噸)
 X4:農業從業人員(萬人)
 Y:糧食總產量(萬噸)
 資料資料如下:
地區 X1 X2 X3 X4 Y
北  京   399.2 328.2 17.9 69.7 144.2
 天  津   593.4 353.2 16.6 79.7 124.1
 河  北   7000.4 4482.3 270.6 1665.5 2551.1
 山  西   1701.3 1105 87 658.3 853.4
 內蒙古   1350.3 2371.7 74.8 524.3 1241.9
 遼  寧   1339.8 1440.7 109.8 651.2 1140.0
 吉  林   1015.4 1315.1 112.1 516.8 1638.0
 黑龍江   1613.8 2032 121.6 744.1 2545.5
 上  海   142.5 285.9 19.3 84.6 174.0
 江  蘇   2925.3 3900.9 335.5 1480.2 3106.6
 浙  江   1990.1 1403.2 89.7 1014.9 1217.7
 安  徽   2975.9 3197.2 253.2 2001.8 2472.1
 福  建   873.3 940.2 123.3 768.7 854.7
 江  西   902.3 1903.4 106.9 983.4 1614.6
 山  東   7025.2 4824.9 423.2 2462.6 3837.7
 河  南   5780.6 4725.3 419.5 3558.6 4101.5
 湖  北   1414.0 2072.5 247.1 1159.1 2218.5
 湖  南   2209.7 2677.5 182.2 2071.4 2767.9
 廣  東   1763.9 1478.5 176.2 1570.1 1760.1
 廣  西   1467.9 1501.6 157.8 1556.8 1528.5
 海  南   200.9 179.8 26.3 177.2 199.6
 重  慶   586.5 624.6 72 921.5 1106.9
 四  川   1679.7 2469 212.6 2631.1 3372.0
 貴  州   618.6 653.4 71.3 1372.1 1161.3
 雲  南   1301.3 1403.4 112.1 1674.3 1467.8
 西  藏   114.5 157 2.5 90.1 96.2
 陝  西   1042.9 1308 131.2 1002.2 1089.1
 甘  肅   1056.9 981.5 64.5 697.5 713.5
 青  海   256.2 211.4 7.2 142.3 82.7
 寧  夏   380.6 398.8 23.6 153.1 252.7
 新  疆   851.2 3094.3 79.2 314.5 783.7
 第一,進行OLS檢驗
Dependent Variable: Y
Method: Least Squares
Date: 05/16/04   Time: 14:53
Sample: 1 31
Included observations: 31
Variable Coefficient Std. Error t-Statistic Prob. 
X1 -0.136288 0.087494 -1.557681 0.1314
X2 0.301594 0.134812 2.237136 0.0341
X3 5.578372 1.919377 2.906345 0.0074
X4 0.359531 0.151924 2.366526 0.0257
C 79.59973 119.3616 0.666879 0.5107
R-squared 0.902706     Mean dependent var 1490.890
Adjusted R-squared 0.887738     S.D. dependent var 1141.343
S.E. of regression 382.4131     Akaike info criterion 14.87757
Sum squared resid 3802234.     Schwarz criterion 15.10886
Log likelihood -225.6023     F-statistic 60.30791
Durbin-Watson stat 1.447710     Prob(F-statistic) 0.000000
 從估計結果可以看出,模型擬合較好,可決係數R2=0.9027,表明模型在整體上擬合非常好。係數顯著性檢驗:對於β,T統計量為負,說明β1未通過檢驗,即農業機械總動力對糧產量的'影響不顯著,初步決定刪除X1。
 第二,從影響糧產量的因素來看,所選的四個解釋變數與糧產量都有密切關係,因此它們之間可能具有較強的共線性,現進行多重共線性檢驗:
 (1)根據簡單相關係數公式,該模型中四個解釋變數得相關係數矩陣如圖所示:
 X1 X2 X3 X4
X1 1 0.882038357851 0.863333559223 0.714970041093
X2 0.882038357851 1 0.901769706417 0.731461937668
X3 0.863333559223 0.901769706417 1 0.848157708636
X4 0.714970041093 0.731461937668 0.848157708636 1
     由此可知,X2與X3的相關係數較高,說明它們之間可能存在共線性。
 (2)修正
 運用OLS方法逐一用Y對X1,X2,X3,X4迴歸
 Y 對X1迴歸
Dependent Variable: Y
Method: Least Squares
Date: 05/16/04   Time: 15:00
Sample: 1 31
Included observations: 31
Variable Coefficient Std. Error t-Statistic Prob. 
X1 0.496455 0.073612 6.744229 0.0000
C 648.9313 180.3059 3.599057 0.0012
R-squared 0.610658     Mean dependent var 1490.890
Adjusted R-squared 0.597232     S.D. dependent var 1141.343
S.E. of regression 724.3415     Akaike info criterion 16.07074
Sum squared resid 15215448     Schwarz criterion 16.16326
Log likelihood -247.0965     F-statistic 45.48463
Durbin-Watson stat 1.403900     Prob(F-statistic) 0.000000
 Y 對X2迴歸
Dependent Variable: Y
Method: Least Squares
Date: 05/16/04   Time: 15:01
Sample: 1 31
Included observations: 31
Variable Coefficient Std. Error t-Statistic Prob. 
X2 0.727633 0.074609 9.752561 0.0000
C 227.6144 164.1219 1.386862 0.1761
R-squared 0.766341     Mean dependent var 1490.890
Adjusted R-squared 0.758284     S.D. dependent var 1141.343
S.E. of regression 561.1372     Akaike info criterion 15.56015
Sum squared resid 9131373.     Schwarz criterion 15.65266
Log likelihood -239.1823     F-statistic 95.11244
Durbin-Watson stat 0.880823     Prob(F-statistic) 0.000000
 Y對 X3迴歸
Dependent Variable: Y
Method: Least Squares
Date: 05/16/04   Time: 15:02
Sample: 1 31
Included observations: 31
Variable Coefficient Std. Error t-Statistic Prob. 
X3 9.366144 0.684930 13.67460 0.0000
C 238.0023 119.2935 1.995098 0.0555
R-squared 0.865737     Mean dependent var 1490.890
Adjusted R-squared 0.861108     S.D. dependent var 1141.343
S.E. of regression 425.3585     Akaike info criterion 15.00608
Sum squared resid 5246965.     Schwarz criterion 15.09860
Log likelihood -230.5943     F-statistic 186.9948
Durbin-Watson stat 1.848900     Prob(F-statistic) 0.000000
 Y對 X4迴歸
Dependent Variable: X4
Method: Least Squares
Date: 05/16/04   Time: 15:02
Sample: 1 31
Included observations: 31
Variable Coefficient Std. Error t-Statistic Prob. 
Y 0.659424 0.073216 9.006522 0.0000
C 53.24803 136.6499 0.389668 0.6996
R-squared 0.736645     Mean dependent var 1036.377
Adjusted R-squared 0.727564     S.D. dependent var 876.9039
S.E. of regression 457.7038     Akaike info criterion 15.15266
Sum squared resid 6075291.     Schwarz criterion 15.24518
Log likelihood -232.8663     F-statistic 81.11745
Durbin-Watson stat 1.402526     Prob(F-statistic) 0.000000
 由此,X3的可決係數最高,說明Y對X3的線性關係最強,結合經濟意義和統計檢驗,選出如下線性迴歸方程:
Y=238.0023+9.366x3
(1.995)   (13.6746)
R2=0.866  SE=425.3585  F=18609948
 以它為基礎逐步迴歸:
1,Y=230.705-0.054X1+10.112X3
   (1.905)  (-0.629)  (70372)
  R2=0.868  SE=429.86  F=91.749
2,Y=148.389-0.135X1+0.259X2+8.379X3
 (1.184)  (-1.428)  (1.798)(5.125)
 R2=0.882   SE=413.7   F=67.1
3,Y=79.599-0.136X1+0.302X2+5.578X3+0.359X4
   (0.667) (-1.56)(2.237)(2.906) (2.367)
   R2=0.903   SE=382.413  F=60.308
 由此可見,X1對Y影響並不顯著,現決定將X1刪除,得如下模型:
Dependent Variable: Y
Method: Least Squares
Date: 05/16/04   Time: 15:19
Sample: 1 31
Included observations: 31
Variable Coefficient Std. Error t-Statistic Prob. 
X2 0.202652 0.122011 1.660927 0.1083
X3 4.802746 1.901996 2.525107 0.0177
X4 0.358288 0.155883 2.298444 0.0295
C 125.2837 118.7193 1.055293 0.3006
R-squared 0.893626     Mean dependent var 1490.890
Adjusted R-squared 0.881807     S.D. dependent var 1141.343
S.E. of regression 392.3843     Akaike info criterion 14.90227
Sum squared resid 4157066.     Schwarz criterion 15.08731
Log likelihood -226.9853     F-statistic 75.60752
Durbin-Watson stat 1.440474     Prob(F-statistic) 0.000000

影響糧食產量的相關因素分析

 第三,由於隨機擾動項可能包含對糧產量的影響因素,從而使得隨機擾動項可能出現自相關,現檢驗如下:
 (1)圖示

 從圖中可以看出,殘差成線性自迴歸,說明隨機擾動項存在自相關。
DW檢驗
 DW=1.44 DL=1.229 DU=1.650 無法確定是否存在自相關,需進一步檢驗
修正
 由DW=1.44,算出ρ=0.28。分別對Y,X2,X3,X4作廣義差分得如下模型:
Dependent Variable: DY
Method: Least Squares
Date: 05/16/04   Time: 15:56
Sample(adjusted): 2 31
Included observations: 30 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob. 
DX2 0.255981 0.113195 2.261408 0.0323
DX3 4.192208 1.727270 2.427072 0.0225
DX4 0.357679 0.154627 2.313172 0.0289
C 82.65742 100.1592 0.825260 0.4167
R-squared 0.892301     Mean dependent var 1111.730
Adjusted R-squared 0.879874     S.D. dependent var 1106.490
S.E. of regression 383.5008     Akaike info criterion 14.86013
Sum squared resid 3823895.     Schwarz criterion 15.04695
Log likelihood -218.9019     F-statistic 71.80427
Durbin-Watson stat 1.818796     Prob(F-statistic) 0.000000
 這時我們發現DW知在經過廣義差分後有所提高,自相關消除。
 第四,由於樣本資料的觀測誤差和模型設定的不正確性,隨機誤差項可能隨某個解釋變數的變化而變化,所以進行異方差檢驗。
圖示

有圖可知,該模型存在複雜型的異方差
用對數變換法對該模型進行修正,得新模型如下:
Dependent Variable: LY
Method: Least Squares
Date: 05/16/04   Time: 16:06
Sample: 1 31
Included observations: 31
Variable Coefficient Std. Error t-Statistic Prob. 
LX2 0.372139 0.142715 2.607568 0.0147
LX3 0.520076 0.141261 3.681673 0.0010
LX4 0.137348 0.085233 1.611433 0.1187
C 1.043700 0.627773 1.662544 0.1080
R-squared 0.933482     Mean dependent var 6.857225
Adjusted R-squared 0.926091     S.D. dependent var 1.148277
S.E. of regression 0.312173     Akaike info criterion 0.629398
Sum squared resid 2.631209     Schwarz criterion 0.814428
Log likelihood -5.755664     F-statistic 126.3013
Durbin-Watson stat 1.321994     Prob(F-statistic) 0.000000
 經過對數變換後,該模型的可決係數有所提高,異方差消除。   
 通過上述檢驗和修正最後得出如下模型:LY=α+β2LX2+β3LX3+β4LX4+U
令Y*=LY  α*=α  β2*=β2  β3*=β3  β4*=β4  U*=U  X2*=LX2   X3*=LX3  X4*=X4
 即:
Y*=α*+β2*X2*+β3*X3*+β4*X4*+U*
 該模型剔除了無關的解釋變數X1,並消除了多重共線性,自相關,異方差,從而具有較高的擬合優度,最後得出如下結論:
 糧產量與如下三個因素有關:有效灌溉面積,化肥施用量,農業從業人數。       

TAGS:糧食產量