基於Hedonic模型的成都住宅價格影響因素分析

才智咖 人氣:3.17W

摘要:近年來,如何準確的對住宅專案定價,已成為受到各界普遍關注的熱點。本文結合住宅市場的發展及影響其價格構成的因素,篩選出了影響篩選出影響最大的幾個因素,又借鑑了現有關於Hedonic定價的理論方法和研究經驗,嘗試構建成都市商品住宅價格的Hedonic模型。並以成都市2005年春季房交會上提供的相關資料為基礎,對模型進行了擬和分析,得出了相關計量經濟學模型。

基於Hedonic模型的成都住宅價格影響因素分析

Hedonic模型簡述
 Hedonic意即“享樂”,hedonic模型則是基於效用論的一個定價模型。該模型從消費者(生產者)的主觀角度出發,通過對商品的屬性的評估來定價。
 Hedonic模型應用的物件是那些所謂的複雜的耐用商品,這些商品並不像平時在經濟學教科書上討論的商品那樣簡單,其價格由總的供求狀況決定。而“複雜性”就體現在這類商品有著較多的屬性,消費者必須通過對這些屬性的綜合評價而不是單一屬性的評價來定價。該模型將這樣的“複雜商品”視為一個“特徵包”,也就是包含著n個特徵的向量;每一個特徵對應著一個隱含市場以及在這個隱含市場上由供求決定的隱含價格,最後通過這些屬性的綜合評價而得到的價格稱為hedonic price(享樂價格)。

二、解釋變數的選擇
    結合2005年春季房交會上提供的相關資料,經過分析將其中的變數分為成本、消費者偏好、消費成本三類來考慮。
(一)成本
 1、土地成本:土地成本=土地單價×佔地面積。土地單價主要體現在所處的區位上,離市中心越近地價越高,因此我們選擇“區位”這一變數。佔地面積另作為一個解釋變數考慮。
 2、建造成本:由於大多數房子使用的材料相近,所以建造成本也相對接近,此處暫未作考慮。
 3、裝置成本:各種管道裝置成本等。由於各同質住宅之間的配套設施基本相似,成本也接近,所以在模型中未作考慮。
 4、建築面積:由於已考慮容積率和佔地面積,建築面積=容積率×佔地面積,所以這裡不考慮建築面積。
(二)消費者偏好
 1、周邊環境:消費者在購房時對周邊環境如學校、醫院、銀行、商場、交通便利程度的重視度越來越高,因此把它作為考慮要素。我們按一定的標準把它分為好與不好,用虛擬變數進行定性分析。
 2、綠化率:隨著人們對生活環境和健康的關注,綠化率已成為一項重要的考慮因素;而且它也對開發成本有著多方面的影響,因此在模型會考慮這一因素。
 3、配套設施及裝修狀況:大多數房屋的配套設施如寬頻接入狀況、電信設施等都相似,裝修狀況都為毛坯房,所以這兩個因素未作考慮。
 4、房屋建築形式:這一因素在樓層有所反應,我們把它分為高層、小高層及多層,用虛擬變更量進行定性區分。
 5、容積率:是指一個小區的總建築面積與用地面積的`比率。對於發展商來說,容積率決定地價成本在房屋中佔的比例,而對於住戶來說,容積率直接涉及到居住的舒適度。容積率越大,房屋價格應該越低,反之亦然。所以其係數應該為負。
 6、戶型:消費者對房屋的戶型結構都有自己不同的偏好,所以這裡我們分列出室、廳、衛作為三個不同的解釋變數。
(三)消費成本
 1、交通費用:該因素主要表達的是消費者在生活便利方面的考慮,但它可以通過“區位”要素中的資訊加以反映,因此未作單獨處理。
 2、物業費用:由於大部分房屋的物業費用還沒有正式定出,所以這裡暫未作考慮。
 3、停車費用:與物業費用相似,都還未正式定價,所以不作考慮。

三、模型的設定
 Hedonic模型定價的一般形式為:Y=f(x1,x2,…),其中xi表示商品的某種屬性。所以,我們的模型設定為:
Y=α0+α1D1t+α2D2t+α3D3t+α4D4t+α5D5t+β1X1+β2X2+β3X3+β4X4+β5X5+β6X6+ut
其中,各解釋變數意義如下:
表一
區位 D1t 二環內   1
  其他     0
 D2t 二環外(除郊縣)  1
  其他             0
綠化率 X1 
容積率 X2 
佔地面積(畝) X3 
室 X4 
廳 X5 
衛 X6 
周邊環境 D3t 好       1
  其他     0
房屋建築形式 D4t 多層     1
  其他     0
 D5t 小高層   1
  其他     0

四、模型的估計
引數估計
直接進行OLS估計得:
表二
Dependent Variable: Y
Method: Least Squares
Date: 06/12/05   Time: 14:28
Sample: 1 95
Included observations: 95
Variable Coefficient Std. Error t-Statistic Prob. 
C 374.0264 472.5700 0.791473 0.4309
D1T 1417.927 212.0262 6.687507 0.0000
D2T 1328.929 167.8374 7.917955 0.0000
X1 23.82317 9.488999 2.510609 0.0140
X2 263.8236 87.29975 3.022043 0.0033
X3 0.208763 0.450596 0.463304 0.6444
X4 -95.61817 113.5177 -0.842319 0.4020
X5 307.7563 157.5422 1.953484 0.0541
X6 -93.44759 179.7801 -0.519788 0.6046
D3T 462.8103 172.4986 2.682980 0.0088
D4T -193.1167 210.0490 -0.919389 0.3606
D5T 38.57189 235.4678 0.163810 0.8703
R-squared 0.789312     Mean dependent var 3141.705
Adjusted R-squared 0.761390     S.D. dependent var 1255.913
S.E. of regression 613.4853     Akaike info criterion 15.79378
Sum squared resid 31238227     Schwarz criterion 16.11638
Log likelihood -738.2048     F-statistic 28.26799
Durbin-Watson stat 1.299372     Prob(F-statistic) 0.000000
初步估計方程為:
Y = 374.0264255 + 1417.926924*D1t + 1328.928764*D2t + 23.82316551*X1 + 263.8236185*X2 + 0.2087631661*X3 - 95.61816974*X4 + 307.7562791*X5 - 93.44758689*X6 + 462.8102858*D3t - 193.1167471*D4t + 38.57188602*D5t

五、模型的檢驗
1、經濟意義的檢驗
 迴歸結果中,x4、x6與D4t的係數為負,x2的係數為正,與其經濟意義相悖。所以剔除掉x2、x4、x6、D4t,再對剩餘解釋變數進行迴歸得:
表三
Dependent Variable: Y
Method: Least Squares
Date: 06/13/05   Time: 11:14
Sample: 1 95
Included observations: 95
Variable Coefficient Std. Error t-Statistic Prob. 
C 544.4782 434.0595 1.254386 0.2131
D1T 1707.733 199.6265 8.554643 0.0000
D2T 1428.953 172.4998 8.283793 0.0000
X1 16.40881 9.637252 1.702644 0.0922
X3 -0.103339 0.446899 -0.231237 0.8177
X5 253.0170 148.7581 1.700862 0.0925
D3T 569.9176 176.6352 3.226523 0.0018
D5T 399.3092 148.7684 2.684099 0.0087
R-squared 0.756645     Mean dependent var 3141.705
Adjusted R-squared 0.737065     S.D. dependent var 1255.913
S.E. of regression 643.9973     Akaike info criterion 15.85372
Sum squared resid 36081727     Schwarz criterion 16.06878
Log likelihood -745.0516     F-statistic 38.64321
Durbin-Watson stat 1.368045     Prob(F-statistic) 0.000000
得到新的方程為:
Y = 544.4781988 + 1707.73299*D1t + 1428.952958*D2t + 16.40880665*X1 - 0.1033393232*X3 + 253.0170077*X5 + 569.9175829*D3t + 399.3092053*D5t

 而解釋變數X3的係數變為負數,不符合經濟意義。我們對Y與X3進行OLS估計後,X3的值仍為負數,所以剔除X3。對剩餘變數進行迴歸得:
表四
Dependent Variable: Y
Method: Least Squares
Date: 06/13/05   Time: 11:17
Sample: 1 95
Included observations: 95
Variable Coefficient Std. Error t-Statistic Prob. 
C 571.9814 415.1948 1.377622 0.1718
D1T 1711.564 197.8650 8.650162 0.0000
D2T 1431.378 171.2523 8.358295 0.0000
X1 15.31092 8.341309 1.835553 0.0698
X5 256.9192 147.0008 1.747741 0.0840
D3T 561.9200 172.2820 3.261630 0.0016
D5T 397.4907 147.7593 2.690123 0.0085
R-squared 0.756495     Mean dependent var 3141.705
Adjusted R-squared 0.739893     S.D. dependent var 1255.913
S.E. of regression 640.5245     Akaike info criterion 15.83328
Sum squared resid 36103903     Schwarz criterion 16.02146
Log likelihood -745.0808     F-statistic 45.56493
Durbin-Watson stat 1.375885     Prob(F-statistic) 0.000000

2、統計意義檢驗
 查表可得,F值=45.56493大於F0.05(k-1,n-k),說明迴歸方程顯著;且排除x2、x3、x4、x6、d4t後,t值大部分大於2,再繼續進行計量經濟學檢驗。
3、計量經濟學檢驗
(1)多重共線性檢驗
X解釋變數兩兩的簡單相關係數如下:
表五
X1 X5
1 0.2336
0.2336 1
 可看出,相關係數很小;並且R2不是很大,F值也沒有顯著大於給定顯著水平下的臨界值,所以可以認為不存在多重共線性。
(2)異方差檢驗
因為我們的資料是截面資料,所以用White檢驗進行異方差檢驗如下:
表六
White Heteroskedasticity Test:
F-statistic 1.988622     Probability 0.057339
Obs*R-squared 14.83042     Probability 0.062528
    
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 06/13/05   Time: 11:20
Sample: 1 95
Included observations: 95
Variable Coefficient Std. Error t-Statistic Prob. 
C -148435.9 1095245. -0.135528 0.8925
D1T 510503.4 182654.1 2.794919 0.0064
D2T 385781.4 156606.2 2.463386 0.0158
X1 25891.42 45897.93 0.564109 0.5741
X1^2 -118.0080 509.0727 -0.231810 0.8172
X5 -362270.0 605520.9 -0.598278 0.5512
X5^2 63996.95 121911.8 0.524945 0.6010
D3T 91101.43 158982.5 0.573028 0.5681
D5T -192234.1 135721.5 -1.416386 0.1603
R-squared 0.156110     Mean dependent var 380041.1
Adjusted R-squared 0.077608     S.D. dependent var 606559.0
S.E. of regression 582546.7     Akaike info criterion 29.47815
Sum squared resid 2.92E+13     Schwarz criterion 29.72010
Log likelihood -1391.212     F-statistic 1.988622
Durbin-Watson stat 1.855904     Prob(F-statistic) 0.057339
因為Obs*R-squared對應的Probability值大於5%,且對應X解釋變數的t值都小於2, 所以認為不存在異方差性。
(3)自相關檢驗
用D-W法檢驗自相關
∵K=7,K’=6  ∴dl=1.535  du=1.802
 ∴DW=1.375885< dl =1.535,所以存在正自相關。
下面再用Cochrance-Orcutt迭代修正自相關得如下結果:
表七
Dependent Variable: Y
Method: Least Squares
Date: 06/13/05   Time: 11:22
Sample(adjusted): 2 95
Included observations: 94 after adjusting endpoints
Convergence achieved after 8 iterations
Variable Coefficient Std. Error t-Statistic Prob. 
C 698.9290 371.8068 1.879818 0.0635
D1T 1725.492 223.2574 7.728711 0.0000
D2T 1209.582 233.9092 5.171161 0.0000
X1 17.59959 7.369088 2.388299 0.0191
X5 257.4604 124.2491 2.072132 0.0412
D3T 374.9292 149.4512 2.508706 0.0140
D5T 287.2135 132.6069 2.165902 0.0331
AR(1) 0.436903 0.108822 4.014845 0.0001
R-squared 0.789324     Mean dependent var 3127.255
Adjusted R-squared 0.772176     S.D. dependent var 1254.683
S.E. of regression 598.8710     Akaike info criterion 15.70923
Sum squared resid 30843594     Schwarz criterion 15.92569
Log likelihood -730.3340     F-statistic 46.03009
Durbin-Watson stat 2.008528     Prob(F-statistic) 0.000000
Inverted AR Roots        .44
DW=2.008528~(du,4-du)=(1.802, 2.198),所以成功消除自相關。
 自相關是cov(ut,us)≠0,t≠s。通常認為由截面資料得到的模型不存在自相關。而我們的模型採用截面資料但依然存在自相關。結合所學習的產生自相關的原因我們認為:不同房產價格可能有互相參考對方價格的情況,在同一地區,後建的開發專案價格可能會參照周邊已建房價格,這些行為都可能導致出現一些未知的或者一直的但無法估計的隨機誤差出現自相關。還有可能有一些偶然因素讓房價的隨機誤差產生自相關。
 
經以上修正,最終模型的形式為
Y = 698.9290071 + 1725.5*D1t + 1209.6*D2t + 17.6*X1 + 257.5*X5 + 374.9*D3t + 287.2*D5t + [AR(1)=0.4369025751]+ut

六、經濟意義淺析
 1、從表示區位的D1t,D2t的係數可以看出,二環內的樓盤均價比二環至三環間的樓盤均價高500多元/m2,而比郊縣的樓盤均價要高出2900多元/m2。
    2、從表示綠化率的X3的係數可以看出,綠化率越高,樓盤的均價越高。
 3、從表示廳的X5的係數可以看出,現在消費者越來越注重對住房廳的要求,如果廳越多,該樓盤的均價也會越高。
 4、從表示周遍環境的D3t的係數可以看出,周遍環境越好,樓盤的均價越高。
 5、從表示小高層的D5t的係數可以看出,現在消費者更偏好於小高層的住房,有小高層的樓盤均價會比其他樓盤高200多元/m2。
 6、在最終模型中,影響房屋價格的重要因素有5個:區位、綠化、廳、周邊環境、房屋建築形式,這5個因素成為決定房屋價格的主導因素。
 
 七、模型的侷限
 1、通過hedonic模型與市場公開資料建立了成都住宅市場的hedonic定價模型,由於僅是從消費者對住宅的主觀評價入手,而且將影響因素侷限在商品的屬性上,並沒有考慮其他更多的因素(如:投機炒作、收入,教育程度,預期等),可能會使結果顯得過於片面,但由於消費者對商品的選擇決策本質上是在各種約束條件下的一個最優理性行為,所以實際上除住宅本身屬性以外的那些因素也應該反映在購買決策中,還需要進一步的資料處理和分析將其挖掘出來;
 2、此次收集的資料是在公開市場上(出版物,網路)獲得的資訊,與實際情況不一定符合,比如價格就會與最終成交價格有一定差距,這也會直接影響到結果。

完成計量論文過程的總結:
感受:
1、最強烈的感受是體會到蒐集資料的艱辛。此次資料蒐集過程中,從房產局到開發商再到出版物、網路,我們都希望找到最準確、完整的資料,雖然盡了努力,但是實際成交價房產局要進行保密,我們對成交情況也不可能一一作調查,所以結果會有相當的誤差出現。但是作為體驗計量方法的使用,收穫還是頗為豐富的。
2、體會到集體的智慧。剛開始在資料蒐集時我們就分工蒐集,提高了效率。在做論文的時候,原本我們也分工合作,一人負責一個部分,但是每次彙總的時候總能發現別人想法欠完整的地方或者自己有新思路、方法的時候,這都會導致一次又一次推翻以前的結果。後來我們決定運用集體的智慧,用一段時間共同完成一個部分,提出各自的思路,討論後選出最好的,如果出現新問題就一起思考、找解決辦法。這個合作的過程使得我們的思路更加完整清晰、效率也得以提高。
經驗:
1、對模型的選擇我們經歷了諸多過程,開始我們沒有引入虛擬變數時,模型的自相關、異方差都很嚴重,而且沒有辦法消除自相關性。然後我們又查閱參考資料調整模型,改變為對數形式的模型,但是模型擬合仍然不是很好。最後在助教的指導下,我們引入了虛擬變數。在論文中我們只體現了最終選擇的最優模型——引入虛擬變數後的模型。
2、引入虛擬變數是我們面對更多的問題:對虛擬變數的性質劃分、賦值、迴歸、檢驗每個看似簡單的過程我們都遇到了不少的困難。由於我們模型所涉及的定性變數較多,引入虛擬變數就顯得尤其麻煩,例如,原本對區位我們劃分為一環內,一環到二環,二環到三環,三環外,郊縣共五項,僅區位就需引入四個虛擬變數,在討論諮詢後,我們把它分別劃分為二環內,二環到三環外,郊縣,擴大了定性的範圍。在對模型進行檢驗時,剛開始我們不知道如何對虛擬變數的t值進行判斷,經過老師的指導,我們知道在檢驗異方差時只需判斷x的t 值,而不用考慮虛擬變數地t 值。我們按照在不違背經濟理論的條件下運用計量經濟學知識決定虛擬變數的取捨。
不足:
此模型與經濟理論的聯絡比較小。
這個模型是對耐用商品的一個內在價值估計,而忽略諸多外在因素,如對決定房地產價格非常重要的供求關係和投機因素的考慮就沒有包括。
在引入虛擬變數的時候,我們只用了加法引入,沒有使用乘法引入。因為虛擬變數和一般的解釋變數太多,不知道應該如何正確使用乘法引入,所以最後就沒有用這一方法。