淺談提高統計預測精度的策略

才智咖 人氣:1.97W

摘要:在統計預測中,統計預測精度是非常重要的,很多預測工作者都對統計預測精度給予高度重視。為有效提高統計預測精度,本文提出了一些策略。

淺談提高統計預測精度的策略

關鍵詞:統計預測精度;剔除;模型;修正;無偏性調整;組合預測

引言

統計預測,就是通過將統計資料作為基礎,將經濟發展的趨勢、經濟現象中存在的聯絡作為依據,選用合理的數學模型,對研究物件在某一條件中所達到的水平、規模進行預計。在統計預測中,包括直覺性判斷、數學計算等。通過對已有的資料進行充分利用,提煉出相關的資訊、內在的規律、事物在發展過程中的關係,在社會經濟領域中採用有效的統計預測方法,進而為制定計劃、政策帶來一定的科學依據,因此,統計預測具有非常重大的意義。

因此,提高預測精度對統計預測來說是非常重要的,很多預測工作者都對統計預測精度給予高度重視。為提高統計預測精度,本文進行了相關探析。

一、異常資料的修正和剔除

統計資料是統計預測的重要依據,然而不是任何統計資料都能運用在統計預測中,同時進行統計預測後獲得的較高精度的預測結果。自然災害、政策變動屬於偶然因素,因為受到偶然因素的影響作用,進而生成異常資料,儘管這些異常資料具有一定的真實性,不過,統計預測精度會深深受到統計預測工作的'影響,在實際中,為確保經濟的發展趨勢能夠通過資料序列客觀的表現出來,同時運用統計資料構建數學預測模型而獲取的預測成果更加接近實際情況,則統計預測工作一定要剔除、修正統計資料中存在的異常資料。例如,自我國成立以來,通過對鋼產量時間序列進行分析後可以發現,鋼產量呈逐步上升趨勢,但是,有兩個階段的資料是非常不正常的,即1958-1962年階段、 1967-1968年階段。因此,如果我國選用趨勢預測法來預測我國的鋼產量時,首先應剔除、修正這幾年中的異常資料。為確保資料序列的完整性,可以修正異常資料,其中,主要修正的方法為將外插值、內插值運用到資料發展趨勢線中,儘管初始資料經過修正後,資料的真實性受到了一定的影響,但是資料時間序列發展趨勢表現效果將會變得更好,而異常資料的剔除,可以採用的多方法也有很多,如格拉布斯法、威廉斯―肖維納法等。對異常統計資料進行修正和剔除以後,再建立相應的資料統計預測模型,則獲得的預測精度就會變得更高。

二、統計資料預測數學模型的選擇

統計資料預測數學模型的選擇,必須要有足夠的科學依據,選擇的統計資料預測數學模型應符合客觀規律、相關經濟理論,可以將相關經濟現象準確的表現、描述出來,可以在事物的發展狀況充分的反映出來。在選擇統計資料預測數學模型時,應將實際考察結果作為依據,這樣才能對原始資料進行精確的外推、模擬、擬合。例如,運用資料時間序列對資料發展趨勢進行外推時,在選擇統計預測模型時,應採用階差計算、散點圖。其中,一些常見的統計資料預測數學模型及其特點,如下所示:

(1)直線:y=a+bt

(2)拋物線:y=a+bt+ct2

(3)指數曲線:y=a+bt

(4)飽和指數曲線:y=a+bt

(5)龔珀茲曲線:y=kabt

在實際工作中進行統計預測時,為選擇有效、合理的統計資料預測數學模型,獲取更好的資料發展趨勢外推效果,應從資料時間序列的階差、散點圖著手進行。如果在進行統計預測工作中選用因果分析預測模型,則選取的自變數必須是事物發展變化的主要影響因素,該自變數應符合相應的客觀規律、經濟理論,選取的數學模型一定要合理,因變數和自變數的相關性係數要比較高,並具有明顯的迴歸效果。要想獲取高度精確的預測結果,選擇一個有效、恰當的統計資料預測數學模型是非常重要的額。

三、統計資料預測數學模型的無偏性調整

3.1無偏性調整原理

對於全部的統計資料預測數學模型,我們均假設該模型的預測誤差ei-N0,σ2是為一個正態隨機變數,Eei=0,Dei=σ2。但是,在大部分情況中,尤其是對統計資料預測數學模型進行線性化處理以後,所獲得的擬合誤差平均值並非為0,甚至遠遠偏離0。一旦出現這種情況,首先應適當對統計資料預測數學模型進行無偏性調整,直至擬合誤差平均值為0,具有無偏性,同時不會影響到原來數學模型的有效性。其中,統計資料預測數學模型的無偏性調整原理為:在原來的統計資料預測數學模型上 加上 e,相應得,預測數學模型曲線將會向上平 移e,不難看出,無偏性調整法是非常簡單的,統計資料預測數學模型預測結果的精確度將會得以提高。

3.2舉例說明

浙江省在2000-2010年期間的社會商品零售總額資料,如表1所示。 ( 單位:億元 )

根據統計資料而構建的指數曲線預測模型為y′1t=110.782e0.1403t,其擬合誤差平均值 e=0.5222。對曲線預測模型進行無偏性調整,即將原曲線預測模型加上0.5222,相應的,指數曲線向上平移0.5222,則曲線預測模型調整之後變為y1t=110.782e0.1403t+0.5222,其擬合值及其誤差,如表1所示。通過對曲線預測模型進行無偏性調整之前和之後的資料進行比較後可以發現,誤差平方和有所降低,即由 428.2 4 8 7降低至4 2 5.2 4 88,由於調整之後的預測模型是無偏的,進而大大提升了統計預測的精度。

四、組合統計預測模型

4.1組合預測原理

在統計預測工作中,可以採用多種統計預測方法對同一個預測問題進行預測,為了使統計預測精度變得更高,可以適當組合各種統計預測方法為一體,形成一種組合統計預測方法。假設同時存在多種統計預測方法可以對同一個統計預測問題進行預測,分別用來表示獲得的統計預測值,則組合統計預測模型為

yt=k1y1t+k2y2t+…+knynt   其 中K=k1,k2,…,knT為組合預測係數向量,且k1+k2…+kn=1。

由於組合統計預測模型的預測精度深受組合預測係數向量K的影響,因此,K的確定對提升統計預測精度起著決定性的作用。 組合預測係數K 的確定方法有很多,如遞迴方差倒數法、方差倒數法、誤差平方和最優最小組合法、等權法等,而前三種方法確定的合統計預測模型,其得到的預測精度相對更高。

4.2舉例說明

仍以浙江省在2000-2010年期間的社會商品零售總額為例,構建拋物線資料統計預測模型y1t=1.73t2+17.0918t+105.2364,其擬合值及其誤差

運用最優組合預測係數公式,能夠求得出兩種預測方法參與的組合統計預測模型,且或得的組 合預測係數分別為:

k1=∑e22t-∑e1te2t∑e21t+∑e22t-2∑e1te2t=157.2283-110.4547425.2488+157.2283-2×110.4547=0.1294

k2=∑e22t-∑e1te2t∑e21t+∑e22t-2∑e1te2t=425.2488-110.4547425.2488+157.2283-2×110.4547=0.8706

則組合統計預測模型為:

yt=0.1294y1t+0.8706y2t=91.6864+14.8801t+1.506t2+14.3352e0.1403t

運用該組合統計預測模型所得到的擬合值及其誤差,組合預測誤差平方和為151.1784。和上述兩個預測模型相比,採用該組合預測模型進行預測,能夠使預測精度變得更高,假若將更多的預測模型組合在一起,得到的的預測精度就會變得更高一些。

五、小結

本文主要從異常資料的修正和剔除、統計資料預測數學模型的選擇、統計資料預測數學模型的無偏性調整,這幾個方面來提高統計預測精度,希望能夠對統計預測工作者的工作帶來一定的幫助。

參考文獻:

[1] 周莊,夏瑛碹. 我國古代成功預測範例及啟示[J]. 統計與決策. 2012(11)

[2] 程振源. 時間序列分析:歷史回顧與未來展望[J]. 統計與決策. 2010(09)

[3] 吳載斌,王斌會. 資料探勘軟體的介紹及其評價[J]. 計算機時代. 2011(07)

[4] 謝煜,張智光. 預測支援系統的發展趨勢研究[J]. 預測. 2014(03)

[5] 王應明. 基於相關性的組合預測方法研究[J]. 預測. 2012(02)