談談基於支援向量機整合的電子商務環境下客戶信用評估模型

才智咖 人氣:1.64W

導語:隨著我國電子商務行業發展腳步的不斷加快,對客戶信用的評估也引起了企業的高度重視,其不僅關係著電子商務活動的順利開展,而且對企業可持續發展目標的實現也具有重要意義。

談談基於支援向量機整合的電子商務環境下客戶信用評估模型

在電子商務飛速發展的今天,參與到電子商務活動中的人也越來越多。為了能夠給電子商務活動的開展營造一個良好的氛圍,國家相關部門對與電子商務相關的配套設施和法律法規等進行了不斷優化與完善,但由於執行力度不夠,從而導致仍有很多問題制約了電子商務的發展,信用問題就是其中最主要的一項。通過對基於支援向量機整合的電子商務環境下客戶信用評估模型的研究,可以為日後電子商務客戶信用的評價工作提供一定的參考依據,進而更好的促進我國電子商務行業的可持續發展。

1 基於模糊積分支援向量機整合

1.1 Bagging個體生成

Bagging個體生成主要是以可重複取樣為基礎,對訓練集的`選取通常是在原始訓練集中隨機抽取產生的,訓練集的規模與原始訓練集相當,訓練集允許重複選取。這樣一來,同一示例就會在不同的訓練集中出現,同樣也會有一部分示例沒有出現的情況。隨著訓練集選取內容的不斷增加,Bagging分類器整合的差異度也會隨之增加,從而促進了泛化能力的進一步提升。

1.2 基於模糊積分的結論生成

模糊積分基本理論是基於支援向量機整合的客戶信用評價模型的基本理論。所謂模糊積分理論,主要指的是設X為一有限集合,若集合函式g:2X→[0,1]滿足g(X)=1、g(A)≤g(B),那麼我們便將g視為一個模糊測度。如果g在滿足上述條件的基礎上,還滿足等式g(AUB)=g(A)+g(B)+λg(A)g(B),那麼我們就將其稱為測度或Sugeno,記為gλ。在模糊積分理論下,對模糊積分的計算,首先需要明確模糊密度。通常情況下,模糊密度的產生是由專家設定的,也可以通過訓練資料產生。

2 模糊密度確定方法

通過模糊積分理論的介紹我們能夠看出,在基於模糊積分的多分類整合中,對於各個子支援向量分類器重要性的模糊密度值的確定是非常重要的。鑑於此,本文采用混淆矩陣的方法來對評估模型中所涉及的模糊密度值進行確定,用子分類器各自的訓練集對各個子分類器進行測試,進而得到與之相對應的混淆矩陣。比如說一個K類分類問題,對於子分類器SVCK,其混淆矩陣可以定位為,該矩陣的有效利用可以將順利獲取到各個支援向量機的模糊密度,為利用模糊積分進行支援向量機整合奠定了堅實的基礎。

3 實證分析

3.1 支援向量機整合過程

本次實驗是在Libsvm軟體上進行的,驗證平臺和作業系統分別是256MB記憶體在AMD Athlon 1800+和Windows 2000。具體實驗過程共分為6個步驟:(1)通過Bagging方法的應用,選取支援向量分類器的訓練集,並對其進行相應的訓練;(2)根據各分類器的訓練結果輸出模型;(3)採取上文介紹的方法對模糊密度進行確定;(4)當給定一個測試樣本,得到各子支援向量分類器對該測試樣本的類概率輸出;(5)根據計算模糊積分,整合各子支援向量機;(6)確定測試樣本的最終類別。通過上述6個步驟的合理操作,便可以實現支援向量機的有效整合。

3.2 樣本資料的選擇處理

本文所選取的是某電子商務公司400家客戶的資料資料,其中322家客戶的資料資料結果顯示為“狀態良好”,剩下的78家客戶的信用狀況則相對較差,很容易出現違約現象。由於這兩類客戶的資料資料存在很大差距,如果直接將其用於SVM的學習,那麼勢必會降低最優分類面的準確性。如果將其應用到未來的預測工作中,必將帶來較大誤差。鑑於此,為了能夠進一步確保樣本資料處理的有效性,對樣本資料進行預處理是非常重要的。本次實驗中所採取的預處理方法主要是在322家狀態良好的客戶中抽取80家,與78家信用狀態差的客戶構成一個規模為158家客戶的樣本集,並在此基礎上將該樣本集分為訓練樣本集和測試樣本集兩個部分。此外,為了更好的將SVMs的泛化能力充分體現出來,在確保兩類樣本數量相近的前提下,隨機抽取一部分作為訓練樣本集,剩下的一部分則用於檢驗模型的泛化能力。

3.3 實證結果分析

本次實驗在多類別分類方面採用的是一對一策略,在158個訓練集上訓練出5個SVMs。各子支援向量分類器使用RBF核函式,每個SVM通過10重交叉驗證的方法來選擇相應的引數,進行了10次實驗。表1給出的是訓練樣本精度,從表1中我們能夠看出,應用該模型可以對客戶信用進行分類,並可以達到最佳的精度。由此可見,與傳統的客戶信用評價方法相比,基於支援向量機整合的電子商務環境下的客戶信用評估模型具有更好的泛化能力,同時應用起來簡單有效。可以預見,在未來的時間裡,該評估模型在電子商務行業的發展中,勢必會得到更加廣泛的應用。

4 結語

綜上所述,隨著我國電子商務行業發展腳步的不斷加快,對客戶信用的評估也引起了企業的高度重視,其不僅關係著電子商務活動的順利開展,而且對企業可持續發展目標的實現也具有重要意義。從本文的分析我們能夠看出,基於支援向量機整合的電子商務環境下客戶信用的評估模型,不僅簡單有效,而且具有更好的泛化能力,能夠將客戶的信用真實的反映出來,為電子商務活動的開展提供參考。