資料探勘技術在電子商務中的應用研究論文

才智咖 人氣:9.62K

[摘要] 電子商務在現代商務活動中的正變得日趨重要,而商務資料的處理則凸顯出資料探勘的重要。本文討論了資料探勘的主要方法,具體闡述了資料探勘技術在電子商務中的作用及應用。

資料探勘技術在電子商務中的應用研究論文

[關鍵詞] 資料探勘 電子商務 資料庫

一、概述

資料探勘(data mining)起源於資料庫中的知識發現(knowledge discover in database,kdd),是指從大型資料庫或資料倉庫中提取隱含的、未知的、非平凡且最終可理解的及有潛在應用價值的資訊或模式。資料探勘技術是計算機技術發展的熱點之一。通過對歷史積累的大量資料的有效挖掘,可以發現隱藏的規律或模式,為決策提供支援,而這些規律或模式是不能夠依靠簡單的資料查詢得到,或者是不能在可接受的時間內得到。這些規律或模式可以進一步在專業人員的識別下成為知識,並可以應用到以客戶為中心的企業決策分析和管理的各個不同領域和階段。

電子商務(e-commerce)是以指利用電子資料交換(electronic data interchange,edi)、電子郵件(e-mail)、電子資金轉賬(electronic funds transfer,eft)和internet等主要技術在個人、企業和國家之間進行無紙化的資訊交換,包括商品資訊及其訂購資訊、資金資訊及其支付資訊、安全及其認證資訊等,即以現代資訊科技為手段,以經濟效益為中心的現代化商業運轉模式。其最終目標是實現商務活動的網路化、自動化與智慧化。

隨著internet的迅速發展,電子商務的應用不斷深入。在電子商務應用系統中,相關的使用者資料日益增多,資料探勘技術具有從大量複雜資料中發現特定規律的能力。商業電子化的趨勢不僅為客戶提供了便利的交易方式和廣泛的選擇,同時也為商家提供了更加深入瞭解客戶需求資訊和購物行為特徵的可能性。

二、資料探勘的主要方法

資料探勘融合了資料庫、人工智慧、機器學習、統計學等多個領域的理論和技術。比較典型的資料探勘方法有分類、關聯規則分析、聚類分析和孤立點分析等。

1.分類。分類是找出一個類別的概念描述,它代表了這類資料的整體資訊,即該類的內涵描述,一般用規則或決策樹模式表示。實際上就是通過分析示例資料庫中的資料,為每個類別做出準確的描述或建立分析模型或挖掘出分類規則,然後用這個分類規則對其他資料庫中的記錄進行分類。

2.關聯規則分析。關聯規則分析用於發現關聯規則。若兩個或多個數據項的取值重複出現且概率很高時,它就存在著某種關聯,可以建立起這些資料項的關聯規則,一般用“支援度”和“置信度”兩個閩值來淘汰那些無用的.關聯規則。關聯規則分析能發現數據庫中諸如“90%的顧客在一次購買活動中購買商品a的同時購買商品b”之類的特徵。

3.聚類分析。聚類分析的物件是一組未分類記錄,並且這些記錄應分成幾類事先也不知道。聚類就是通過分析資料庫中的記錄資料,根據一定的分類規則,合理地劃分記錄集合,確定每個記錄所在類別。它所採用的分類規則是由聚類分析工具決定的。採用不同的聚類方法,對於相同的記錄集合可能有不同的劃分結果。

4.孤立點分析。資料庫中的資料常有一些異常記錄,這些記錄稱為孤立點,常常包括很多潛在的知識,如分類中的反常例項、不滿足規則的特例、觀測結果與模型預測值的偏差、量值隨時間的變化等。孤立點分析基本方法是尋找觀測結果與參照之間的差別。

三、據據挖掘在的應用

資料探勘的應用十分廣泛,如銀行、電信、保險、交通、零售(如超級市場)等領域。資料探勘所能解決的典型商業問題包括資料庫營銷(database marketing)、客戶群體劃分(customer segmentation & classification)、背景分析(profile analysis)、交叉銷售(cross-selling)等市場分析行為,以及客戶流失性分析(churn analysis)、客戶信用記分(credit scoring)和欺詐發現(fraud detection)等。

分類的目的是構造一個分類函式或分類模型,通常稱作分類器。分類器的構造方法通常由統計方法、機器學習方法、神經網路方法等。在金融領域,管理者可以通過對客戶償還能力以及信用的分析,進行分類,評出等級,減少放貸的盲目性,提高資金的使用效率。

在零售業,資料探勘可有助於識別顧客購買行為,發現顧客購買模式和趨勢,改進服務質量,取得更好的顧客保持力和滿意程度,提高貨品銷量比率,設計更好的貨品運輸與分銷策略,減少商業成本。

電信、計算機網路、因特網和各種其它方式的通訊和計算的融合是目前的大勢所趨。利用資料探勘技術來幫助理解商業行為、確定電信模式、捕捉盜用行為、更好的利用資源和提高服務質量是非常有必要的,通過挖掘進行盜用模式分析和異常模式識別,從而可儘早發現盜用,為公司減少損失。

資料探勘是一個非常複雜的過程。每一種資料探勘技術方法都有其自身的特點和實現步驟。每種資料探勘的技術方法對輸入/輸出資料形式的要求、結構、引數設定、訓練、測試和模型評價方式各自有不同的要求,演算法應用領域的含義和能力也存在差異。資料探勘過程一般分為定義問題、準備資料、實施挖掘、評價與表示等幾個階段。資料探勘過程的這幾個階段都需要人的參與指導。

四、結束語

資料探勘是指按企業既定業務目標,對大量的企業資料進行探索和分析,揭示隱藏的、未知的或驗證已知的規律性,並進一步將其模型化的先進有效的方法。電子商務是現代資訊科技發展的必然結果,也是未來商業運作模式的必然選擇。企業資料量日益龐大,其中真正有價值的資訊卻很少,利用資料探勘技術,從大量的資料中經過深層分析,獲得有利於商業運作、提高競爭力的資訊,發揮企業的獨特優勢,促進管理創新和技術創新。

參考文獻:

[1]鄧鯤鵬周延傑嚴瑜筱:資料探勘與電子商務.商場現代化,2007(9s)

[2]袁柱:電子商務中web資料探勘的應用研究.商場現代化,2007(8s)

[3]周亮:面向電子商務的資料探勘系統的研究與設計[d].武漢理工大學,2005