淺析改進的Apriori關聯挖掘演算法的實踐應用

才智咖 人氣:1.81W
淺析改進的Apriori關聯挖掘演算法的實踐應用
摘要:本文介紹了資料探勘技術在圖書館中的應用,並運用改進的Apriori關聯挖掘演算法對安徽省圖書館自動化系統中讀者流通庫進行挖掘,並對挖掘出的結果及其意義進行評價,從而為圖書館讀者管理、圖書資源的採購提供決策支援。

關鍵詞:資料探勘 Apriori演算法 圖書館管理 讀者管理
  
  資料探勘技術在商業領域內的應用給圖書館帶來了很大的啟發。圖書館的資料庫可以運用資料探勘技術中的關聯規則分析、聚類分析、決策樹、時間序列分析等資料探勘方法,以找出資料庫中蘊藏的對於圖書館管理有用的潛在規則,並且通過描述和預測,為圖書館的圖書採購、讀者服務、館藏目錄設定等管理工作提供決策支援。
  關聯規則是與多數人想象的挖掘過程中最相近的一種資料探勘形式,即尋找在同一事件中出現的不同項的相關性。關聯規則的研究有助於發現數據庫中不同商品間的聯絡,找出顧客購買行為模式。在圖書館運用關聯規則分析可以細分出讀者群,根據其借閱情況提供不同的服務,為圖書館的`管理決策提供參考。關聯規則的核心演算法是Apriori演算法。
  
  關聯規則的基本概念及演算法
  
  挖掘流通借閱事務資料庫中所有的關聯規則的問題可以被劃分成如下兩個子問題:
  找出所有具有最小支援度的項集(即頻繁項集),可用Apriori演算法來找出頻繁項集。由頻繁項集產生強關聯規則,對於每一個頻繁項集I,找出其中所有的非空子集,然後,對於每一個這樣的子集a,如果support(I)與support(a)的比值大於最小置信度,則存在規則a=