粗集方法在KDD系統中的應用與研究

才智咖 人氣:9.3K

粗集方法在KDD系統中的應用與研究

周波

(西安電子科技大學多媒體研究所 西安 710086)

【摘 要】本文論述了粗集方法性質及特點,提出了粗集方法在KDD系統中的應用模型,同時給出了應用這一模型對一個數據庫例項進行資料探勘的過程。另外,從精確性、魯棒性等方面對KDD系統中的粗集方法的適用範圍進行了分析。

【關鍵詞】粗集 KDD 資料探勘

Application and Research of Rough Set in KDD System

Zhou bo

(Multimedia Technology Institute ,Xidian University Xi’an710086)

Abstract: In this paper, we discuss the character of rough set, and put forward the application model of rough set in KDD system. Also, by an example ,the advantage and disadvantage of rough set in KDD system is analysed in detail.

Key Word: Rough Set KDD Data Mining

1.前 言

資料庫中的知識發現技術(Knowledge Discovery in Database, KDD)是隨著資料庫和人工智慧的發展而產生的,它是“從大量資料中提取出可信的、新穎的、有效的並能被人理解的模式的`非平凡過程”。通過KDD,人們可以將知識發現的研究成果應用於實際資料處理中,為科學決策提供支援。KDD系統中的知識學習階段被稱為“資料探勘”(Data Mining,DM),它的演算法是KDD系統的核心。近年來,粗集理論(Rough Set Theory)開始逐漸應用到DM的領域中,在對大型資料庫中不完整資料進行分析和學習方面取得了顯著的效果,因此,以粗集為代表的集合論方法是今後KDD技術的一個主要研究方向。

2. KDD系統中粗集方法的基本特徵

粗集(Rough Set)理論和模糊集(Fuzzy Set)理論都是針對不確定性問題提出的,它們既相互獨立,又相互補充。粗集方法與傳統的統計及模糊集方法不同的是:後者需要依賴先驗知識對不確定性的定量描述,如統計分析中的先驗概率、模糊集理論中的模糊度等等;而前者只依賴資料內部的知識,用資料之間的近似來表示知識的不確定性。用粗集來處理不確定性問題的最大優點在於

粗集方法在KDD系統中的應用與研究

TAGS:KDD 系統 粗集