- 相關(guān)推薦
粗集方法在KDD系統(tǒng)中的應(yīng)用與研究
粗集方法在KDD系統(tǒng)中的應(yīng)用與研究
周波
(西安電子科技大學(xué)多媒體研究所 西安 710086)
【摘 要】本文論述了粗集方法性質(zhì)及特點,提出了粗集方法在KDD系統(tǒng)中的應(yīng)用模型,同時給出了應(yīng)用這一模型對一個數(shù)據(jù)庫實例進行數(shù)據(jù)挖掘的過程。另外,從精確性、魯棒性等方面對KDD系統(tǒng)中的粗集方法的適用范圍進行了分析。
【關(guān)鍵詞】粗集 KDD 數(shù)據(jù)挖掘
Application and Research of Rough Set in KDD System
Zhou bo
(Multimedia Technology Institute ,Xidian University Xi’an710086)
Abstract: In this paper, we discuss the character of rough set, and put forward the application model of rough set in KDD system. Also, by an example ,the advantage and disadvantage of rough set in KDD system is analysed in detail.
Key Word: Rough Set KDD Data Mining
1.前 言
數(shù)據(jù)庫中的知識發(fā)現(xiàn)技術(shù)(Knowledge Discovery in Database, KDD)是隨著數(shù)據(jù)庫和人工智能的發(fā)展而產(chǎn)生的,它是“從大量數(shù)據(jù)中提取出可信的、新穎的、有效的并能被人理解的模式的非平凡過程”。通過KDD,人們可以將知識發(fā)現(xiàn)的研究成果應(yīng)用于實際數(shù)據(jù)處理中,為科學(xué)決策提供支持。KDD系統(tǒng)中的知識學(xué)習(xí)階段被稱為“數(shù)據(jù)挖掘”(Data Mining,DM),它的算法是KDD系統(tǒng)的核心。近年來,粗集理論(Rough Set Theory)開始逐漸應(yīng)用到DM的領(lǐng)域中,在對大型數(shù)據(jù)庫中不完整數(shù)據(jù)進行分析和學(xué)習(xí)方面取得了顯著的效果,因此,以粗集為代表的集合論方法是今后KDD技術(shù)的一個主要研究方向。
2. KDD系統(tǒng)中粗集方法的基本特征
粗集(Rough Set)理論和模糊集(Fuzzy Set)理論都是針對不確定性問題提出的,它們既相互獨立,又相互補充。粗集方法與傳統(tǒng)的統(tǒng)計及模糊集方法不同的是:后者需要依賴先驗知識對不確定性的定量描述,如統(tǒng)計分析中的先驗概率、模糊集理論中的模糊度等等;而前者只依賴數(shù)據(jù)內(nèi)部的知識,用數(shù)據(jù)之間的近似來表示知識的不確定性。用粗集來處理不確定性問題的最大優(yōu)點在于
【粗集方法在KDD系統(tǒng)中的應(yīng)用與研究】相關(guān)文章:
系統(tǒng)功能語言學(xué)在翻譯研究中的應(yīng)用12-06
談模糊綜合評判在避孕方法咨詢系統(tǒng)中的應(yīng)用03-18
基于PSOS的TM1300應(yīng)用系統(tǒng)中的BSP研究03-20
固體分散技術(shù)在中藥給藥系統(tǒng)中的研究和應(yīng)用03-18
數(shù)字通信系統(tǒng)的應(yīng)用方法11-15
市場營銷研究中對應(yīng)分析方法的應(yīng)用03-23