基于概念格的關聯規(guī)則挖掘研究與實現.pdf_第1頁
已閱讀1頁,還剩69頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、關聯規(guī)則挖掘作為數據挖掘領域中最活躍的研究分支之一,其目的是發(fā)現數據集中潛在的、新穎的、并為人類所理解的數據項間的關系。概念格理論,又稱形式概念分析,用于概念的發(fā)現、排序和顯示,其核心數據結構是概念格。概念格通過概念間的泛化和特化關系來表示知識。作為一種知識表示模型,概念格能夠為關聯規(guī)則挖掘提供有力支持。
  本文分析了現有關聯規(guī)則挖掘算法中存在的主要問題。針對多次數據集掃描、候選集過多等問題,提出了在經典概念格中自頂向下、通過頻

2、繁概念逐層求取所有頻繁項集的關聯規(guī)則挖掘算法。針對規(guī)則冗余、無法及時更新等問題,優(yōu)化了量化擴展概念格的結構,提出了事務集新增、刪除和修改時格上的更新操作,通過將更新操作添加到Godin算法的建格過程中,形成了一種量化擴展概念格的增量式建格算法;根據最小等價內涵、封閉集定義了非冗余關聯規(guī)則的模式,證明了由該模式形成的非冗余規(guī)則集是完備的;以此為基礎設計實現了基于量化擴展概念格的增量式非冗余關聯規(guī)則挖掘算法及約束型關聯規(guī)則的挖掘算法。

3、>  通過對算法在不同形式背景下執(zhí)行時間的分析,驗證了本文提出的“基于經典概念格的關聯規(guī)則挖掘”改進了Apriori算法在“求取頻繁項集”和“生成關聯規(guī)則”兩個模塊的執(zhí)行效率;“基于量化擴展概念格的關聯規(guī)則挖掘”在“生成關聯規(guī)則”模塊的效率和質量兩方面都優(yōu)于上述兩個算法。通過對算法特性的總結,得出當存在大量頻繁項集時,“基于量化擴展概念格的關聯規(guī)則挖掘”性能最優(yōu);當形式背景規(guī)模較大、頻繁項集數量較少時,雖然因建格時間過長,整體性能不如其

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論