基于數(shù)據(jù)倉庫和語義分析的社會標簽推薦技術研究.pdf_第1頁
已閱讀1頁,還剩83頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、隨著Web2.0技術和電子商務的快速發(fā)展,網(wǎng)絡里的數(shù)據(jù)量呈爆炸式增長,這導致了網(wǎng)絡中出現(xiàn)嚴重的信息超載問題,用戶需要付出相當大的代價才能從信息數(shù)據(jù)的海洋里檢索到自己感興趣的資源。為了降低這種代價,出現(xiàn)了基于社會標簽的推薦技術。
  社會標簽是用戶在標注資源時自主選擇的關鍵詞或詞語,社會標簽不僅能夠幫助用戶更好地組織、管理自己感興趣的資源信息,而且還可以根據(jù)用戶使用的標簽信息發(fā)現(xiàn)用戶的興趣偏好向用戶推薦滿足其興趣偏好的資源。那么在此

2、背景下,如何準確有效地向用戶推薦標簽,以及根據(jù)用戶的標簽記錄信息發(fā)現(xiàn)用戶的興趣偏好并向其推薦資源就成為當前研究的重要方向。
  當前的主流標簽推薦方法有很多,但是在推薦過程中對用戶、資源和標簽三元素之間的關聯(lián)關系普遍考慮不足,而數(shù)據(jù)倉庫提供的多維數(shù)據(jù)集正好可以很好地體現(xiàn)三元素之間的關聯(lián)關系,所以本文研究如何將數(shù)據(jù)倉庫技術應用到標簽推薦中并準確高效的向用戶推薦標簽;但同時由于數(shù)據(jù)倉庫中三元素間的語義關系不能得到很好的體現(xiàn),所以本文還

3、提出了基于加權元組潛在語義分析的社會標簽推薦模型。以下是本文的主要工作:
  1.針對標簽推薦過程中用戶、資源和標簽之間關聯(lián)關系考慮不足的問題,給出了基于數(shù)據(jù)倉庫技術的社會標簽推薦模型。該模型中采用了數(shù)據(jù)倉庫的多維數(shù)據(jù)集技術,構建標簽的多維數(shù)據(jù)集,建立數(shù)據(jù)挖掘模型,利用它的底層多維數(shù)據(jù)模型、OLAP分析功能對數(shù)據(jù)進行處理分析,并使用數(shù)據(jù)倉庫的Microsoft關聯(lián)規(guī)則技術挖掘多維標簽數(shù)據(jù)集中的規(guī)則實現(xiàn)社會標簽推薦,從而通過使用數(shù)據(jù)

4、倉庫技術有效解決在推薦過程中對用戶、資源和標簽三者之間的關聯(lián)關系考慮不足而導致推薦精確性不高的問題。
  2.針對使用數(shù)據(jù)倉庫技術進行標簽推薦時不能很好的體現(xiàn)出用戶、資源和標簽之間語義關系的問題,給出一種基于加權元組潛在語義分析的標簽推薦模型。該模型引入社會網(wǎng)絡的結構化分析方法對標簽元組進行量化加權,以構建加權的三維張量結構模型,并對生成的三維張量結構模型進行高維奇異值分解,然后通過元組的潛在語義分析,得到能體現(xiàn)用戶興趣度的加權元

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論