

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、當用戶通過在網(wǎng)絡上尋找自己需要的信息時,使用最多的工具是搜索引擎。然而作為商業(yè)工具,搜索引擎的結果也并沒有讓用戶特別滿意。當然用戶可以自己逐一篩選找出有用結果。但是如果要進行Web信息融合,直接使用搜索引擎的結果會加大信息融合的工作量,甚至可能導致結果不準確。本文在這樣的背景下提出了基于信息融合的Web信息可信度評估。
通過分析搜索引擎在網(wǎng)頁可信度評估方面的不足,再根據(jù)Web信息的特點和信息融合的要求,得出影響Web信息可信度
2、最重要的指標網(wǎng)頁相關度。本文對網(wǎng)頁相關度的計算進行了研究,構建了信息可信度評估指標體系,提出了可信度計算方法。
本文主要內容如下:
1.分析現(xiàn)階段使用較多的計算網(wǎng)頁相關度的算法,根據(jù)信息融合的特征,提出本文采用的算法詞頻位置加權排序算法。根據(jù)原有算法的缺點,提出改進設想。引入了TextRank模型來提取主題詞,并在原有的TextRank模型基礎上加入詞語本身的位置權重。既引入了詞語的語義概念,又考慮了詞語所在網(wǎng)頁的位
3、置,提高了主題詞提取的準確率。計算相關度時,將詞語在提取主題詞步驟計算出詞語的權重引入公式中,還考慮了主題詞與查詢詞的語義相似度。相關度計算考慮了詞語間的語義關系、詞語的頻率和位置,使得計算更準確。
2.歸納了現(xiàn)有的信息可信度評估指標,通過分析搜索引擎在可信度評估方面的不足,構建了本文采用的信息可信度評估指標體系。從權威性、重要性、相關性三個方面來評估可信度,每個方面選取最相關的指標,提出了計算可信度的公式。通過這個公式計算的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 商品評論信息可信度研究.pdf
- 面向網(wǎng)絡文本的信息可信度研究.pdf
- 網(wǎng)絡媒體新聞信息可信度研究
- 電子商務主體信息可信度研究.pdf
- 網(wǎng)絡媒體新聞信息可信度研究.pdf
- 中文微博信息可信度分析方法研究.pdf
- 基于可信度和語義相似度的網(wǎng)頁信息甄選研究.pdf
- 基于改進的PageRank的網(wǎng)頁信息可信度評估方法研究.pdf
- 信息確定性對在線社區(qū)口碑信息可信度的影響.pdf
- 基于會計信息可信度的上市公司優(yōu)劣甄別研究.pdf
- 社交媒體網(wǎng)絡信息內容的可信度測度.pdf
- 轉基因食品信息推廣中的傳播渠道可信度研究.pdf
- 社交網(wǎng)絡信息可信度實時評估的研究與應用.pdf
- 一種信息源可信度預測方法研究.pdf
- 基于TPM的可信度量機制研究.pdf
- 網(wǎng)站信息呈現(xiàn)方式對旅游信息可信度及消費意向的影響.pdf
- 中文事件可信度信息標注和抽取方法的研究.pdf
- 基于產(chǎn)品類型的評價可信度研究.pdf
- 信息加工心理學取向的微博可信度研究.pdf
- Modelica模型可信度評估方法及Web應用研究.pdf
評論
0/150
提交評論