基于樹核函數(shù)的漢語復句關系詞特征分析.pdf_第1頁
已閱讀1頁,還剩56頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、中文信息處理的研究包括如下幾個方面:字處理,詞處理,句處理,篇章處理,其中句處理的研究包含對單句和復句的研究?,F(xiàn)階段,在字處理和詞處理方面,已經進行了大量的研究,且取得了不錯的效果;正在對句處理與篇章處理進行大量的研究。現(xiàn)有的很多有關句處理的研究主要集中在對單句的研究,對復句的研究工作較少。復句充當著連接小句和篇章的功能。通過對復句進行研究,能夠進一步加深對小句的研究,同時,能夠推動篇章處理的研究向前發(fā)展。因此,復句的研究顯得具有緊迫性

2、和必要性。
  復句的研究目標是正確標識復句,包含分句和非分句的識別,復句關系詞的自動標識,復句層次的劃分,復句關系的識別。復句關系詞的自動標識是復句研究的核心內容之一。
  本論文提出了基于樹核函數(shù)的復句關系詞特征分析,其落腳點是復句關系詞的自動標識。在含合用型關系詞[2]的復句中,相同的關系詞,其句法特征信息具有某些相似性。本文分別選用不同策略從復句句法樹中抽取特征序列,將樹核函數(shù)應用于關系詞特征序列之間的相似度計算。復

3、句進行句法分析得到不同句法分析樹形式,選用相對應的樹核函數(shù)對從樹中選取的關系詞特征序列進行相似度計算。使用SVMLight分類器根據樹核函數(shù)相似度的計算結果,對待標識關系詞進行標識。
  在對合用型關系詞自動標識過程中,樹核函數(shù)的相似度計算所使用的特征序列分別為復句依存樹中的最短路徑包含樹(SPT)和復句短語結構句法樹中的上下文相關的路徑包含樹(CPT)時,分類器取得了特征序列各自所屬復句句法樹范疇的最佳標識效果。線性核和卷積核線

4、性組合構成的復合核,將其用于關系詞特征序列之間的相似度計算,SVMLight分類器根據此相似度計算結果對關系詞進行標識,得到了最高的標識準確率??偨Y兩件套[2]形式的合用型關系詞自動標識規(guī)律,將此規(guī)律應用于其它類型的關系詞的自動標識當中。
  基于樹核函數(shù)的復句關系詞特征分析的實驗結果表明,使用樹核函數(shù)所捕獲的特征信息對關系詞自動標識是有效的。對于采用不同的策略獲得的復句關系詞特征序列,分別選用相對應的核函數(shù)用于特征序列之間的相似

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論