

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、復(fù)句作為漢語語法的重要實(shí)體單位,在語法學(xué)界受到較多關(guān)注,且相關(guān)理論成果較多。但是,從中文信息處理的角度來看,漢語復(fù)句的信息化處理的相關(guān)成果還較少,復(fù)句信息工程尚未取得實(shí)質(zhì)性的突破和進(jìn)展。究其原因,一是研究還不全面深入,現(xiàn)有的成果還未囊括復(fù)句信息處理的所有環(huán)節(jié)和難題:二是大多數(shù)研究成果都是面向人的,很多方法在信息處理中操作性不強(qiáng);三是各個(gè)研究相對(duì)孤立,未將所有環(huán)節(jié)串聯(lián)起來,形成一個(gè)有機(jī)的整體。目前,復(fù)句的信息化研究主要是分句與非分句的識(shí)別
2、、復(fù)句層次關(guān)系的識(shí)別,而這些研究都以關(guān)系詞的提取為前提??梢?一方面,關(guān)系詞的自動(dòng)提取是其他各項(xiàng)研究工作得以開展的基礎(chǔ):另一方面,關(guān)系詞作為構(gòu)成復(fù)句的一個(gè)部件,本身也需要深入研究。在這種背景下,本文以面向中文信息處理為出發(fā)點(diǎn),以邢福義先生的復(fù)句理論為指導(dǎo),對(duì)復(fù)句關(guān)系詞的自動(dòng)標(biāo)識(shí)方法進(jìn)行研究和探討,并以自動(dòng)機(jī)理論、形式化邏輯等為輔助手段,對(duì)關(guān)系詞標(biāo)識(shí)涉及的問題進(jìn)行建模,對(duì)總結(jié)的規(guī)則進(jìn)行形式化描述和存儲(chǔ),并研究基于規(guī)則的關(guān)系詞自動(dòng)標(biāo)識(shí)的方法
3、,已達(dá)到自動(dòng)標(biāo)識(shí)復(fù)句關(guān)系詞的目的。
本文的研究主要從以下四個(gè)方面展開:
1、全面總結(jié)影響關(guān)系詞自動(dòng)標(biāo)識(shí)的因素。影響關(guān)系詞標(biāo)識(shí)準(zhǔn)確率的因素主要有五類,分別為:關(guān)系副詞的影響,介詞的影響,關(guān)系標(biāo)記不同用法的影響(同形異義詞、同形異構(gòu)詞、同形異類詞的關(guān)聯(lián)和非關(guān)聯(lián)用法的影響),關(guān)系標(biāo)記搭配的影響和關(guān)系標(biāo)記隱現(xiàn)形式的影響。對(duì)每一類影響因素,主要分析其各自的特點(diǎn),并討論對(duì)應(yīng)的處理方法和策略。
2、對(duì)標(biāo)記連用
4、現(xiàn)象進(jìn)行深入研究。主要研究二標(biāo)記連用和三標(biāo)記連用時(shí)各個(gè)標(biāo)記的語法語義功能和類別。對(duì)于二標(biāo)記連用,歸納出矛盾類和限制類兩種類型.這種類型的區(qū)分,既可以在計(jì)算機(jī)處理時(shí)減少不必要的計(jì)算,也可以作為復(fù)句分析過程中的一個(gè)切入點(diǎn)。三標(biāo)記連用現(xiàn)象中,識(shí)別不同的關(guān)系詞所需的方法不同,沒有一個(gè)統(tǒng)一且粒度較細(xì)的策略,需要具體問題具體分析。
3、研究句式特點(diǎn)與關(guān)系詞標(biāo)識(shí)之間的關(guān)系。主要考察三類句式:第一、格式固定且無歧義,但語義關(guān)系不好確定導(dǎo)致
5、關(guān)系詞轄域確定困難的句式,稱之為特殊句式;第二、擴(kuò)展句式,普通的基于搭配理論的算法不能很好地處理擴(kuò)展句式的關(guān)系詞標(biāo)識(shí)問題;第三、多重復(fù)句的普通句式,復(fù)句實(shí)例的標(biāo)記序列中含有多個(gè)標(biāo)記對(duì)。對(duì)于特殊句式,采用表里關(guān)聯(lián)的方式將標(biāo)記序列與處理結(jié)果——對(duì)應(yīng);對(duì)于擴(kuò)展句式,采用自動(dòng)機(jī)理論進(jìn)行建模,既保證了可操作性,又保證了對(duì)語言現(xiàn)象的概括性;對(duì)普通句式,主要是把問題抽象化,并轉(zhuǎn)化為數(shù)學(xué)模型,利用解空間的求解來對(duì)標(biāo)記序列進(jìn)行處理。針對(duì)上述句式,建立規(guī)則
6、庫,并探討了基于規(guī)則的關(guān)系詞自動(dòng)標(biāo)識(shí)方法。
4、對(duì)部分充盈模態(tài)和非充盈模態(tài)下關(guān)系詞的標(biāo)識(shí)問題進(jìn)行研究。文章首先對(duì)分句的語義關(guān)聯(lián)理論進(jìn)行了進(jìn)一步地補(bǔ)充,提出3大類14個(gè)語義關(guān)聯(lián)特征,并制定了特征分析的優(yōu)先圖,修正了分句語義關(guān)聯(lián)度的計(jì)算方法。充盈模態(tài)下的關(guān)系標(biāo)記主要考察“不是就是”,“雖然但是所以”等。研究發(fā)現(xiàn)。對(duì)“不是就是”,可利用極值分析法處理;對(duì)“雖然但是所以”,暫無較好的處理策略,需要建立常識(shí)知識(shí)庫。非充盈模態(tài)下主要是
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 面向中文信息處理的復(fù)句關(guān)系詞自動(dòng)標(biāo)識(shí)研究.pdf
- 基于搭配強(qiáng)度的復(fù)句關(guān)系詞自動(dòng)標(biāo)識(shí)方法研究.pdf
- 基于依存語法的漢語復(fù)句關(guān)系詞自動(dòng)標(biāo)識(shí).pdf
- 復(fù)句關(guān)系詞自動(dòng)標(biāo)識(shí)中規(guī)則引擎的實(shí)現(xiàn)策略研究.pdf
- 漢語復(fù)句關(guān)系詞自動(dòng)標(biāo)識(shí)中規(guī)則自動(dòng)生成方法研究.pdf
- 復(fù)句關(guān)系詞自動(dòng)標(biāo)識(shí)系統(tǒng)中規(guī)則解析器的研究.pdf
- 復(fù)句關(guān)系詞自動(dòng)標(biāo)識(shí)系統(tǒng)中規(guī)則庫及其維護(hù)方法研究.pdf
- 面向中文信息處理的漢語復(fù)句中書讀短語的自動(dòng)識(shí)別研究.pdf
- 面向中文信息處理的復(fù)句特征分析器的研究與實(shí)現(xiàn).pdf
- 中文信息處理基礎(chǔ)
- 中文信息處理論文
- 分詞連寫的中文信息處理.pdf
- 基于關(guān)系詞搭配的漢語復(fù)句依存關(guān)系的層次體系的自動(dòng)構(gòu)建.pdf
- 面向中文信息處理的組合式述補(bǔ)結(jié)構(gòu)研究.pdf
- 中文信息處理關(guān)鍵問題的研究.pdf
- 基于依存樹相似度計(jì)算的漢語復(fù)句關(guān)系詞自動(dòng)識(shí)別.pdf
- 基于渡越矩陣與語境計(jì)算模型的復(fù)句關(guān)系詞的自動(dòng)標(biāo)注.pdf
- 面向中文信息處理的V+N結(jié)構(gòu)句法與語義關(guān)系研究.pdf
- 構(gòu)建面向中文信息處理的名量搭配詞典.pdf
- 基于關(guān)系詞的漢語多重復(fù)句層次結(jié)構(gòu)的研究.pdf
評(píng)論
0/150
提交評(píng)論