原生XML數(shù)據(jù)庫存儲與索引關(guān)鍵技術(shù)研究.pdf_第1頁
已閱讀1頁,還剩146頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、XML已成為Web上表示和交換數(shù)據(jù)的標(biāo)準(zhǔn)格式。如何有效管理大量XML文檔數(shù)據(jù),是當(dāng)前數(shù)據(jù)庫領(lǐng)域中一個亟待解決的研究課題。傳統(tǒng)關(guān)系數(shù)據(jù)庫由于數(shù)據(jù)模型的差異而無法勝任大規(guī)模XML數(shù)據(jù)管理。原生XML數(shù)據(jù)庫以XML數(shù)據(jù)模型為中心,具有為XML量身定做的存儲方案、索引結(jié)構(gòu)和查詢引擎,能夠用十分自然的方式管理XML文檔,克服了傳統(tǒng)RDBMS管理XML時存在的固有缺陷。原生XML數(shù)據(jù)庫開發(fā)過程中面臨的首要問題是重新設(shè)計和實現(xiàn)體現(xiàn)XML數(shù)據(jù)模型的存儲

2、方案和索引結(jié)構(gòu),為高效率XML查詢處理和數(shù)據(jù)更新提供強(qiáng)有力的支持,這正是本文的研究工作。
   本文首先提出了一種新的原生XML數(shù)據(jù)存儲方案XN—Store。該方案將XML節(jié)點作為記錄直接存儲到分頁文件中,建立起原生XML存儲的主索引,實現(xiàn)了持久化文檔對象模型,從而保持了XML數(shù)據(jù)原有的樹形結(jié)構(gòu)。XN—Store不僅降低了XML文檔的存儲空間開銷,而且實現(xiàn)了XML節(jié)點的快速導(dǎo)出和訪問操作。作為通用的原生XML存儲方案,XN-St

3、ore支持各種二級索引的創(chuàng)建,以提高XML查詢處理的效率。實驗結(jié)果表明,XN-Store是一種高性能的原生XML數(shù)據(jù)庫存儲方案。
   基于XN-Store存儲方案,本文提出了一套適用于原生XML數(shù)據(jù)庫的索引結(jié)構(gòu)基礎(chǔ)框架,包括XML結(jié)構(gòu)索引、XML值索引和XML全文索引,能夠適應(yīng)XML查詢處理的基本要求。XML結(jié)構(gòu)索引用于加速XML查詢中的結(jié)構(gòu)關(guān)系約束;XML值索引和XML全文索引用于加速XML查詢中的內(nèi)容謂詞約束。結(jié)構(gòu)摘要索引

4、是一種重要的XML結(jié)構(gòu)索引。本文設(shè)計了一種新的XML結(jié)構(gòu)摘要索引rs_index,其特點是將標(biāo)簽路徑作
   為關(guān)鍵詞進(jìn)行逆序存儲,從而使帶有起始“//”軸的路徑查詢轉(zhuǎn)換為高效的B+樹前綴匹配。在rs_index結(jié)構(gòu)摘要索引的支持下,路徑表達(dá)式查詢的執(zhí)行能夠充分利用連續(xù)的“父親-孩子”軸作為查詢上下文信息,修剪掉大量不必要的搜索空間。
   本文提出了歸約查詢樹生成算法,基于原生XML索引結(jié)構(gòu)基礎(chǔ)框架,化簡查詢樹以減少查

5、詢節(jié)點的個數(shù),進(jìn)而有效地降低了結(jié)構(gòu)連接操作的開銷,并以統(tǒng)一的方式處理結(jié)構(gòu)關(guān)系約束和內(nèi)容謂詞約束。實驗表明,該算法能夠?qū)Path路徑表達(dá)式的平均求值效率提高一個數(shù)量級。
   本文還提出了XN-Store存儲方案和各類索引結(jié)構(gòu)的更新策略。動態(tài)XML樹編碼方案BSC利用二進(jìn)制分?jǐn)?shù)特性解決了節(jié)點插入問題。XN-Store的更新機(jī)制既保持了節(jié)點的文檔序,又使更新操作局限于一個頁面之內(nèi),保證了更新的效率。在XML數(shù)據(jù)更新的同時,各類XM

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論