視頻檢索技術中關鍵幀提取算法的研究.pdf_第1頁
已閱讀1頁,還剩75頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、隨著多媒體和互聯(lián)網(wǎng)技術的迅速發(fā)展,視頻作為獲取信息資源的主要形式之一,給我們帶來了視覺和聽覺的享受。但是,快速地從海量的視頻中找到有效的信息并不是易事,因為視頻不同于其它數(shù)據(jù)信息,具有數(shù)據(jù)量大,結(jié)構(gòu)復雜,內(nèi)容豐富的特點?;趦?nèi)容的視頻檢索方法是通過計算機對多媒體數(shù)據(jù)中包含的內(nèi)容進行分析與理解,提取視頻中的顏色、形狀和紋理等視覺特征作為索引,以方便用戶進行查詢,確保能夠快速地檢索到有效的多媒體內(nèi)容。
   基于內(nèi)容的檢索通常先對視

2、頻進行鏡頭檢測,把視頻分割成若干個鏡頭。每個鏡頭中的圖像幀含有很大的冗余信息。所以,通過對每個鏡頭提取能夠代表鏡頭內(nèi)容的關鍵幀,可以解決這個問題。利用關鍵幀序列來代表視頻內(nèi)容的變化,以此來代替相應的視頻,這樣,不但減少了需要處理的數(shù)據(jù),而且大大提高了檢索的效率。關鍵幀提取是將視頻轉(zhuǎn)化為圖像的重要方法。目前關鍵幀的提取已經(jīng)有很多算法,有基于鏡頭邊界、運動分析或者聚類等方法。這些方法都是需要先進行鏡頭分割,然后通過分析圖像幀的顏色、形狀、紋

3、理等特征,還有各幀之間的相互關系,找到代表視頻信息的關鍵幀。但是提取的關鍵幀有時候并不一定能代表視頻的有效內(nèi)容,這樣就使接下來的視頻檢索處理產(chǎn)生了前期的誤差。因此,關鍵幀如何能夠在最大程度上代表視頻的主要內(nèi)容,而且又可以適用在不同的視頻上,是具有重要學術意義和實用價值的。
   視頻特征提取是關鍵幀提取的首要步驟,特征向量提取的好壞直接影響著關鍵幀描述鏡頭的效果。本論文從視頻、圖像兩個層次介紹了視頻信息的特征,并對顏色、形狀、紋

4、理和運動特征提取方法進行了詳細地說明,通過數(shù)學公式對這些特征進行了量化描述。
   基于聚類的方法能夠有效地消除鏡頭間的相關性,但是不能保存原鏡頭內(nèi)圖像幀的時間順序和動態(tài)信息。基于視覺內(nèi)容分析的方法對于運動較多的鏡頭不能充分地描述視頻內(nèi)容。為了兼顧時序性和自適應性,本論文提出了一種基于子鏡頭的自適應關鍵幀提取的新算法。此方法是利用樣本的距離可分性準則提出子鏡頭分割函數(shù),通過尋找函數(shù)極大值將鏡頭分割為若干子鏡頭。這樣不僅可以保持了

5、視頻的時序性,又避免了閾值法分割準確性差的不足。然后,根據(jù)每個子鏡頭內(nèi)本身的內(nèi)容變化,自適應地確定每個子鏡頭的關鍵幀個數(shù),解決了現(xiàn)有算法提取的關鍵幀數(shù)目不理想的問題。
   該方法首先對視頻鏡頭從子鏡頭、圖像幀兩個層次進行分析。從鏡頭中檢測出子鏡頭,自適應提取關鍵幀,使用戶能根據(jù)少量的可視化數(shù)據(jù)對視頻有快速的了解。
   本方法能夠根據(jù)視頻自身的復雜度,提取準確率較高的關鍵幀,在實驗過程中,利用保真度和壓縮率來衡量改進方

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論