北京赛车软件|北京赛车网
歡迎光臨第一論文網,權威的論文發表,我們將竭誠為您服務!
您的位置: 第一論文網 -> 工會工作 -> 文章內容

基于案例推理技術在影像檔案檢索中的應用

作者:第一論文網 更新時間:2015年10月30日 10:03:34

文/中國礦業大學 嚴悅 周曉林 賈玲 李月娥 高穎

【摘要】本文以影像檔案為載體,基于案例推理技術來對影像檔案中所存在的數字圖像或視頻檢索問題進行了系統分析與探討,對如何在影像檔案中構建以案例推理技術為基礎的檢索系統進行了詳細闡述。

【關鍵詞】案例推理技術;影像檔案;檢索

在信息時代下,伴隨著數字化、網絡化技術的迅猛發展,傳統檔案管理無論是在服務的模式還是在業務的流程上都發生著全方位的改變。傳統管理模式下采集部門(以文獻、資料分辨業務為主)的核心地位逐漸被取代,取而代之的是以社會為對象的一線服務。新時期下,如何進一步增強檔案信息的生命力,最大化創造社會效益儼然是檔案管理工作轉型、變革過程中所面臨的當務之急。與此同時,伴隨著辦公硬件設備的逐步完善,大量影像檔案出現在人們的日常生活工作中,面對這些數字化信息(以視頻、圖像為主),如何針對用戶的信息快速有效地完成檢索與輸出儼然已經成為了新時期檔案管理工作者共同面臨的重大課題之一。

作為一種新型機器學習與推理方法,案例推理技術的核心思想是通過對人類過去解決問題的經驗的充分利用來解決嶄新的問題。從整體上來看,案例推理技術主要由四個基本過程組成(即“4R”循環),即Retrieve(案例提取)、Reuse(案例重用)、Revise(案例改變)、Retain(案例保存與學習)。針對案例推理技術(CBR),多年來眾多知名學者與學術團隊致力于對其理論與應用方面的研究,取得了很大進展。每年舉行的CBR研討會(由國際研究界組織,1987年開始實行)使得一批又一批關于CBR的優秀研究成果得以發表,有效促進了CBR理論與應用研究的不斷發展。截止目前,CBR研究的熱點主要集中在五個方面,即在計劃、推薦、分類及預測等工作中的理論與應用,與其他人工智能方法的比較與融合,案例改變機制的研究,作為解釋機制的算法研究,在多種領域或學科中的應用研究。針對CBR系統和項目的應用,目前國外很多領域都已經實現,應用的領域也逐漸開始拓展。但就我國國內來說,CBR在實際系統中的應用成功案例相對較少,亟待進一步發展。本文研究的重點是案例推理技術在影像檔案檢索中的應用。

一、概念

簡單來說,以案例推理技術(CBR)為基礎的影像檔案檢索,其實就是根據媒體與相應對象的上下文聯系及語義內容來進行檢索,整個查詢過程所針對的僅僅是對象,并不是對象的標識。具體來說,需要從媒體數據中提取指定的特征,如顏色、形狀以及紋理等,以這些特征為基礎來檢索出媒體數據庫中具有相似特征的圖像或視頻內容。截止目前,對于圖片或視頻數據庫的檢索主要有兩種方法,即基于內容的檢索與基于文本的檢索。無論基于內容還是文本,這兩種檢索方法都具有兩個缺點,一方面是由于影像包含的信息量較大,不同人對相同內容的解釋存在一定差異,同一人在不同時刻對不同內容的解釋也可能存在相似性,所以對影像的標注就難以在標準上達成統一。另一方面是人工標注的繁瑣性將直接造成相應的標注、歸類的速度降低,難以實現與數字媒體產生速度的匹配,所以很難實現對互聯網中海量影像的有效檢索。然而,較之于這兩種人工性檢索方式,基于案例推理技術的影像檔案檢索則具有如下特征:(1)以影像內容特征為基礎來進行分類,提取內容的標準為滿足用戶需求。(2)用戶提交的檢索內容以及數據庫中影像經過轉變之后再進行近似匹配,并不是對原始數據進行直接對比。(3)適合各種類型數據庫的檢索(特別是中大型數據庫),檢索效率較高。在案例推擠技術的支撐下,用戶對影像檔案的檢索并不需要進行語言上的過多描述,直接將影像本身作為檢索條件在系統中進行提交即可獲取結果輸出。

二、檢索流程

基于案例推理技術的影像檔案檢索,其基本過程為對用戶輸入特征信息的提取→在影像特征庫中查詢匹配的特征信息→獲取索引數據。基于案例推理技術的工作流程主要具有如下功能模塊:

人機交互界面:一般來說,人機對話界面都是由VB(或VC)等計算機高級語言進行編制的。通過將需要查詢的內容(如圖片、視頻片段)提交到計算機中,獲取結果。

向量化:在對具體的影像信息進行分類之前,圖像或視頻是以向量的形式表現出來的。部分冗余的信息將在這個過程中被過濾掉(如噪音),而具有高價值信息的特征將在向量空間中得到量化。

特征提取:特征提取是影像分類中最為關鍵的問題,其不僅可以簡化計算過程,同時還具有降低向量維數的作用。但對視頻本身來說,因其并不是簡單的圖像序列,相關性是相鄰視頻幀之間表現出的緊密關系,所以要繼承傳統圖像在檢索中廣泛運用的低層特征之外(如顏色、形狀、紋理等),還應該通過對視頻運動信息的利用來為檢索提供時序線索。同時,視頻檢索過程中所使用的運動信息主要包含了四種,即塊運動矢量的主分量、物體運動的軌跡、攝像機運動以及時序紋理等。也正因為如此,特征提取中所包含的集合也就有兩種特征,一種是高層次語義特征,另一種是低層次視覺特征。針對這兩種集合,相應程序將根據用戶的實際需求來將權值自動加入到其中,然后再利用評估函數來對特征集中的每一個特征的評估值分別進行獨立的計算,計算結果出來后按評估值的大小來將所有特征進行排序,從而選取預定數目的最佳特征來作為結果的特征子集。在抽取特征的過程中,相應程序在一定范圍內會自動選擇不同的閾值來對特征進行過濾,從中獲取所需要的特征向量,然后以此作為基礎來構建特定的向量空間,最后再進行嚴格的分類檢測。最終的最佳特征過濾閾值的選擇也正是通過這個分類檢測的結果來進行的。

自動分類:根據閾值計算影像的特征向量以及特征提取所得出的評估值,在充分采用人工智能方法的基礎上尋找其類別,產生兩個相互結合且彼此獨立存在的兩個向量集合,即高層次語義特征和低層次視覺特征。具體來說,線性分類法、支持向量機以及神經網絡等是現目前最常用的算法。

相似性檢索:在數據接口處將影像庫中的數據與分類后的向量集合進行對比,比較相互之間的相似性,并且按照實際的相似性大小來給出具體的檢索值。

低(高)層相似度:在已經提交過的向量集當中,通過在數據接口處將低(高)層次特征向量與影像數據庫內容進行對比,程序將自動生成一個只對影像低(高)層次特征進行了定義的相似性。

最終相似度:分別將高層、底層相似度與各自的權值相乘,所得出的結果即為最終相似度,這個權值既可以根據用戶的不同需求來設定,也可以由程序來自動設定。

檢索結果:結合最終相似度,程序將嚴格按照相似性的大小來得出檢索結果,這個結果并不一定是最終的,用戶可以根據這個結果再進行二次查詢或者直接完成檢索。

三、用于視頻分析的關鍵技術

由于視頻信息通常都具有較強的復雜性,所以在視頻分析的過程中就擁有諸多關鍵性技術。在此,對這些關鍵技術進行詳細說明,以此來為進一步的研究和算法設計提供依據。

關鍵幀提取:以新視覺內容實時變化情況(如運動信息、顏色直方圖等)的分析來確定所需關鍵幀的數目,并進行關鍵幀提取,是目前最為理想的關鍵幀提取辦法。

視頻鏡頭的檢測:以直方圖為基礎的技術是目前應用最廣泛、最普遍的鏡頭檢測方法。通過對視頻幀圖像顏色直方圖或灰度直方圖的對比來確定邊界,以此來平衡檢測的速度與精度。

四、基于案例推理技術檢索的算法分析

基于算法的角度來看,案例推理技術的應用對于整個影像檔案檢索工作來說,是一個調整匹配、逐步逼近的循環過程:

相關反饋:通過對監督學習與自啟動技術的充分利用,用戶通過對檢索結果相關性的判定能夠有效提升檢索的性能,這個過程無疑是影像檢索系統中不可獲取的重要環節。截止到目前,關于反饋算法所采用的檢索模型主要可劃分為三種類型,即基于概率框架的方法、基于距離度量的方法以及基于機器學習的方法。與此同時,根據反饋算法中的內容又可以將其分為正負反饋法兩種類型。這里主要的是,支持向量機是在機器學習過程中通過最優化理論而構建的學習訓練算法,其能夠將用戶所標記在反饋結果中的正反例圖像、視頻段作為下一類圖像、視頻段的樣本來實施訓練。

主成份分析:針對特征空間的去噪、降維等問題,僅僅依靠相關反饋算法儼然是難以有效解決的。基于此,可以對檢索過程中用戶所提供的正反饋樣本在特征空間里的分布特性進行主成分分析,以此來消除特征中的噪聲,從而有效降低特征空間的維度。

動態多維索引:我們都知道,數據量龐大、特征維度較高是影像索引數據庫的兩大特征,所以要想提高檢索的效率,就必須以影像特征為基礎來構建高效的多維索引。在這個動態多維索引中,分裂算法與插入算法是最為關鍵的算法。

五、結語

總之,作為一種新型AI推理技術,案例推理技術(CBR)的相關理論及應用方面在近年來得到了長足發展,逐漸出現了眾多成熟的CBR開發工具、CBR系統。毫無疑問,基于案例推理技術的影像檢索方法是信息檢索與服務實現網絡化的關鍵內容之一,所涉及的學科領域眾多(如計算機網絡、視頻處理、數據庫、模式識別以及人工智能等),因此具有很好的發展前途,理應得到我們的大力推廣。

【參考文獻】

[1]片錦英.案例推理技術研究及其應用[J].人力資源管理,2010(06):128+318.

[2]楊健,趙秦怡.基于案例的推理技術研究進展及應用[J].計算機工程與設計,2008(03):710-712+721.

[3]Reidl,J,Starke,J,Omer,DB,etal.Independentcomponentanalysisofhigh-resolutionimagingdataidentifiesdistinctfunctionaldomains,NEUROIMAGE,34(1):94-108JAN12007.

[4]Cheng,SX,Shih,FY.AnImprovedIncrementalTrainingAlgorithmforSupportVectorMachinesUsingActiveQuery,PATTERNRECOGN40(3):964-971,MAR2007.

北京赛车软件