計算機(jī)視覺的理論框架探索論文
計算機(jī)視覺理論框架的新發(fā)展,可以以計算視覺理論為主,將基于知識的視覺理論和主動視覺理論結(jié)合到一起,從而使計算機(jī)視覺系統(tǒng)框架變得更加完善。今天學(xué)習(xí)啦小編要與大家分享的是 :計算機(jī)視覺的理論框架探索的論文;具體內(nèi)容如下,希望能幫助到大家!
計算機(jī)視覺的理論框架探索
引言
在計算機(jī)系統(tǒng)中,計算機(jī)視覺是通過模擬人類視覺,從而對不同事物進(jìn)行相關(guān)描述,以獲得更全面的信息。隨著計算機(jī)視覺在文字識別、漫步機(jī)器人和導(dǎo)航中的成功應(yīng)用,計算機(jī)視覺的理論框架研究顯得越來越重要,對于促進(jìn)我國計算機(jī)應(yīng)用技術(shù)水平不斷提升具有重要意義。
1 計算機(jī)視覺的理論框架
隨著計算機(jī)視覺的不斷研究和總結(jié),從二維景物圖像發(fā)展到三維景物圖像,計算機(jī)視覺的理論框架主要有如下三個:
1.1 計算視覺理論框架 在七十年代中期,有關(guān)研究人員提出了第一個計算機(jī)視覺理論框架,即計算視覺理論,將視覺過程看作是信息處理過程,并將信息處理過程分為三個不同的層次,它們分別是計算理論層次、數(shù)據(jù)結(jié)構(gòu)層次和硬件實現(xiàn)層次,從而對計算機(jī)視覺進(jìn)行全面分析。根據(jù)相關(guān)數(shù)據(jù)和資料顯示,視覺是對圖像的位置、形狀和特征等進(jìn)行描述,因此,計算理論層成為了研究的重點,進(jìn)而將視覺過程看作是從二維圖像信息中對圖像進(jìn)行重塑,從而將三維物體的形狀、位置和空間等反映出來,最終形成三維圖像。
由此可見,早期的視覺處理是從輸入的二維圖像中獲得二維要素圖,即圖像中強(qiáng)度變化較強(qiáng)時的位置和幾何分布情況、結(jié)構(gòu)等;中期的視覺處理是從二維要素圖中獲得二點五維圖,即以觀察者為中心,對表面的法向、深度和不連續(xù)的輪廓等進(jìn)行觀測。雖然二點五維包含的深度信息比二維要多,但還不是真正意義上的三維表示,而僅僅是有多個相對獨立的視覺模塊組成的,在相關(guān)研究中被稱作是“shape from X”模型,將運動視覺、立體視覺等融入到其中;后期視覺處理是指從二點五維圖中獲取物體的三維描述,從而將場景中的物體識別處理,確定物體的確切位置和姿態(tài)。
1.2 基于知識的視覺理論框架 在計算機(jī)視覺理論中,基于知識的視覺理論框架,是圍繞感知特征群集來進(jìn)行相關(guān)研究的,從而通過人類感知的經(jīng)驗來描述目標(biāo),最終確定物體在場景中的真正位置、形態(tài)等。相關(guān)研究人員認(rèn)為,基于知識的視覺理論可以通過知識的引導(dǎo)來直接完成三維重建,以將相對應(yīng)觀察方向保持不變動二維特征稱作是非偶然性聚類,而人體中視覺識別發(fā)揮重要作用的一種感知組織,通過對非偶然性聚類的檢測,可以有效辨別出目標(biāo)。
因此,首先是利用感知組織來提取圖像中相對于觀察方向大范圍變化,并且保持不變的分組和結(jié)構(gòu)等;然后,利用概率排隊的方法來進(jìn)行模型匹配,從而縮小檢測空間;最后,通過對觀察點的未知求解和尋找模型參數(shù)對應(yīng)關(guān)系,使三維模型的投影和圖像得到最合適的匹配,最終完成三維重建。
1.3 主動視覺理論框架 第三種計算機(jī)視覺理論框架是中東視覺理論礦坑,是根據(jù)人類視覺的主動性特征提出的。由于人類視覺會根據(jù)自己的意識選擇視野范圍內(nèi)所看見的事物的主次,從而移動身體、轉(zhuǎn)向或者改變視角,因此,人們的視覺過程是與所在環(huán)境交互感知和動作的過程。在計算機(jī)視覺理論框架的主動視覺框架中,視覺行為不需要三維物體的相關(guān)精確信息,就可以完成物體重建。主動視覺系統(tǒng)根據(jù)所需的物體對象特征、分析結(jié)果和當(dāng)前要求等,通過控制攝像機(jī)的相關(guān)操作,如取向、位置、焦距等,就可以完成相關(guān)處理任務(wù)和信息交換。與此同時,主動視覺還可以用改變攝像機(jī)的參數(shù)和處理攝像后的數(shù)據(jù)等,使圖像的時間、空間和分辨率等發(fā)生變化,從而增強(qiáng)圖像的感知效果。
2 計算機(jī)視覺理論框架存在的問題
現(xiàn)代發(fā)展中,計算機(jī)視覺理論框架的提出,是計算機(jī)視覺領(lǐng)域研究的重要突破,而在這個發(fā)展過程中,存在著如下一些問題,影響計算機(jī)視覺理論框架的更完善構(gòu)建。由于視覺過程是成像過程的逆過程,存在著混合、投影、噪音和畸變等干擾因素,使圖像三維重建存在不穩(wěn)定性和不確定性,因此,從一幅景象到多幅景象的重建存在很多困難,使三維圖像的準(zhǔn)確性和通用性大大降低。并且,計算視覺理論認(rèn)為輸入是被動的,整個視覺過程自下而上不存在反饋,處理目的沒有發(fā)生任何改變,因此,對物體的確切位置和形狀有一定要求。
另外,有關(guān)學(xué)者提出計算機(jī)視覺理論框架沒有充分運用知識,對知識表達(dá)沒有給以高度重視,從而忽略知識推理和知識庫的構(gòu)建,沒有對空間約束和場景假設(shè)進(jìn)行充分考慮,從而使場景假設(shè)受到局限。并且,沒有進(jìn)行多次的分析和試驗,致使計算機(jī)視覺理論框架構(gòu)建存在很多問題。
基于知識的理論框架忽略了計算視覺理論的重要性,認(rèn)為人類視覺和重建無關(guān),然而,在進(jìn)行物體尺寸判斷、物體距離估算等情況時,光靠識別是不夠的,必須要依靠三維重建,才能將物體的確切位置、形狀等準(zhǔn)確地描述出來。
主動視覺理論沒有排除三維重建,通過改變攝像機(jī)的參數(shù)和角度等,來改變物體空間、時間和分辨率的感知效果,從而對圖像出來過程進(jìn)行相關(guān)約束,使很多不穩(wěn)定和不合適的問題得到有效解決,最終完成三維重建。運用主動視覺理論框架,可以大大降低問題的難度,但主動視覺理論框架仍存在缺乏高層知識指導(dǎo)的問題,導(dǎo)致主動視覺框架還不夠完整,使計算機(jī)視覺理論框架構(gòu)建受到一定影響。
3 計算機(jī)視覺理論框架構(gòu)建的新發(fā)展
在計算機(jī)視覺理論框架的構(gòu)建過程中,計算視覺理論比較系統(tǒng)地解釋了從二維圖中獲取三維物體形態(tài)的方法和可能性,而基于知識的實際理論和主動視覺理論則對計算視覺理論進(jìn)行了補(bǔ)充和進(jìn)一步提升。因此,計算機(jī)視覺理論框架的新發(fā)展,可以以計算視覺理論為主,將基于知識的視覺理論和主動視覺理論結(jié)合到一起,從而使計算機(jī)視覺系統(tǒng)框架變得更加完善。
在實際應(yīng)用過程中,將早期視覺處理分為圖像分割、圖像預(yù)處理和二維模式識別等,以對二維圖像進(jìn)行濾波降噪和圖像增強(qiáng)等,因此,不需要知識引導(dǎo)和控制視覺目的。在圖像分割、二維圖像模式識別、中期處理、后期處理和三維模式識別的過程中,沒有知識引導(dǎo)和模型匹配,最終得出的圖像效果會更好、更完整。在早期視覺處理和后期視覺處理中,二維模式和三維模式的識別,需要根據(jù)物體的實際情況來確定,由于特征、模型等各不一樣,所以,二維物體和三維物體的描述方式也各不相同。
由于二維信息的質(zhì)量會影響三維信息的效果,因此,在計算機(jī)視覺中,二維信息應(yīng)當(dāng)給以高度重視。而模型庫和視覺目的的應(yīng)用,為計算機(jī)視覺理論框架構(gòu)建提供了更多的信息。由此可見,在計算機(jī)視覺系統(tǒng)中,通過視覺目的來進(jìn)行物體形象、位置等的輸出判斷,同時,運用視覺目的可以對圖像分割和二維模式識別、中期視覺處理、后期視覺處理和三維模式識別等進(jìn)行有效控制,最終使三維重建的圖像信息更加完整。
4 結(jié)束語
隨著高科技信息技術(shù)的不斷推廣,計算機(jī)視覺理論框架的研究已經(jīng)成為目前重點關(guān)注對象之一,雖然取得了一定的成績,但計算機(jī)視覺理論框架構(gòu)建還不夠完善。因此,計算機(jī)視覺理論框架未來的發(fā)展,需要對計算實際理論、基于知識的視覺理論和主動視覺理論進(jìn)行更深層次的研究,將理論和實踐應(yīng)用緊密結(jié)合在一起,從而使計算機(jī)視覺理論框架研究的成果可以更加輝煌。