圖像處理基本知識(shí)圖像處理的方法
圖像處理基本知識(shí)圖像處理的方法
圖像處理又稱為影像處理,是用計(jì)算機(jī)對(duì)圖像進(jìn)行達(dá)到所需結(jié)果的技術(shù)。那么你對(duì)圖像處理了解多少呢?以下是由學(xué)習(xí)啦小編整理關(guān)于圖像處理基本知識(shí)的內(nèi)容,希望大家喜歡!
圖像處理的介紹
所謂數(shù)字圖像處理就是利用計(jì)算機(jī)對(duì)圖像信息進(jìn)行加工以滿足人的視覺心理或者應(yīng)用需求的行為。實(shí)質(zhì)上是一段能夠被計(jì)算機(jī)還原顯示和輸出為一幅圖像的數(shù)字碼。 21世紀(jì)是一個(gè)充滿信息的時(shí)代,圖像作為人類感知世界的視覺基礎(chǔ),是人類獲取信息、表達(dá)信息和傳遞信息的重要手段。
數(shù)字圖像處理即用計(jì)算機(jī)對(duì)圖像進(jìn)行處理,其發(fā)展歷史并不長(zhǎng)。數(shù)字圖像處理技術(shù)源于20世紀(jì)20年代,當(dāng)時(shí)通過海底電纜從英國(guó)倫敦到美國(guó)紐約傳輸了一幅照片,采用了數(shù)字壓縮技術(shù)。
首先數(shù)字圖像處理技術(shù)可以幫助人們更客觀、準(zhǔn)確地認(rèn)識(shí)世界,人的視覺系統(tǒng)可以幫助人類從外界獲取3/4以上的信息,而圖像、圖形又是所有視覺信息的載體,盡管人眼的鑒別力很高,可以識(shí)別上千種顏色,但很多情況下,圖像對(duì)于人眼來(lái)說是模糊的甚至是不可見的,通過圖象增強(qiáng)技術(shù),可以使模糊甚至不可見的圖像變得清晰明亮。
另一方面,通過數(shù)字圖像處理中的模式識(shí)別技術(shù),可以將人眼無(wú)法識(shí)別的圖像進(jìn)行分類處理。通過計(jì)算機(jī)模式識(shí)別技術(shù)可以快速準(zhǔn)確地檢索、匹配和識(shí)別出各種東西。
數(shù)字圖像處理技術(shù)已經(jīng)廣泛深入地應(yīng)用于國(guó)計(jì)民生休戚相關(guān)的各個(gè)領(lǐng)域。
在計(jì)算機(jī)中,按照顏色和灰度的多少可以將圖像分為二值圖像、灰度圖像、索引圖像和真彩色RGB圖像四種基本類型。大多數(shù)圖像處理軟件都支持這四種類型的圖像。
中國(guó)物聯(lián)網(wǎng)校企聯(lián)盟認(rèn)為圖像處理將會(huì)是物聯(lián)網(wǎng)產(chǎn)業(yè)發(fā)展的重要支柱之一,它的具體應(yīng)用是指紋識(shí)別技術(shù)。
二值圖像
一幅二值圖像的二維矩陣僅由0、1兩個(gè)值構(gòu)成,“0”代表黑色,“1”代白色。由于每一像素(矩陣中每一元素)取值僅有0、1兩種可能,所以計(jì)算機(jī)中二值圖像的數(shù)據(jù)類型通常為1個(gè)二進(jìn)制位。二值圖像通常用于文字、線條圖的掃描識(shí)別(OCR)和掩膜圖像的存儲(chǔ)。
灰度圖像
灰度圖像矩陣元素的取值范圍通常為[0,255]。因此其數(shù)據(jù)類型一般為8位無(wú)符號(hào)整數(shù)的(int8),這就是人們經(jīng)常提到的256灰度圖像。“0”表示純黑色,“255”表示純白色,中間的數(shù)字從小到大表示由黑到白的過渡色。在某些軟件中,灰度圖像也可以用雙精度數(shù)據(jù)類型(double)表示,像素的值域?yàn)閇0,1],0代表黑色,1代表白色,0到1之間的小數(shù)表示不同的灰度等級(jí)。二值圖像可以看成是灰度圖像的一個(gè)特例。
索引圖像
索引圖像的文件結(jié)構(gòu)比較復(fù)雜,除了存放圖像的二維矩陣外,還包括一個(gè)稱之為顏色索引矩陣MAP的二維數(shù)組。MAP的大小由存放圖像的矩陣元素值域決定,如矩陣元素值域?yàn)閇0,255],則MAP矩陣的大小為256Ⅹ3,用MAP=[RGB]表示。MAP中每一行的三個(gè)元素分別指定該行對(duì)應(yīng)顏色的紅、綠、藍(lán)單色值,MAP中每一行對(duì)應(yīng)圖像矩陣像素的一個(gè)灰度值,如某一像素的灰度值為64,則該像素就與MAP中的第64行建立了映射關(guān)系,該像素在屏幕上的實(shí)際顏色由第64行的[RGB]組合決定。也就是說,圖像在屏幕上顯示時(shí),每一像素的顏色由存放在矩陣中該像素的灰度值作為索引通過檢索顏色索引矩陣MAP得到。索引圖像的數(shù)據(jù)類型一般為8位無(wú)符號(hào)整形(int8),相應(yīng)索引矩陣MAP的大小為256Ⅹ3,因此一般索引圖像只能同時(shí)顯示256種顏色,但通過改變索引矩陣,顏色的類型可以調(diào)整。索引圖像的數(shù)據(jù)類型也可采用雙精度浮點(diǎn)型(double)。索引圖像一般用于存放色彩要求比較簡(jiǎn)單的圖像,如Windows中色彩構(gòu)成比較簡(jiǎn)單的壁紙多采用索引圖像存放,如果圖像的色彩比較復(fù)雜,就要用到RGB真彩色圖像。
RGB圖像
RGB圖像與索引圖像一樣都可以用來(lái)表示彩色圖像。與索引圖像一樣,它分別用紅(R)、綠(G)、藍(lán)(B)三原色的組合來(lái)表示每個(gè)像素的顏色。但與索引圖像不同的是,RGB圖像每一個(gè)像素的顏色值(由RGB三原色表示)直接存放在圖像矩陣中,由于每一像素的顏色需由R、G、B三個(gè)分量來(lái)表示,M、N分別表示圖像的行列數(shù),三個(gè)M x N的二維矩陣分別表示各個(gè)像素的R、G、B三個(gè)顏色分量。RGB圖像的數(shù)據(jù)類型一般為8位無(wú)符號(hào)整形,通常用于表示和存放真彩色圖像,當(dāng)然也可以存放灰度圖像。
數(shù)字化圖像數(shù)據(jù)有兩種存儲(chǔ)方式:位圖存儲(chǔ)(Bitmap)和矢量存儲(chǔ)(Vector)
我們平常是以圖像分辨率(即像素點(diǎn))和顏色數(shù)來(lái)描述數(shù)字圖象的。例如一張分辨率為640*480,16位色的數(shù)字圖片,就由2^16=65536種顏色的307200(=640*480)個(gè)素點(diǎn)組成。
位圖圖像:位圖方式是將圖像的每一個(gè)象素點(diǎn)轉(zhuǎn)換為一個(gè)數(shù)據(jù),當(dāng)圖像是單色(只有黑白二色)時(shí),8個(gè)象素點(diǎn)的數(shù)據(jù)只占據(jù)一個(gè)字節(jié)(一個(gè)字節(jié)就是8個(gè)二進(jìn)制數(shù),1個(gè)二進(jìn)制數(shù)存放象素點(diǎn));16色(區(qū)別于前段“16位色”)的圖像每?jī)蓚€(gè)象素點(diǎn)用一個(gè)字節(jié)存儲(chǔ);256色圖像每一個(gè)象素點(diǎn)用一個(gè)字節(jié)存儲(chǔ)。這樣就能夠精確地描述各種不同顏色模式的圖像圖面。
位圖圖像彌補(bǔ)了矢量式圖像的缺陷,它能夠制作出色彩和色調(diào)變化豐富的圖像,可以逼真地表現(xiàn)自然界的景象,同時(shí)也可以很容易地在不同軟件之間交換文件,這就是位圖圖像的優(yōu)點(diǎn);而其缺點(diǎn)則是它無(wú)法制作真正的3D圖像,并且圖像縮放和旋轉(zhuǎn)時(shí)會(huì)產(chǎn)生失真的現(xiàn)象,同時(shí)文件較大,對(duì)內(nèi)存和硬盤空間容量的需求也較高。位圖方式就是將圖像的每一像素點(diǎn)轉(zhuǎn)換為一個(gè)數(shù)據(jù)。
如果用1位數(shù)據(jù)來(lái)記錄,那么它只能代表2種顏色(2^1=2);如果以8位來(lái)記錄,便可以表現(xiàn)出256種顏色或色調(diào)(2^8=256),因此使用的位元素越多所能表現(xiàn)的色彩也越多。通常我們使用的顏色有16色、256色、增強(qiáng)16位和真彩色24位。一般所說的真彩色是指24位(2^24)的位圖存儲(chǔ)模式適合于內(nèi)容復(fù)雜的圖像和真實(shí)照片。但隨著分辨率以及顏色數(shù)的提高,圖像所占用的磁盤空間也就相當(dāng)大;另外由于在放大圖像的過程中,其圖像勢(shì)必要變得模糊而失真,放大后的圖像像素點(diǎn)實(shí)際上變成了像素“方格”。 用數(shù)碼相機(jī)和掃描儀獲取的圖像都屬于位圖。
矢量圖像:矢量圖像存儲(chǔ)的是圖像信息的輪廓部分,而不是圖像的每一個(gè)象素點(diǎn)。例如,一個(gè)圓形圖案只要存儲(chǔ)圓心的坐標(biāo)位置和半徑長(zhǎng)度,以及圓的邊線和內(nèi)部的顏色即可。該存儲(chǔ)方式的缺點(diǎn)是經(jīng)常耗費(fèi)大量的時(shí)間做一些復(fù)雜的分析演算工作,圖像的顯示速度較慢;但圖像縮放不會(huì)失真;圖像的存儲(chǔ)空間也要小得多。所以,矢量圖比較適合存儲(chǔ)各種圖表和工程。
圖像編碼的介紹
對(duì)圖像信息編碼,以滿足傳輸和存儲(chǔ)的要求。編碼能壓縮圖像的信息量,但圖像質(zhì)量幾乎不變。為此,可以采用模擬處理技術(shù),再通過模-數(shù)轉(zhuǎn)換得到編碼,不過多數(shù)是采用數(shù)字編碼技術(shù)。編碼方法有對(duì)圖像逐點(diǎn)進(jìn)行加工的方法,也有對(duì)圖像施加某種變換或基于區(qū)域、特征進(jìn)行編碼的方法。脈碼調(diào)制、微分脈碼調(diào)制、預(yù)測(cè)碼和各種變換都是常用的編碼技術(shù)。
圖像壓縮的介紹
由數(shù)字化得到的一幅圖像的數(shù)據(jù)量十分巨大,一幅典型的數(shù)字圖像通常由500×500或1000×1000個(gè)像素組成。如果是動(dòng)態(tài)圖像,是其數(shù)據(jù)量更大。因此圖像壓縮對(duì)于圖像的存儲(chǔ)和傳輸都十分必要。
有兩類壓縮算法,即無(wú)損壓縮和有損壓縮。最常用的無(wú)損壓縮算法取空間或時(shí)間上相鄰像素值的差,再進(jìn)行編碼。游程碼就是這類壓縮碼的例子。有損壓縮算法大都采用圖像交換的途徑,例如對(duì)圖像進(jìn)行快速傅里葉變換或離散的余弦變換。著名的、已作為圖像壓縮國(guó)際標(biāo)準(zhǔn)的JPEG和MPEG均屬于有損壓縮算法。前者用于靜態(tài)圖像,后者用于動(dòng)態(tài)圖像。它們已由芯片實(shí)現(xiàn)。
看過“圖像處理基本知識(shí)“的人還看了:
2.圖像處理教程