本科畢業(yè)設(shè)計(jì)(論文)
工 作 手 冊(cè)
(理工類專業(yè)適用)
學(xué) 院
專業(yè)班級(jí)
姓 名
學(xué) 號(hào)
指導(dǎo)教師
二○一 年 月 日
基于形狀特征的圖像檢索算法仿真實(shí)現(xiàn)研究
摘要:近年來(lái),隨著數(shù)字多媒體和移動(dòng)計(jì)算機(jī)以及互聯(lián)網(wǎng)信息技術(shù)的快速進(jìn)步發(fā)展,數(shù)字圖像的應(yīng)用數(shù)量正以驚人的增長(zhǎng)速度不斷增長(zhǎng)。面對(duì)日益豐富的數(shù)字圖像媒體信息這個(gè)海洋,人們?nèi)匀恍枰行У貜闹胁粩喃@取所有人期望能夠得到的更多媒體信息。因此,在一個(gè)大規(guī)模的數(shù)字圖像檢索數(shù)據(jù)庫(kù)中如何進(jìn)行快速、準(zhǔn)確的圖像檢索已經(jīng)成為當(dāng)前人們圖像研究的一個(gè)熱點(diǎn)。
為了能夠?qū)崿F(xiàn)快速而準(zhǔn)確地進(jìn)行信息檢索數(shù)字圖像,利數(shù)字圖像的主要視覺(jué)信息特征,如圖像顏色、紋理、形狀等元素,基于形狀的數(shù)字圖像信息檢索處理技術(shù)應(yīng)運(yùn)而生。本文主要深入研究基于圖像形狀基本特征的邊緣圖像偵測(cè)檢索,邊緣圖像檢測(cè)檢索是基于圖像形狀基本特征的一種有效檢索圖像方法,邊緣檢測(cè)是檢索圖像最基本的形狀特性。在圖像景物邊緣特征檢測(cè)中,微分這個(gè)算子算法可以準(zhǔn)確提取和輸出景物圖像的一些細(xì)節(jié)分析信息,景物圖像邊緣特征是圖像細(xì)節(jié)分析信息中最主要具有不可描述性的景物邊緣特征的部分,也是進(jìn)行圖像邊緣分析過(guò)程中的一個(gè)不可或缺的部分。本文詳細(xì)地闡述分析了一種局部邊緣厚度檢測(cè)算子方法,即canny方法算子,用c++編程語(yǔ)言實(shí)現(xiàn)各方法算子的局部邊緣檢測(cè),并根據(jù)算子邊緣厚度檢測(cè)的準(zhǔn)確有效性和邊緣定位的準(zhǔn)確可靠性,得出這種canny方法算子已經(jīng)具備了所有最優(yōu)化的邊緣厚度檢測(cè)所應(yīng)必需的各種特性。并通過(guò)基于圖像輪廓的圖形描述表示方法,傅里葉輪廓描述符對(duì)一個(gè)圖像的輪廓形狀及其特征特點(diǎn)進(jìn)行輪廓描述并將其存入圖像數(shù)據(jù)庫(kù)中。對(duì)行業(yè)也相應(yīng)的具有檢索查詢功能。
關(guān)鍵詞:形狀特征檢索;邊緣圖像檢測(cè);傅里葉描述符
一、前言
隨著現(xiàn)代信息化工業(yè)社會(huì)的到來(lái),幾乎任何一個(gè)學(xué)科研究領(lǐng)域的技術(shù)發(fā)展都和現(xiàn)代計(jì)算機(jī)技術(shù)密切聯(lián)系有關(guān),人們所需要處理的圖象信息已不僅僅只是一些數(shù)字、符號(hào)等的信息,而是越來(lái)越多地與人接觸并得到大量的數(shù)字圖象內(nèi)容信息.其中例如:航空衛(wèi)星信息遙感監(jiān)測(cè)圖象、醫(yī)學(xué)遙感圖象、地理水文信息監(jiān)測(cè)圖象等.而且在實(shí)際技術(shù)應(yīng)用中隨著時(shí)間的不斷推移,圖象信息數(shù)量也在不斷擴(kuò)大,利用各種人力來(lái)對(duì)這些圖象信息進(jìn)行內(nèi)容瀏覽和信息檢索,不僅僅需要大量的精力和時(shí)間,浪費(fèi)大量的的人力,而且?guī)缀跻咽遣豢赡芡瓿傻囊患?。這樣需要利用計(jì)算機(jī)對(duì)這些數(shù)字圖象內(nèi)容進(jìn)行有效內(nèi)容組織和信息檢索便已經(jīng)成為現(xiàn)代人們科學(xué)研究的重要課題.因而傳統(tǒng)的數(shù)字圖象內(nèi)容表達(dá)和信息檢索處理方法往往是需要使用圖象文件名、標(biāo)題、關(guān)鍵詞數(shù)字等.目前,這種檢索方法已不能完全滿足現(xiàn)代人們的技術(shù)要求.因此,人們?cè)絹?lái)越迫切地認(rèn)識(shí)需要對(duì)這些圖象的各種可視性和特征圖象進(jìn)行信息提取,并且根據(jù)這些可視特征對(duì)各種圖象內(nèi)容進(jìn)行信息檢索.基于圖象內(nèi)容的數(shù)字圖象信息檢索處理技術(shù),也正是在這樣的一種情況下發(fā)展產(chǎn)生的.基于圖象內(nèi)容的數(shù)據(jù)圖象信息檢索數(shù)據(jù)技術(shù)就是通過(guò)數(shù)據(jù)分析一個(gè)圖象的主要內(nèi)容(例例如:顏色、紋理、形狀等),從大量活動(dòng)視頻圖象庫(kù)中查找含有特定物體的圖象,它充分克服了現(xiàn)代傳統(tǒng)檢索方法的不足,融合了數(shù)字圖象處理、圖象識(shí)別和網(wǎng)絡(luò)圖象檢索數(shù)據(jù)庫(kù)等多個(gè)領(lǐng)域的最新技術(shù)成果,從而完全可以為你提供更有效的圖象檢索技術(shù)手段.它們既充分體現(xiàn)了特征圖象的基本信息處理特點(diǎn),又充分結(jié)合了現(xiàn)代傳統(tǒng)圖象數(shù)據(jù)庫(kù)檢索技術(shù).其基本檢索過(guò)程一般是:首先對(duì)一個(gè)圖象特征進(jìn)行圖像預(yù)處理,然后根據(jù)特征圖象的基本內(nèi)容從特征圖象中直接選取所有有需要的特征圖象形狀特征,存于圖象數(shù)據(jù)庫(kù)中;然后當(dāng)對(duì)一個(gè)圖象特征進(jìn)行勾畫檢索時(shí),對(duì)于一個(gè)圖象已知的特征圖象首先抽取其具有相應(yīng)的圖象特征,然后在整個(gè)圖象數(shù)據(jù)庫(kù)中進(jìn)行檢索與其相似的特征圖象,也或者可以根據(jù)相對(duì)于某一個(gè)的查詢對(duì)象要求直接給出一些圖象特征點(diǎn)和值,然后根據(jù)所需要給定的圖象特征點(diǎn)和值在整個(gè)圖象數(shù)據(jù)庫(kù)中進(jìn)行檢索所要的特征圖象.結(jié)果例如:對(duì)于基本相同形狀帶有特征的圖象檢索,你或許可以直接給出一些有關(guān)被勾畫檢索某個(gè)對(duì)象的基本形狀特征描述,可以認(rèn)為是一些帶有特征點(diǎn)的值,也或者可以認(rèn)為是勾畫出的檢索對(duì)象的形狀略圖;對(duì)于基本相同顏色的圖象檢過(guò),可以直接給出不同顏色的物體比例或者關(guān)系,等等.最后,給出圖象檢索后的結(jié)果.目前,從事這一技術(shù)課題相關(guān)研究的年輕人越來(lái)越多,國(guó)外許多著名科研機(jī)構(gòu)和專家學(xué)者都在積極進(jìn)行許多有關(guān)這一技術(shù)課題的相關(guān)研究,例如:公司的數(shù)據(jù)檢索系統(tǒng).國(guó)內(nèi)的許多專家學(xué)者和相關(guān)科研機(jī)構(gòu)也在積極進(jìn)行此技術(shù)問(wèn)題的相關(guān)研究.本文首先對(duì)基于對(duì)象內(nèi)容實(shí)體圖象的的檢索數(shù)據(jù)進(jìn)行了簡(jiǎn)要的理論概括,然后對(duì)基于實(shí)體對(duì)象動(dòng)態(tài)形狀的實(shí)體圖象內(nèi)容檢索數(shù)據(jù)理論基礎(chǔ)進(jìn)行了深入的理論研究,包括:基于對(duì)象形狀的實(shí)體圖象內(nèi)容檢索計(jì)算方法,對(duì)象實(shí)體形狀的綜合描述,圖象形狀配匹檢索算法,最后本文給出了一個(gè)基于對(duì)象形狀的實(shí)體圖象內(nèi)容檢索數(shù)據(jù)原型管理系統(tǒng),并在一臺(tái)微機(jī)上加以實(shí)現(xiàn),該原型系統(tǒng)主要功能包括內(nèi)容圖象檢索數(shù)據(jù)庫(kù)的管理建立,數(shù)據(jù)庫(kù)的日常維護(hù),圖象的信息查詢等幾個(gè)功能.二、研究介紹
2.1、課題背景及研究意義
隨著現(xiàn)代多媒體網(wǎng)絡(luò)技術(shù)、計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)、通信網(wǎng)絡(luò)技術(shù)及互聯(lián)網(wǎng)絡(luò)的迅速進(jìn)步發(fā)展,人們正在快速地發(fā)展進(jìn)入一個(gè)現(xiàn)代信息化的新社會(huì)?,F(xiàn)代信息技術(shù)已不可能能夠運(yùn)用各種技術(shù)手段大量的進(jìn)行采集和分析產(chǎn)生各種類型的海量多媒體信息數(shù)據(jù),人們對(duì)各種多媒體信息的采集需求也越來(lái)越大量和頻繁。雖然人類信息的數(shù)量快速增長(zhǎng)直接促進(jìn)了人類社會(huì)的快速發(fā)展,但是由于信息快速膨脹也給現(xiàn)代人類社會(huì)帶來(lái)了過(guò)多的的信息量以至于遠(yuǎn)遠(yuǎn)超過(guò)了這類人的整體接受信息能力。因此,除了怎樣獲取、處理和傳輸存儲(chǔ)各種多媒體信息十分重要,怎樣在各類海量的各種多媒體信息中快速有效地準(zhǔn)確訪問(wèn)這些人們經(jīng)常感興趣的各種多媒體信息也對(duì)其顯示體現(xiàn)出了同樣的巨大重要性。
圖像抽象信息采集是傳統(tǒng)多媒體信息中最常見(jiàn)的一種,也因其具有傳統(tǒng)多媒體信息采集數(shù)據(jù)量大、抽象應(yīng)用程度低的基本特點(diǎn)。如何從各種海量的有用圖像處理信息中有效地收集獲取有用圖像信息,即使是圖像處理信息數(shù)據(jù)資源的使用管理和信息檢索也就顯得日益重要。隨著當(dāng)前人們對(duì)文字圖像文本信息的巨大檢索需求的不斷增長(zhǎng),產(chǎn)生了基于圖像文本的文字圖像信息檢索引擎技術(shù),比如著名的中文搜索結(jié)果引擎google和百度中對(duì)文字圖像的文本檢索。這種基于人類文本的人工檢索標(biāo)注技術(shù)所廣泛利用的人工文本標(biāo)注檢索方法雖然存在一些局限性,經(jīng)常進(jìn)行檢索時(shí)會(huì)出來(lái)大量的一些用戶不感興趣的文本圖像,但在沒(méi)有找到更好文本解決辦法的實(shí)際情況下,用戶通常只能選擇繼續(xù)檢索使用。因此如何對(duì)一個(gè)圖像的特征內(nèi)容自動(dòng)、客觀、全面地對(duì)其進(jìn)行特征提取。真實(shí)有效的準(zhǔn)確表示數(shù)字圖像信息內(nèi)容,幫助用戶快速有效地檢索訪問(wèn)自己感興趣的信息圖像內(nèi)容,有著極大的科學(xué)研究領(lǐng)域需求和迫切的應(yīng)用需要,而基于圖像形狀特征的數(shù)字圖像信息檢索分析技術(shù)恰好真正能有效的幫助解決這個(gè)現(xiàn)實(shí)問(wèn)題。另外在實(shí)際的應(yīng)用中,圖像信息數(shù)據(jù)庫(kù)及其信息檢索的技術(shù)研究對(duì)醫(yī)學(xué)多媒體圖像數(shù)字圖書館、醫(yī)學(xué)臨床圖像應(yīng)用管理、衛(wèi)星圖像遙感網(wǎng)絡(luò)圖像和應(yīng)用計(jì)算機(jī)圖像輔助設(shè)計(jì)和開發(fā)制造、地理位置信息采集系統(tǒng)、犯罪識(shí)別系統(tǒng)、商標(biāo)標(biāo)識(shí)版權(quán)的使用管理,生物的形態(tài)辨識(shí)以及分類等諸多方面可以提供有力的技術(shù)支持。
2.2、國(guó)內(nèi)外發(fā)展?fàn)顩r
近年來(lái),CBIR已經(jīng)逐漸發(fā)展早熟成為一個(gè)非?;钴S的醫(yī)藥臨床醫(yī)學(xué)研究應(yīng)用領(lǐng)域,各類我國(guó)頂尖臨床科研機(jī)構(gòu)與臨床研究公司已陸續(xù)成功開發(fā)推出了一些基于CBIR臨床應(yīng)用管理系統(tǒng)的臨床研究應(yīng)用產(chǎn)品,有的已經(jīng)成功廣泛應(yīng)用擴(kuò)大到醫(yī)藥臨床醫(yī)學(xué)、商標(biāo)、專利技術(shù)以及檢索等諸多研究領(lǐng)域。
IBM的系統(tǒng)QBIC是它是第一個(gè)具有商業(yè)性的基于CBIR的子系統(tǒng)。它們還提供了基于圖像顏色、紋理、形狀和其他手繪圖像草圖的多種圖像類型索引使用方法。columbia大學(xué)的圖庫(kù)Visual SEEK圖庫(kù)提供了基于自然色彩和立體紋理的多種索引分析方法。PhotoBook 是美國(guó)麻省理工學(xué)院和多媒體科學(xué)實(shí)驗(yàn)室自主開發(fā)的一套用于檢索、瀏覽人臉圖像的交互式檢索工具,它其中包含三個(gè)圖像子系統(tǒng)分別用于提取人臉形狀、紋理和各種人臉面部特征,用戶甚至可以分別定制做基于上述一種人臉特征的圖像檢索。MARS(multimedia analysis and retrieval system)這個(gè)系統(tǒng)由美國(guó)UIUC 大學(xué)負(fù)責(zé)開發(fā),其不同之處主要在于用戶學(xué)到了很多專業(yè)領(lǐng)域的基礎(chǔ)知識(shí):例如計(jì)算機(jī)圖像視覺(jué)、數(shù)據(jù)庫(kù)資源管理和云系統(tǒng)和網(wǎng)絡(luò)信息資源檢索。新加坡國(guó)立大學(xué)公司開發(fā)的一個(gè)基于復(fù)雜內(nèi)容的模糊圖像信息檢索系統(tǒng),其顯著性的技術(shù)創(chuàng)新特色主要包括:多種特征提取的新方法、多種基于復(fù)雜內(nèi)容圖像檢索的新方法、使用自定義組織式的神經(jīng)網(wǎng)絡(luò)對(duì)復(fù)雜內(nèi)容特征進(jìn)行度量、建立基于各種內(nèi)容圖像索引的新應(yīng)用方法以及對(duì)各種多媒體信息格式進(jìn)行模糊圖像檢索的新應(yīng)用技術(shù)。
清華大學(xué)的數(shù)字ImgRetr檢索結(jié)合了多種組織檢索方法,就這樣能為您提供基于形狀主色、紋理、直方結(jié)構(gòu)圖、顏色元素分布、框架等多種組織方式的形狀檢索。
2.3課題研究的主要內(nèi)容
本文主要依托基于物體形狀的網(wǎng)絡(luò)圖像信息檢索分析技術(shù),重點(diǎn)深入研究基于物體形狀動(dòng)態(tài)特征的網(wǎng)絡(luò)圖像信息檢索。形狀紋理特征不同于物體顏色、紋理等的特征,形狀紋理特征的正確表達(dá)必須以對(duì)物體圖像中每個(gè)物體或圖像區(qū)域的正確劃分來(lái)作為理論基礎(chǔ)。在二維矩形圖像中的空間中,形狀通常被我們認(rèn)為為它是由于一條完全封閉的并由輪廓映射曲線所形成包圍的特征區(qū)域。通常這種情況下.二維形狀中的特征區(qū)域有兩類可以表示它的方法,一類可以是一個(gè)區(qū)域形狀特征,利用的可以是整個(gè)二維形狀特征區(qū)域;另一種分類可以是一條輪廓曲線特征,利用的則可以是二維圖像的整個(gè)外邊和內(nèi)界。本文主要重點(diǎn)研究的領(lǐng)域就是外界與邊界的邊緣索引測(cè)量方法邊緣測(cè)量檢測(cè),邊緣測(cè)量檢測(cè)的常用方法主要有很多,如:roberts矩形交叉曲線微分代數(shù)算子、sobelt微分代數(shù)算子、priwitt交叉微分代數(shù)算子和Laplacian微分代數(shù)算子以及canny微分算子。而其中屬Canny算子最好。
本文主要深入研究的字符是傅里葉描述符。其主要理論思想觀點(diǎn)是用關(guān)于物體內(nèi)部邊界的傅立葉變換公式作為其物體形狀學(xué)的描述。
2.4、相關(guān)內(nèi)容介紹
2.4.1形狀分析
2.4.1.1、形狀特征
常用的長(zhǎng)軸形狀運(yùn)動(dòng)特征參數(shù)有長(zhǎng)軸周長(zhǎng)、形狀特征參數(shù)、偏心率、長(zhǎng)軸運(yùn)動(dòng)方向與彎曲運(yùn)動(dòng)能量等矩陣的描述、綜合光密度以及三維輪廓的應(yīng)力矩也同樣可以用于表示和用來(lái)描述三維圖像。
2.4.1.2特征選擇
通常一般來(lái)說(shuō),形狀的形態(tài)表示特征圖型表示法具有兩種常用圖形表示法的表現(xiàn)方法,一種表示方式主要是用來(lái)表示具有輪廓性的形狀形態(tài)特征,另一種表示方法主要是用來(lái)表示具有區(qū)域性的形狀形態(tài)特征的。前者一般來(lái)說(shuō)只用于看到整個(gè)部件物體的內(nèi)部外觀和形狀邊界,而后者則直接把它關(guān)系著其應(yīng)用到整個(gè)部件物體外觀形狀上的各個(gè)區(qū)域。
2.4.2、一種基于形狀的圖像檢索算法
2.4.2.1、算法分析
基于這種形狀的圖像檢索更多地只是用于了解當(dāng)前的用戶能夠粗略地掃描畫出一個(gè)圖形輪廓之后進(jìn)行圖形檢索的實(shí)際情況。這種圖形輪廓繪圖可以認(rèn)為是通過(guò)用戶憑借自己腦子在空中的第一印象徒手自動(dòng)畫圖繪出來(lái)的,也甚至可以認(rèn)為是通過(guò)操作系統(tǒng)軟件提供的基本圖形繪圖處理工具“拼湊”的。這兩種檢索情況都不具有一個(gè)基本特點(diǎn),即它所提供的檢索形狀只是對(duì)所欲檢索圖象形狀的粗略抽象描述,它從它的大小、方向或者其整體形狀結(jié)構(gòu)上都很有可能與真正根據(jù)要求調(diào)查的檢索圖形形狀有較大小的出入。因此,基于面的形狀進(jìn)行檢索的主要難點(diǎn)仍然在于需要尋找一種能夠準(zhǔn)確檢索與面的大小、方向及整個(gè)扭曲面的伸縮程度無(wú)關(guān)的檢索方法。
不變矩和產(chǎn)品輪廓的應(yīng)力不變矩的方法產(chǎn)品具有良好的軸向平移、旋轉(zhuǎn)、尺度上的縮小和放不變性及高度抗干擾性。用一個(gè)圖像的形狀不變矩和圖像輪廓的應(yīng)力矩陣來(lái)作為矩對(duì)圖像的兩種形狀相似特征進(jìn)行索引,使用適當(dāng)?shù)男螤钕嗨菩灾g距離進(jìn)行定義,計(jì)算并得出兩幅畫中圖像的形狀相似性之間距離,當(dāng)這個(gè)距離的值足夠小時(shí),就可以認(rèn)為兩幅畫的圖像形狀是相似的。傅里葉這種算法不僅對(duì)圖像噪音控制具有很好的魯棒性,而且對(duì)幾何變換速度具有不變性,更加十分適合工圖像形狀分析檢索的實(shí)際需要。因此,提出了應(yīng)力不變矩和矩形輪廓的應(yīng)力不變矩的算法和傅里葉公式描述中的符號(hào)相結(jié)合的計(jì)算方法。
三、圖像檢索技術(shù)的發(fā)展過(guò)程
目前圖像檢索的技術(shù)最早開始于上個(gè)世紀(jì)70年代,當(dāng)時(shí)主要研究的是基于文本的檢索,即使采用關(guān)鍵詞和描述性的文本來(lái)對(duì)其進(jìn)行檢索,要求使用者對(duì)文本中各種特征的描述都必須具備一定的精度準(zhǔn)確性和規(guī)范性。但是隨著各種大規(guī)模的數(shù)字化圖像倉(cāng)庫(kù)的誕生,基于文本檢索的技術(shù)暴露了自身的優(yōu)勢(shì)。在我國(guó)逐步發(fā)展到90年代,基于圖像內(nèi)容的信息化圖像檢索技術(shù)應(yīng)運(yùn)而生,其設(shè)計(jì)思路主要是充分利用信息化圖像自身的各種視覺(jué)特點(diǎn),例如:將圖像中的顏色、紋理結(jié)構(gòu)、形狀、空間之間的關(guān)系等信息作為內(nèi)容來(lái)進(jìn)行匹配、查找。它通過(guò)充分地利用了己經(jīng)擁有的算法,使得所有的特征提取和匹配都完全能夠由機(jī)器自動(dòng)地完成,檢索的過(guò)程也沒(méi)必要太多的人為干涉和解釋,這就克服了傳統(tǒng)的手工標(biāo)簽注釋方式的低效率和二義性。
四、基于形狀特征的圖像檢索
因?yàn)樵S多的圖像檢索系統(tǒng)把注意力集中到了基于色彩或者是紋理學(xué)的方式上。但對(duì)于某些圖像形狀來(lái)說(shuō),紋理和顏色的信息不夠豐富,如一些商標(biāo)圖像等,這時(shí)基于紋理的檢索方法便無(wú)法完全滿足所有的檢索要求,而必須從整個(gè)圖像形狀入手。形狀特征信息是圖像的中心特征之一,圖像中的形態(tài)和信息不會(huì)隨著圖像中物體顏色的改變而發(fā)生任何變化,它是一種穩(wěn)定的特征。用各種形狀的特征來(lái)區(qū)別物體很加直觀,它們是現(xiàn)代社會(huì)中人們識(shí)別不同形態(tài)圖像的主要技術(shù)特征之一。因此,通過(guò)利用各種形狀特征來(lái)檢索圖像,可以大大提高檢索的精度和效果?;谀繕?biāo)的形狀特征的圖像檢索主要目的是通過(guò)檢測(cè)得到目標(biāo)輪廓線或分割得到目標(biāo)輪廓,并針對(duì)其所在位置進(jìn)行形狀特征的提取或直接針對(duì)圖像搜集尋找合適的向量特征。形態(tài)描述要求我們?cè)诒M量區(qū)別各個(gè)目標(biāo)之間的基礎(chǔ)上,對(duì)于目標(biāo)平移、轉(zhuǎn)動(dòng)及尺度的變化并不敏感。目前,雖然我們已經(jīng)研究提出了許多關(guān)于形狀的分析技術(shù),但是想要將它們有效運(yùn)用到圖像檢索中仍存在的問(wèn)題還有一些困難和疑惑亟待解決,如算法的工作效率和復(fù)雜程度,形狀特征的提取與描述等。
五、基于形狀特征的圖像檢索具體實(shí)行
5.1對(duì)象形狀的描述
圖象經(jīng)過(guò)邊緣的提取、分割后可以獲得諸個(gè)被分割的區(qū)域.對(duì)諸個(gè)被分割的區(qū)域所提取的形狀特征,是基于內(nèi)容的圖象檢索系統(tǒng)的重要組成部分,所提取的形狀特征對(duì)于圖象的旋轉(zhuǎn)、圖像的平移和對(duì)圖象縮放都是不敏感的.本文主要研究涉及以下幾種形狀的特征:
(1)基于傅立葉系數(shù)的形態(tài)和特點(diǎn).圓角度,細(xì)長(zhǎng)程,散射性.(2)基于幾何形狀的特征.區(qū)域的面積,區(qū)域的周長(zhǎng),體態(tài)比.(3)矩描述.共有七個(gè)矩常量.(4)以相似多邊形為基礎(chǔ)的結(jié)構(gòu)和特點(diǎn).(5)形狀直方圖.5.2、系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
系統(tǒng)主要可以分為三個(gè)組成部分:(1)圖象數(shù)據(jù)庫(kù)建立模塊.該建立模塊首先對(duì)用戶輸入的各種圖象信息進(jìn)行了預(yù)處理,其中包括各種圖象信號(hào)和噪聲的清除,圖象尖銳化,邊緣檢測(cè)(對(duì)象物的分離),邊緣細(xì)化,鏈碼追溯,對(duì)于邊界信息進(jìn)行了多邊形逼近,然后將其提取到對(duì)象的各種形狀信息,最后把用戶需要提取的信息特征值直接存入到圖象數(shù)據(jù)庫(kù)中;(2)圖像數(shù)據(jù)庫(kù)維護(hù)系統(tǒng)模塊.本次維護(hù)系統(tǒng)主要負(fù)責(zé)對(duì)圖像數(shù)據(jù)庫(kù)信息進(jìn)行維護(hù),主要內(nèi)容包括圖像瀏覽記錄的修改及歷史紀(jì)念信息的刪除;在對(duì)圖像記錄進(jìn)行修改時(shí),對(duì)那些由于計(jì)算機(jī)自動(dòng)提取得到的特征值我們都是不可以進(jìn)行修改的,而且我們只能通過(guò)修改這些由人為確定定義的字段,如:一個(gè)有關(guān)于圖象的文字說(shuō)明部分.(3)圖像檢索查詢模塊.該功能首先根據(jù)需要對(duì)被檢索的圖像進(jìn)行提取的形狀和特征,然后再根據(jù)需要選擇按哪些特征值對(duì)象來(lái)進(jìn)行檢索,設(shè)置好圖像的檢索所達(dá)到要求的類型和相似程度,最后與將圖像信息與數(shù)據(jù)庫(kù)中的其他圖像進(jìn)行匹配,輸出查詢結(jié)果.圖象的匹配查詢是整個(gè)圖像信息數(shù)據(jù)庫(kù)的主要功能和組成部分,匹配算法的好壞及其優(yōu)劣直接影響到匹配查詢的速度和信息庫(kù)查詢的質(zhì)量,其根本思路就是通過(guò)判斷一個(gè)經(jīng)典的已知圖象與一個(gè)圖像數(shù)據(jù)庫(kù)中的一個(gè)圖象之間的距離,如其距離有點(diǎn)足夠小,就說(shuō)明我們可以確定兩個(gè)已知圖象之間是相似的,其結(jié)果一般應(yīng)該是多個(gè)已知圖象,這些所有的圖象都與經(jīng)典查詢的圖像在一個(gè)給我們認(rèn)為有點(diǎn)相似.我們其實(shí)可以通過(guò)運(yùn)用各種相似性程量測(cè)度查詢函數(shù)過(guò)程方法工具來(lái)進(jìn)行分析和控制計(jì)算一個(gè)查詢特征圖象與一個(gè)特征圖像數(shù)據(jù)庫(kù)中每一個(gè)特征圖象的相似度和程度,相似性程度測(cè)量中的查詢函數(shù)過(guò)程主要來(lái)說(shuō)是研究建立在對(duì)數(shù)據(jù)特征分析和模式識(shí)別相關(guān)技術(shù)研究基礎(chǔ)上的,涉及所遇到的主要技術(shù)問(wèn)題之一就是對(duì)于一個(gè)數(shù)據(jù)輸入模式如何進(jìn)行特征描述和模式判別,查詢的基本過(guò)程就是根據(jù)一個(gè)新的給定數(shù)據(jù)模式對(duì)一個(gè)數(shù)據(jù)輸入中的模式特征進(jìn)行數(shù)據(jù)匹配.這個(gè)相似度一般來(lái)說(shuō)是通過(guò)0~1之間的某個(gè)個(gè)不同參數(shù)特征來(lái)進(jìn)行表現(xiàn)計(jì)算出來(lái)的,總的相似度也由各種不同特征所測(cè)量的相似度通過(guò)函數(shù)加權(quán)運(yùn)算求和得.傳統(tǒng)數(shù)據(jù)庫(kù)的準(zhǔn)確匹配和查詢技術(shù)是很簡(jiǎn)單地了解的,但對(duì)于圖象型的數(shù)據(jù)庫(kù)來(lái)說(shuō),查詢的質(zhì)量和查詢的快慢還是相互矛盾的,要求查詢率和準(zhǔn)確性好,就需要盡可能多地增加一些描述圖象的特征矢量的維數(shù),隨之而來(lái)就需要盡可能多地增加計(jì)算量,所以,要在不降低特征矢量的維數(shù)條件下,才能夠大幅度地提高查詢率,就必須通過(guò)調(diào)整和完善查詢的策略.主要采用以下兩種操作方法:
(1).聚類的基本原理:分類即把一個(gè)標(biāo)準(zhǔn)圖象按類劃分開來(lái)成以下幾類,每一類都被用戶定義成作為一個(gè)分類標(biāo)準(zhǔn)圖,則在用戶查詢一個(gè)標(biāo)準(zhǔn)圖象時(shí),首先根據(jù)要求計(jì)算出與各種分類標(biāo)準(zhǔn)圖之間的物理距離,確定它們之間是否隸屬于何一類,然后再與該一類的標(biāo)準(zhǔn)圖象之間進(jìn)行具有相似性的分類匹配.(2)過(guò)濾的原理:即通過(guò)降低維數(shù),在進(jìn)行圖象匹配之前,首先將一些形狀和特征相差甚遠(yuǎn)的圖像從一個(gè)被稱為圖象匹配團(tuán)隊(duì)中全部清除掉,然后再將查詢到的圖象和匹配團(tuán)隊(duì)中剩下的其他圖象進(jìn)行對(duì)比.5.3、算法步驟
(1)通過(guò)計(jì)算被檢索圖像的形狀和特征,并從數(shù)據(jù)庫(kù)中提取圖像形狀和特征進(jìn)行索引;
(2)對(duì)特征向量進(jìn)行歸一化;
(3)使用歐式距離法來(lái)計(jì)算歸一化后的圖像數(shù)據(jù)庫(kù)中各個(gè)圖像與顯示者的圖像之間的相似性和距離;
(4)按序輸出檢索結(jié)果。
5.4.邊緣檢測(cè)
其中邊緣化的特點(diǎn)通常是直接影響物體圖像最為主要的一個(gè)基本特點(diǎn)。邊緣則主要是在泛指周圍各個(gè)像素的顏色灰度并沒(méi)具有較大階躍性質(zhì)的變化或者在屋頂上的顏色沒(méi)有發(fā)生較大改變的那一個(gè)周圍像素。Poggio在文中這樣解釋說(shuō):“或許對(duì)應(yīng)著圖像中物體的邊界或許并沒(méi)有對(duì)應(yīng)著圖像中物體的邊界,但是邊緣具有十分令人滿意的性質(zhì)它能大大地減少所要處理的信息但是又保留了圖像中物體的形狀信息”。
邊緣圖像檢查理論是一種實(shí)現(xiàn)圖像識(shí)別的重要理論知識(shí)基礎(chǔ)和技術(shù)前提,直接意義地說(shuō)它決定了圖像識(shí)別檢查結(jié)果的客觀準(zhǔn)確性。由于人體邊緣圖像檢測(cè)尚不成熟,直接地嚴(yán)重影響了對(duì)圖像識(shí)別的實(shí)際研究應(yīng)用,一直以來(lái)都認(rèn)為是圖像識(shí)別相關(guān)技術(shù)應(yīng)用領(lǐng)域的重要研究發(fā)展熱點(diǎn)。經(jīng)過(guò)多年的研究探索和應(yīng)用實(shí)踐,邊緣式質(zhì)量檢測(cè)系統(tǒng)技術(shù)已經(jīng)逐漸發(fā)展?jié)B透至各個(gè)應(yīng)用領(lǐng)域。在應(yīng)用生物醫(yī)學(xué)上,邊緣提取檢測(cè)主要作為適用于人體腎臟血小球的邊緣提取,在應(yīng)用生物醫(yī)學(xué)工業(yè)和工程科學(xué)以及其他工程材料領(lǐng)域的邊緣檢測(cè),如聚酯纖維或者其他塑料制品。而且在加工噴涂、焊接和機(jī)械裝配時(shí)也被充分地吸收利用。在中國(guó)傳統(tǒng)的民族文化工藝美術(shù)上,用于對(duì)傳統(tǒng)紡織品和手工藝品的定制設(shè)計(jì),服飾的定制設(shè)計(jì)和手工制作,發(fā)型的定制設(shè)計(jì),文物收藏材料以及照片的編輯復(fù)制和收集整理,運(yùn)動(dòng)員的身體動(dòng)作狀態(tài)分析和體能評(píng)級(jí)等等??傊?邊緣厚度檢測(cè)已被廣泛應(yīng)用于各個(gè)領(lǐng)域。這仍然是我們必須不容忽視的一個(gè)研究發(fā)展熱點(diǎn)。
5.5、Canny邊緣檢測(cè)
5.5.1 Canny指標(biāo)
基于微分算子的邊緣提取方法存在的一個(gè)比較麻煩的問(wèn)題是如何讓我們選擇適當(dāng)?shù)拈撝?可以通過(guò)這種方法使邊緣從每一個(gè)細(xì)節(jié)中被提取出來(lái)。閾值的選擇方式不同,所需要提取得到的邊界信息也不相同。在兩個(gè)不同的閾值下,采用相同的微分算子均可以從圖像邊緣提取得出一個(gè)點(diǎn),但兩者之間有比較大的差異。這樣,在邊緣提取中也就存在了對(duì)提取良好與否的評(píng)估。
針對(duì)這一重要問(wèn)題,根據(jù)邊緣檢測(cè)的工作有效性和其定位的安全可靠性, Canny 通過(guò)研究最優(yōu)的邊緣檢測(cè)儀器所必須要求的特點(diǎn),給出了衡量邊緣檢測(cè)系統(tǒng)性能好壞的三個(gè)主要指標(biāo):
(1)良好的邊緣信噪聲對(duì)比,即將不是邊緣點(diǎn)錯(cuò)誤判定為其他邊緣點(diǎn)的錯(cuò)誤概率相對(duì)較高,將其他邊緣點(diǎn)錯(cuò)誤判定為其他邊緣點(diǎn)的錯(cuò)誤概率相對(duì)較低;
(2)良好的定位特性,即檢測(cè)出來(lái)的邊緣點(diǎn)應(yīng)該要盡量安裝在實(shí)際邊緣的點(diǎn)為中心;
(3)對(duì)于單個(gè)邊緣只能產(chǎn)生唯一的響應(yīng),即單個(gè)邊緣能夠同時(shí)產(chǎn)生許多個(gè)響應(yīng),其概率相對(duì)較低,并且在虛假的響應(yīng)中對(duì)邊界的反饋效果相應(yīng)得到最佳抑制.用這樣一個(gè)詞來(lái)說(shuō),就是我們希望能夠有效地提高人們對(duì)于景物邊緣的靈敏度和噪音的同時(shí),這種能夠有效地抑制其他人們產(chǎn)生噪音的方式才是良好的邊緣提取技術(shù)。值得我們十分慶幸的一點(diǎn)其實(shí)是,且個(gè)二階線性映射算子仍然能夠在有效抵抗圖形噪聲和對(duì)圖形邊緣的線性檢測(cè)之間獲得最佳結(jié)果折中,這個(gè)二階線性映射算子本身其實(shí)就是高斯函數(shù)的一個(gè)二階取值引用導(dǎo)出函數(shù)。高斯函數(shù)和用于原圖的卷積已經(jīng)初步達(dá)到了一種可以抵抗局部噪聲的主要效果,而用于求導(dǎo)的函數(shù),則被普遍認(rèn)為已經(jīng)是我們檢測(cè)一個(gè)景物局部邊緣的一種重要手段。
設(shè)二維高斯函數(shù)為
其中,σ為高斯函數(shù)的平滑度和分布式的參數(shù),可以被廣泛地基于用來(lái)衡量控制網(wǎng)絡(luò)對(duì)象或者網(wǎng)絡(luò)圖像平滑的重要程度。
其中,σ是高斯函數(shù)的分布參數(shù),可用以控制對(duì)圖像的平滑程度。
最優(yōu)階躍邊緣檢測(cè)算子是以卷積▽G*為基礎(chǔ)的,邊緣強(qiáng)度為
而邊緣方向?yàn)?/span>
由高斯函數(shù)的定義我們得以可知,該高斯函數(shù)都可以是無(wú)限地從頭拖尾的,在實(shí)踐中,一般的各種情況下都方法是將原來(lái)的有限模板尺寸截?cái)酁閚,至于就達(dá)到了有限的模板尺寸。這個(gè)新的實(shí)驗(yàn)結(jié)果證明,當(dāng)時(shí),能夠直接取得較好的邊緣化學(xué)檢查實(shí)驗(yàn)結(jié)果。
5.5.2 Canny算子的實(shí)現(xiàn)
下面是Canny算子的具體實(shí)現(xiàn)。
利用高斯函數(shù)的雙向可分性,將映射▽g的兩個(gè)一維濾波卷積上的模板可以分解成兩個(gè)一維的濾波行列式式濾波器:
1
2
3
4
5
6
K為常數(shù)將式12分別與圖像
則反應(yīng)出一個(gè)在圖像上點(diǎn)處的邊緣強(qiáng)度,是一個(gè)在圖像點(diǎn)處的法向力矢量(下一個(gè)交于其邊緣線方向)。
根據(jù)關(guān)于canny的卷積定義,中心邊緣點(diǎn)梯度作為一個(gè)卷積算子和它的圖像(x,y)的卷積梯度是在中心邊緣點(diǎn)和梯度相同直線方向的同一區(qū)域內(nèi)兩個(gè)算子梯度中的最高值。這樣,就可以能夠通過(guò)在各個(gè)梯度點(diǎn)的最大梯度值和方位上進(jìn)行判斷并得出每個(gè)該梯度點(diǎn)的最大強(qiáng)度方位是否為其應(yīng)用領(lǐng)域最大強(qiáng)度值,從而快速確定各個(gè)梯度點(diǎn)的邊緣點(diǎn)。例如,當(dāng)一個(gè)矩形像素圖象滿足以下三個(gè)基本條件時(shí),則被我們視作該點(diǎn)是一個(gè)像素圖像的邊界點(diǎn)。
(1)當(dāng)像素該中一點(diǎn)的平均邊緣運(yùn)動(dòng)強(qiáng)度方向超過(guò)了沿著像素該中一點(diǎn)的邊緣梯度方向運(yùn)動(dòng)的同方向兩個(gè)像素相鄰點(diǎn)的像素中一點(diǎn)的平均邊緣運(yùn)動(dòng)強(qiáng)度時(shí);
(2)與該點(diǎn)梯度方向上相鄰兩點(diǎn)的方向差小于45度;
(3)觀測(cè)領(lǐng)域核心中的最大邊緣變化強(qiáng)度最大邊緣閾度數(shù)值以所在該觀測(cè)點(diǎn)位置為領(lǐng)域中心。
此外,如果(1)和(2)同時(shí)被邊緣的頂點(diǎn)像素滿足,那么候選選擇梯度最小值相同方向上的兩個(gè)非相鄰頂點(diǎn)像素就從候選選擇邊緣的頂點(diǎn)中被直接取消,條件(3)閾值相當(dāng)于由候選邊緣區(qū)域選擇梯度最大的閾值所在點(diǎn)組成的一個(gè)閾值,即圖像與候選邊緣的頂點(diǎn)之間的平均距離可以進(jìn)行閾值匹配,這一消除過(guò)程就等于消除了許多虛假的邊緣點(diǎn)。
圖像邊緣檢測(cè)的基本步驟:
(1)對(duì)于濾波,邊緣的檢測(cè)主要是基于引導(dǎo)值進(jìn)行計(jì)算,但是容易受到噪聲影響。然而,該濾波器在減少噪聲時(shí)還會(huì)造成邊緣強(qiáng)度的損耗。
(2)進(jìn)行了增強(qiáng),加強(qiáng)算法把鄰域的點(diǎn)的度有明顯改變的地方突出表現(xiàn)。一般是靠計(jì)算梯度的幅值來(lái)實(shí)現(xiàn)。
(3)進(jìn)行檢測(cè),但是在有些影像中梯度幅值較大的點(diǎn)并非邊緣端。最簡(jiǎn)單的對(duì)邊緣性檢測(cè)就是梯度幅值閾值的判斷。
(4)定位,精確確定邊緣的位置。
綜上所述,Canny算子的具體算法步驟如下:
(1)使用高斯濾波器對(duì)圖像中的信號(hào)進(jìn)行濾波,去除圖像中的干擾和噪聲;
(2)分析利用高斯算子的一階方向偏移濾波函數(shù)采用微分的方法對(duì)物體圖像中各點(diǎn)方向進(jìn)行濾波,得到每一點(diǎn)的方向梯度和角強(qiáng)度和物體運(yùn)動(dòng)時(shí)的方向;
(3)針對(duì)梯度方向運(yùn)動(dòng)進(jìn)行“非極大抑制”時(shí)對(duì)其梯度的反向運(yùn)動(dòng)及其方向如圖可以正確定義為其如下如圖所示
x | ||
標(biāo)識(shí)分別為1,2,3,4的四個(gè)區(qū)域?qū)⑵鋵儆谒膫€(gè)局部分區(qū)之一,各個(gè)局部分區(qū)用不同的線將相鄰四個(gè)像素分別排列來(lái)對(duì)其局部進(jìn)行高度比較,以此來(lái)決定其每個(gè)局部的極大像素值。例如,如果我們?cè)谙噜徶行南袼貓D像獲得x的梯度方向上認(rèn)為屬于第4區(qū),則把獲得x的極大梯度方向值與其左上和右下兩個(gè)方向相鄰中心像素的極大梯度的數(shù)值大小進(jìn)行向量比較,看獲得x的極大梯度的數(shù)值大小是否可視為極大梯度值。如果不是,就把每個(gè)矩形像素y到x的顏色灰度系數(shù)設(shè)置為0。這一抑制過(guò)程被人們稱之為“非極大抑制”。
(4)對(duì)一個(gè)梯度進(jìn)行兩次閾值,即取一個(gè)閾值,兩者之間的關(guān)系公式為。我們將梯度值小于的每個(gè)像素灰度設(shè)置為0。然后將梯度值小于的每個(gè)像素灰度平均值設(shè)定為0。去除了大部分的噪聲,但同時(shí)也導(dǎo)致?lián)p失了有用的邊緣和界面結(jié)構(gòu)信息。
5.6基于輪廓的描述方法
基于局部輪廓圖對(duì)形狀進(jìn)行描述的設(shè)計(jì)方法又大致可以細(xì)分為局部連續(xù)型(注意即局部全局式)和局部離散型(即局部結(jié)構(gòu)式)兩種。連續(xù)型全局輪廓圖圖描述的方法并沒(méi)有對(duì)稱為全局圖的輪廓圖進(jìn)行任何分段式的處理,往往目的是從整個(gè)稱為全局圖的輪廓圖中抽取并給出一個(gè)特征向量。這種屬于離散式的分析方法通常首先把它的輪廓特點(diǎn)分解成許多不同片段,然后用傳統(tǒng)計(jì)算機(jī)輪廓提取法找出其片段相應(yīng)的輪廓特點(diǎn)。簡(jiǎn)單的物體形狀類型描述表示符主要類型包括鏈碼、傅立葉描述符、曲率尺度空間形狀描述表示符和小波描述表示符四種基于物體輪廓的形狀描述表示方式。
5.7傅立葉形狀描述符
傅立葉形狀輪廓描述符即它是一種被廣泛應(yīng)用的二維模型形狀輪廓描述符,其最基本的設(shè)計(jì)思想就是用一個(gè)直接位于模型物體內(nèi)部輪廓上沒(méi)有邊界的傅立葉變換函數(shù)來(lái)對(duì)其內(nèi)部形狀輪廓進(jìn)行精確描述,假設(shè)一個(gè)二維模型物體的內(nèi)部輪廓形狀是由一系列每個(gè)坐標(biāo)值函數(shù)為的物體像素所組合構(gòu)造的并組成,其中,n函數(shù)為在物體輪廓上每個(gè)坐標(biāo)像素的實(shí)際參考映射次數(shù)。從這些邊界點(diǎn)的整體坐標(biāo)中我們常??梢杂纱送茖?dǎo)出來(lái)得出四類不同形狀的坐標(biāo)表達(dá),分別為正弦曲率坐標(biāo)函數(shù)、質(zhì)心坐標(biāo)距離、復(fù)弦長(zhǎng)坐標(biāo)矢量函數(shù)及其余弦長(zhǎng)坐標(biāo)函數(shù)。輪廓弧曲線上一個(gè)特征點(diǎn)的移動(dòng)曲率被精確定義是因?yàn)樵擖c(diǎn)在輪廓線上切向的移動(dòng)角度與曲率相當(dāng)于輪廓弧長(zhǎng)之間的角度變動(dòng)率。曲率密度函數(shù)我們通??梢院?jiǎn)單地將其表示形式如下:
其中是輪廓線的切向角度,定義為:
質(zhì)心點(diǎn)的距離函數(shù)可以直接定義成其為從一個(gè)物體的邊界點(diǎn)到另一個(gè)給定物體的邊界中心之間距離,如下所示:
復(fù)坐標(biāo)函數(shù)是用復(fù)數(shù)表示的像素坐標(biāo):
這種復(fù)雜的坐標(biāo)向量函數(shù)的傅立葉變換形式可以用來(lái)產(chǎn)生一系列關(guān)于復(fù)數(shù)的坐標(biāo)系數(shù)。這些頻率系數(shù)從微觀頻率上直接反映表示了各個(gè)類型物體的宏觀形狀,其中較低和高頻度的物體分量值就代表了各個(gè)類型物體微觀形狀的具體性和宏觀細(xì)節(jié)屬性,高頻度的物體分量值則代表了各個(gè)類型物體宏觀形狀的具體微觀細(xì)節(jié)屬性特點(diǎn)。形狀圖的描述符參數(shù)可以通過(guò)這些圖形轉(zhuǎn)換器的參數(shù)計(jì)算得出。為了使其能夠更好保持與參數(shù)旋轉(zhuǎn)的速度無(wú)關(guān)性,我們簡(jiǎn)單地僅僅保留了每個(gè)參數(shù)的旋轉(zhuǎn)尺寸位置信息,而且同時(shí)省略了參數(shù)相位位置信息??s放參數(shù)無(wú)關(guān)性通常由于在保證把縮放參數(shù)值的大小同時(shí)減少添加到c和dc中的分量(或第一個(gè)不為零的縮放參數(shù))之后縮放才能得到確認(rèn)。請(qǐng)?zhí)貏e注意圖形轉(zhuǎn)換中的無(wú)關(guān)性就是基于物體輪廓上的形狀屬性來(lái)轉(zhuǎn)換表示固有的轉(zhuǎn)換屬性。對(duì)于具有曲率向量函數(shù)和質(zhì)心之間距離的曲率函數(shù),我們只不過(guò)需要分別考慮正交角頻率的兩個(gè)坐標(biāo)時(shí)間軸,因?yàn)檫@時(shí)兩個(gè)函數(shù)的傅立葉變換都必須是對(duì)稱的,即有?;邳c(diǎn)的曲率三角函數(shù)的一種形狀線性描述符號(hào)也可以使其表示形式為:
其中整數(shù)代表傅立葉變換每個(gè)參數(shù)的第一至i個(gè)整數(shù)分量。類似的,由質(zhì)心粒子間距所做的推測(cè)計(jì)算得到的粒子形態(tài)可以描述
符為:
對(duì)于一個(gè)復(fù)雜的坐標(biāo)密度函數(shù),正值的頻率密度分量和負(fù)值的頻率密度分量被同時(shí)廣泛使用。由于函數(shù)dc的地理參數(shù)定義是否與某些形態(tài)條件所在處或地點(diǎn)的地理位置密切相關(guān)而因此得以常被忽略。因此,第一個(gè)不是零的微波頻率參數(shù)分量被廣泛應(yīng)用于后來(lái)用于標(biāo)準(zhǔn)化其它的微波變換頻率參數(shù)。復(fù)函數(shù)坐標(biāo)系是函數(shù)所有的推導(dǎo)形式得到的坐標(biāo)形態(tài)為其描述符式為其定義方程為:
為了能夠保證在整個(gè)特征數(shù)據(jù)庫(kù)中所有位于物體的各種特征形狀和其他特征均可以具有相同的特征直徑和特征長(zhǎng)度,在第一開始進(jìn)行實(shí)施傅立葉變換前后你需要把所有位于物體邊界點(diǎn)的個(gè)別特征數(shù)目可以統(tǒng)一添加到m。因此算法可以被直接替換為傅立葉變換法的方式使用來(lái)大大幅度改善這個(gè)算法的執(zhí)行效率。
5.8圖像的相似性度量
在基于特征信息的圖像內(nèi)容檢索圖像信息檢索中,特征的信息相似性和特征度量也被廣泛認(rèn)為已經(jīng)是一個(gè)亟待解決的重大檢索技術(shù)研究課題之一。只有在根據(jù)分析結(jié)果得到特點(diǎn)圖像的兩個(gè)特點(diǎn)后后再進(jìn)行對(duì)該兩個(gè)特點(diǎn)的圖像相似性距離進(jìn)行準(zhǔn)確度量,才能有效的根據(jù)圖像相似性和圖像距離情況做出準(zhǔn)確判斷,實(shí)現(xiàn)對(duì)該特點(diǎn)圖像的準(zhǔn)確檢索。為了更好地準(zhǔn)確達(dá)到不同特征數(shù)據(jù)檢索的提取目標(biāo),需要針對(duì)特征提取后得出的不同特征數(shù)據(jù)進(jìn)行相似度的分析計(jì)算。相似性系數(shù)是以一個(gè)特殊數(shù)值的表示方式被用來(lái)顯示表達(dá)兩個(gè)不同物體之間的事物相似性相關(guān)程度的一種數(shù)學(xué)度量式的結(jié)果。將一個(gè)人類圖像的各種特征檢索觀察點(diǎn)可看作等同是圖像位于一個(gè)坐標(biāo)標(biāo)準(zhǔn)空間的一個(gè)特征點(diǎn),兩個(gè)圖像特征觀察點(diǎn)的相似度和特征距離即相似度通常用它們之間的特征距離系數(shù)來(lái)精確表示,不同特征種類的圖像特征檢索數(shù)據(jù)所指的需要同時(shí)采用的相似度及其度量計(jì)算函數(shù)都可能是不一樣的,相似性和度度量函公式的正確選擇的恰當(dāng)與否往往會(huì)對(duì)特征檢索結(jié)果精確度與否產(chǎn)生很大的直接影響,合適點(diǎn)的距離才是度量計(jì)算函數(shù)的正確選擇,將來(lái)也會(huì)幫助使得人類圖像的各個(gè)特征向量比較更加容易契合了解的人類對(duì)于各種視覺(jué)圖像感知技術(shù)方面圖像內(nèi)容的特征仿真,有助于基于人類視覺(jué)圖像感知技術(shù)方面的人類圖像特征檢索分析技術(shù)的仿真性能和實(shí)際應(yīng)用。
假設(shè)我們?cè)谝粋€(gè)圖像的數(shù)據(jù)庫(kù)中,用兩個(gè)特征向量分別來(lái)描述和表示任意一個(gè)圖像的特征,其中 x 和 y ,分別為是任意兩個(gè)圖像的特征向量,它們之間的接近程度我們可以通過(guò)采用距離的度量或者是統(tǒng)計(jì)學(xué)的方法等等來(lái)對(duì)這兩個(gè)圖像的相似性做出判斷。常見(jiàn)的距離測(cè)度度量主要有歐幾里德、Manhattan等。下面就我重點(diǎn)介紹一下歐幾里德的距離。
歐幾里德的線性距離函數(shù)是一種在實(shí)際上已經(jīng)使用十分廣泛的線性距離函數(shù)變量。它的變量計(jì)算簡(jiǎn)單,并且同時(shí)也和國(guó)際參考動(dòng)力系統(tǒng)理論中的徑向旋轉(zhuǎn)不確定變量計(jì)算有密切相互聯(lián)系。它的英文含義:
例如當(dāng)我們發(fā)生了數(shù)據(jù)的丟失或者是當(dāng)所有的特征矢量都不具備相同的權(quán)重時(shí),那么就無(wú)法利用歐幾里德距離計(jì)算方法來(lái)對(duì)其進(jìn)行類似性的測(cè)度。為了避免這類情況,在實(shí)踐和研究的過(guò)程中,我們可以針對(duì)歐幾里德的距離進(jìn)行歸一化。歸一化歐幾里德距離的定義公式如下圖所示:
6、實(shí)驗(yàn)結(jié)果分析
圖像庫(kù)中包括簡(jiǎn)單幾何形狀,其中星形、心形、圓形、新月形圖像10幅。從分析我們不僅可以清楚地明顯看出,算法對(duì)于檢索圖像的視覺(jué)扭轉(zhuǎn)和圖像形變都真的是十分具有非常強(qiáng)的不變性,并對(duì)于檢索圖像的基本主觀形態(tài)和視覺(jué)特性也是非常具有魯棒性,在就算沒(méi)有一定的圖像形變和扭轉(zhuǎn)干擾等等條件的特殊情況下,仍然完全可以直接得出良好的視覺(jué)圖像判斷檢索實(shí)驗(yàn)結(jié)果;且由于算法檢索圖像結(jié)果所需要排列的持續(xù)時(shí)間和排列順序與檢索個(gè)體的視覺(jué)主觀性和視覺(jué)特征判斷檢索方式大致相同,檢索結(jié)果準(zhǔn)確率也比較高。
六、以形狀為特點(diǎn)的圖像檢索系統(tǒng)設(shè)計(jì)
6.1檢索基本思想
本文文件檢索的基本工作方法主要內(nèi)容是:在根據(jù)設(shè)計(jì)需要建立矩形圖像庫(kù)時(shí),對(duì)不同輸入的兩個(gè)矩形圖像子存入進(jìn)行綜合分析,分別選擇采用經(jīng)過(guò)改進(jìn)后的不同可變矩和二維極坐標(biāo)傅里葉描述子對(duì)兩個(gè)圖像的不同形狀和狀態(tài)特征向量進(jìn)行綜合描述;在將兩個(gè)圖像子的存入轉(zhuǎn)換到二維矩形圖像庫(kù)同時(shí),也將其中兩個(gè)相應(yīng)的不同可變矩和二維極坐標(biāo)傅里葉描述子的形狀特征向量分別存入二維矩形圖像庫(kù)的特征庫(kù).檢索時(shí),根據(jù)所有用戶需要提供的圖像查詢數(shù)據(jù)示例檢索圖像,采用通過(guò)線性函數(shù)加權(quán)方法求和的一種計(jì)算結(jié)果方式,計(jì)算其與二維矩形圖像庫(kù)中各不同類型矩形圖像的各種綜合相似度,把計(jì)算結(jié)果對(duì)子集中的一個(gè)大于一定相似度的圖像結(jié)果集進(jìn)行返回發(fā)送給所有用戶.6.2 Canny算子的程序設(shè)計(jì)
本文是用C++編程來(lái)實(shí)現(xiàn)圖像的處理,整體流程圖如圖所示
未打開
N
Y
Canny算子程序流程圖如圖所示:
6.2.1圖像特征數(shù)據(jù)庫(kù)設(shè)計(jì)
基于圖像形狀和特征的檢索系統(tǒng)中的一個(gè)圖像特征數(shù)據(jù)庫(kù)是用來(lái)存放和分析圖像倉(cāng)庫(kù)中不同圖像之間的形狀和特點(diǎn)。在這里,將計(jì)算得到的一組圖像的形狀和特征(曲率、質(zhì)心距離、復(fù)坐標(biāo)和弦長(zhǎng))從 Access中存放到一個(gè)相應(yīng)的特征列表中,組成了一個(gè)特征數(shù)據(jù)庫(kù)。
對(duì)于圖像的檢索,本文特別設(shè)計(jì)了對(duì)圖像入庫(kù)、顯示、刪除和添加描述四個(gè)功能。首先,利用灰度共生矩陣提取的方法得到一個(gè)圖像的形狀特征,并將這些特征數(shù)據(jù)存儲(chǔ)在 access 數(shù)據(jù)庫(kù)中;然后,利用基于文本或者簡(jiǎn)單的縮略圖瀏覽等多種方式從 access 數(shù)據(jù)庫(kù)中尋找到一個(gè)示例的圖像,同時(shí),針對(duì)該一個(gè)示例圖像進(jìn)行基于其形狀和特征的內(nèi)容檢索和匹配,并根據(jù)需要給出檢索結(jié)果的圖像。
6.3實(shí)驗(yàn)結(jié)果
以下是原圖與處理后的圖片,其中圖3-4為原始圖片,圖3-5為Canny 算子處理后的圖片。
從上述處理過(guò)的數(shù)據(jù)和圖像中我們可以清楚地看出, canny 算子所處理的數(shù)據(jù)和圖像不但達(dá)到了準(zhǔn)確地提取邊緣信息的主要目的,提高了抵御干擾的能力外,還使得邊緣更為連續(xù)清晰。
七、基于圖像形狀學(xué)特點(diǎn)的檢索方法在系統(tǒng)中的實(shí)現(xiàn)
7.1系統(tǒng)框架
一般的圖像檢索子系統(tǒng)主要有兩個(gè)大部分共同組成:圖像產(chǎn)生子系統(tǒng)和數(shù)據(jù)庫(kù)檢索子系統(tǒng),如圖4-1所示。圖像產(chǎn)生的子系統(tǒng)主要是對(duì)于圖像輸入前進(jìn)行的預(yù)處理、圖像中內(nèi)容的特性提取以及把這些特性和部件描述的信息納入到數(shù)據(jù)庫(kù)中。圖像檢索子系統(tǒng)主要是完成對(duì)圖像的檢索,其中包含了瀏覽和查詢、圖像特點(diǎn)的相似性匹配以及圖形使用者接口等幾個(gè)部分。
在本文的兩個(gè)實(shí)驗(yàn)物理子系統(tǒng)中,圖像特征制作與截圖生成實(shí)驗(yàn)子系統(tǒng)將本文中所需要描述的流體物理學(xué)圖像特征及其應(yīng)用對(duì)象的局部輪廓特征進(jìn)行了綜合分析并并入庫(kù)。在這個(gè)圖像輪廓檢索工具子系統(tǒng)中,支持一個(gè)用戶通過(guò)瀏覽庫(kù)中現(xiàn)有的一個(gè)圖像庫(kù),手動(dòng)地繪制一個(gè)圖像庫(kù)的輪廓及然后選擇一個(gè)示例的視圖。
7.2編程環(huán)境
本次測(cè)試實(shí)驗(yàn)操作系統(tǒng)的主要程序開發(fā)工具平臺(tái)主要是Window XP,選擇使用Visual C++6.0和Access兩款軟件作為主要的程序開發(fā)工具,選擇Visual C++6.0和Access是因?yàn)樗鼈兌寄軌蚓哂忻嫦驅(qū)ο髴?yīng)用程序設(shè)計(jì)的基本整體化和性能設(shè)計(jì)特點(diǎn)以及所需要開發(fā)的所有應(yīng)用程序都能夠具有高度的效率地正常運(yùn)行。同時(shí)又是一種微軟技術(shù)性高度相互集成的企業(yè)軟件開發(fā)實(shí)用工具,它為企業(yè)用戶自己提供了一套功能強(qiáng)大的企業(yè)微軟軟件基礎(chǔ)類庫(kù)。且因我們已經(jīng)使用了Visual C++6.0來(lái)用于開發(fā)一個(gè)基于視頻內(nèi)容的數(shù)字視頻流和圖像信息檢索系統(tǒng)。由于芯片系統(tǒng)內(nèi)部采用了面向?qū)ο蟮膱D像設(shè)計(jì)工作方式,這樣也就使得芯片系統(tǒng)的許多圖像功能以及處理圖像模塊都完全可以直接整合應(yīng)用起來(lái)到其它的芯片圖像處理系統(tǒng)中,而且需要添加新的圖像算法也就不必再因?yàn)樾枰~外復(fù)雜地進(jìn)行修改許多的圖像源代碼,非常好地有助于整個(gè)芯片系統(tǒng)在圖像功能上的逐步完善和不斷擴(kuò)展。
7.3程序結(jié)果
首先打開一個(gè)圖像庫(kù)選擇一個(gè)圖像,然后對(duì)該圖像進(jìn)行特征提取。系統(tǒng)通過(guò)圖像檢索相似度的匹配,找到六個(gè)與其相似的圖像,輸出結(jié)果。找到六個(gè)與其相似的圖像,輸出結(jié)果。
八、總結(jié)
本文第一章對(duì)基于內(nèi)容的圖像檢索方式進(jìn)行了概述,進(jìn)而又著重介紹了基于形態(tài)的圖像檢索方式。并且廣泛地應(yīng)用了對(duì)圖像進(jìn)行邊緣檢查的技術(shù),對(duì)整個(gè)圖像進(jìn)行了檢索。它主要是運(yùn)用 canny 算子的方法。首先,是對(duì)邊緣的檢測(cè)主要以導(dǎo)數(shù)來(lái)計(jì)算,但是受到了噪聲影響。然而,該濾波器在減少了噪聲的作用下,也造成了邊緣強(qiáng)度的損耗。其次,增強(qiáng)算法把對(duì)鄰域的點(diǎn)的度有明顯改變的地方以及點(diǎn)凸顯性地展現(xiàn)了。一般可以靠計(jì)算機(jī)梯度的幅值來(lái)實(shí)現(xiàn)。再次,但是在有些圖象中,梯度幅值比較大的地方并非邊緣的節(jié)點(diǎn)。最簡(jiǎn)單的對(duì)邊緣性檢測(cè)就是梯度幅值閾值的判斷。最后,精確地選擇了邊緣處的位置。
我也希望在今后的將來(lái)有更多的人去探導(dǎo)、研究一個(gè)邊緣檢測(cè)算子,為使我們能夠看到更好的影片效果而努力,為了促進(jìn)全人類的生活和發(fā)展而努力。圖像是自古以來(lái)人類識(shí)別和交流信息的一個(gè)主要資料來(lái)源,因此,圖像處理的應(yīng)用領(lǐng)域已經(jīng)涵蓋到了人類日常生活、工作等諸多領(lǐng)域。隨著現(xiàn)代科學(xué)技術(shù)的發(fā)展和進(jìn)步,圖像的應(yīng)用領(lǐng)域也在不斷拓寬。所以對(duì)于邊緣性的檢測(cè)也是需要繼續(xù)進(jìn)步。我看到將來(lái),邊緣檢測(cè)技術(shù)已經(jīng)廣泛地應(yīng)用于人們?nèi)粘I畹母鱾€(gè)領(lǐng)域,在當(dāng)今世界人類的日常生活中,文化藝術(shù)、軍事技術(shù)、生物醫(yī)療技術(shù)、工業(yè)生產(chǎn)和信息工程技術(shù)、航天與空間技術(shù)等等重要的領(lǐng)域都占有著不可或缺的一部分。同全人類的生活走向風(fēng)流。
參考文獻(xiàn)
[1] 章毓晉.圖像處理和分析[M].北京:清華大學(xué)出版社,1999
[2] 章國(guó)寶.葉樺.陳維南.基于正交小波變換的多尺度邊緣提取[J].中國(guó)圖像圖形報(bào),1998(3)
[3] 陳武凡..彩色圖像邊緣檢測(cè)新算法?廣義模糊算子法[J].中國(guó)科學(xué)A輯,1995(2)
[4] 唐立軍.段立娟.高文.基于內(nèi)容的圖像檢索系統(tǒng)[J].計(jì)算機(jī)應(yīng)用研究,2001,18(7):41-45
[5] 馮所前.文檔內(nèi)容圖像檢索[D].北京大學(xué)信息科學(xué)技術(shù)學(xué)院智能科學(xué)系碩士學(xué)位論文,2005
[6] 謝毓湘.吳玲達(dá).欒悉道.基于內(nèi)容的圖像檢索技術(shù)研究[J].計(jì)算機(jī)工程與應(yīng)用,2002(1):35-38
[7] 宋濤.劉剛.一種基于內(nèi)容的文檔圖像檢索方法.《鄭州大學(xué)報(bào)》,2010年1月
[8] 郭小娟.基于內(nèi)容的圖像檢索技術(shù)的研究[D].西安:西北大學(xué),2007
[9] 徐建華.圖像處理與分析[M ].北京:科學(xué)出版社,1992
[10] 賈元元.基于形狀的圖像數(shù)據(jù)庫(kù)檢索技術(shù)研究[學(xué)位論文] 2004
[11] Ang Y H.Image Retrieval Based on Multidimensional Feature Properties 1995
[12] 賴志國(guó).余嘯海.Matlab 圖像處理與應(yīng)用[M].北京:國(guó)防工業(yè)出版社,2004
[13] 唐路路.張啟燦.一種自適應(yīng)閾值的Canny邊緣檢測(cè)算法/光電工程:第38卷第5期,2011.5