圖像識別 (信息技術)
出自 MBA智库百科(https://wiki.mbalib.com/)
圖像識別(Image Recognition)
目錄 |
圖像識別是指利用電腦對圖像進行處理、分析和理解,以識別各種不同模式的目標和對像的技術。
圖像識別的基本過程[1]
信息的獲取:是通過感測器,將光或聲音等信息轉化為電信息。信息可以是二維的圖象如文字,圖象等;可以是一維的波形如聲波,心電圖,腦電圖;也可以是物理量與邏輯值。
預處理:包括A\D,二值化,圖象的平滑,變換,增強,恢復,濾波等,主要指圖象處理。
特征抽取和選擇:在模式識別中,需要進行特征的抽取和選擇,例如,一幅64x64的圖象可以得到4096個數據,這種在測量空間的原始數據通過變換獲得在特征空間最能反映分類本質的特征。這就是特征提取和選擇的過程。
分類器設計:分類器設計的主要功能是通過訓練確定判決規則,使按此類判決規則分類時,錯誤率最低。
分類決策:在特征空間中對被識別對象進行分類。
圖像識別的發展經歷了三個階段:文字識別、數字圖像處理與識別、物體識別。文字識別的研究是從 1950年開始的,一般是識別字母、數字和符號,從印刷文字識別到手寫文字識別, 應用非常廣泛。
數字圖像處理和識別的研究開始於1965年。數字圖像與模擬圖像相比具有存儲,傳輸方便可壓縮、傳輸過程中不易失真、處理方便等巨大優勢,這些都為圖像識別技術的發展提供了強大的動力。物體的識別主要指的是對三維世界的客體及環境的感知和認識,屬於高級的電腦視覺範疇。它是以數字圖像處理與識別為基礎的結合人工智慧、系統學等學科的研究方向,其研究成果被廣泛應用在各種工業及探測機器人上。現代圖像識別技術的一個不足就是自適應性能差,一旦目標圖像被較強的雜訊污染或是目標圖像有較大殘缺往往就得不出理想的結果。
圖像識別問題的數學本質屬於模式空間到類別空間的映射問題。目前,在圖像識別的發展中,主要有三種識別方法:統計模式識別、結構模式識別、模糊模式識別。圖像分割是圖像處理中的一項關鍵技術,自20世紀70年代,其研究已經有幾十年的歷史,一直都受到人們的高度重視,至今藉助於各種理論提出了數以千計的分割演算法,而且這方面的研究仍然在積極地進行著。
現有的圖像分割的方法有許多種,有閾值分割方法,邊緣檢測方法,區域提取方法,結合特定理論工具的分割方法等。從圖像的類型來分有:灰度圖像分割、彩色圖像分割和紋理圖像分割等。早在1965年就有人提出了檢測邊緣運算元,使得邊緣檢測產生了不少經典演算法。但在近二十年間,隨著基於直方圖和小波變換的圖像分割方法的研究計算技術、VLSI技術的迅速發展,有關圖像處理方面的研究取得了很大的進展。圖像分割方法結合了一些特定理論、 方法和工具,如基於數學形態學的圖像分割、基於小波變換的分割、基於遺傳演算法的分割等。
圖像識別是人工智慧的一個重要領域。為了編製模擬人類圖像識別活動的電腦程式,人們提出了不同的圖像識別模型。例如模板匹配模型。這種模型認為,識別某個圖像,必須在過去的經驗中有這個圖像的記憶模式,又叫模板。當前的刺激如果能與大腦中的模板相匹配,這個圖像也就被識別了。例如有一個字母A,如果在腦中有個A模板,字母A的大小、方位、形狀都與這個A模板完全一致,字母A就被識別了。這個模型簡單明瞭,也容易得到實際應用。但這種模型強調圖像必須與腦中的模板完全符合才能加以識別,而事實上人不僅能識別與腦中的模板完全一致的圖像,也能識別與模板不完全一致的圖像。例如,人們不僅能識別某一個具體的字母A,也能識別印刷體的、手寫體的、方向不正、大小不同的各種字母A。同時,人能識別的圖像是大量的,如果所識別的每一個圖像在腦中都有一個相應的模板,也是不可能的。
為瞭解決模板匹配模型存在的問題,格式塔心理學家又提出了一個原型匹配模型。這種模型認為,在長時記憶中存儲的並不是所要識別的無數個模板,而是圖像的某些“相似性”。從圖像中抽象出來的“相似性”就可作為原型,拿它來檢驗所要識別的圖像。如果能找到一個相似的原型,這個圖像也就被識別了。這種模型從神經上和記憶探尋的過程上來看,都比模板匹配模型更適宜,而且還能說明對一些不規則的,但某些方面與原型相似的圖像的識別。但是,這種模型沒有說明人是怎樣對相似的刺激進行辨別和加工的,它也難以在電腦程式中得到實現。因此又有人提出了一個更複雜的模型,即“泛魔”識別模型。
一般工業使用中,採用工業相機拍攝圖片,然後利用軟體根據圖片灰階差做處理後識別出有用信息,圖像識別軟體國外代表的有康耐視等,國內代表的有圖智能等。
- ↑ 楊淑瑩.圖像模式識別[M].清華出版社.2005.7