全球专业中文经管百科,由121,994位网友共同编写而成,共计436,057个条目

電腦視覺

用手机看条目

出自 MBA智库百科(https://wiki.mbalib.com/)

目錄

什麼是電腦視覺

  電腦視覺,也稱機器視覺。它是利用一個代替人眼的圖像感測器獲取物體的圖像,將圖像轉換成數字圖像,並利用電腦模擬人的判別準則去理解和識別圖像,達到分析圖像和作出結論的目的。該技術是模擬識別人工智慧、心理物理學、圖像處理、電腦科學及神經生物學等多領域的綜合學科。電腦視覺技術用攝像機模擬人眼,用電腦模擬大腦,用電腦程式和演算法來模擬人對事物的認識和思考,替代人類完成程式為其設定的工作。該技術由多個相關的圖像處理系統組成,主要包括光源提供系統、圖像提取系統、電腦數據運算系統等。原理是:首先通過攝像機獲得所需要的圖像信息,然後利用信號轉換將獲得的圖像信息轉變為數字圖像以便電腦正確識別。

電腦視覺的發展[1]

  電腦視覺起源於20世紀50年代的統計模式識別,開始的研究主要基於二維技術,用於二維圖像的識別與分析。6o年代,Roberts通過電腦程式從數字圖像中提取出諸如立方體、楔形體、棱柱體等多面體的三維結構,並對物體形狀及物體的空間關係進行描述。到了7O年代,已經出現了一些視覺應用系統。7O年代中期,麻省理工學院(MIT)人工智fi~(AI)實驗室正式開設“機器視覺”課程。80年代開始,電腦視覺技術得到了迅猛發展。Marr從心理物理學、神經生理學、臨床神經病學出發,對人的視覺理論進行了系統的研究,提出了第一個較為完善的視覺系統框架。之後,電腦視覺領域展開了基於感知特征群集進行三維目標識別的研究。目前,關於電腦視覺的研究主要集中於其應用,其應用前景相當的廣闊。

電腦視覺的關鍵技術[1]

  電腦視覺信息的處理技術主要依賴於圖像處理方法,經過處理後輸出圖像的質量得到相當程度的改善,既改善了圖像的視覺效果,又便於電腦對圖像進行分析、處理和識別。

  1.圖像分割

  圖像分割是將圖像分成若幹部分,每一部分對應於某一物體錶面,在進行分割時,每一部分的灰度或紋理符合某一種均勻測度度量。其本質是將像素進行分類,分類的依據是像素的灰度值、顏色、頻譜特性、空間特性或紋理特性等。圖像分割主要有兩種方法:一是鑒於度量空間的灰度閾值分割法,另一種是空間域區域增長分割方法。

  2.圖像增強

  圖像的增強用於調整圖像的對比度,突出圖像中的重要細節,改善視覺質量。通常採用灰度直方圖修改技術進行圖像增強。圖像的灰度直方圖是表示一幅圖像灰度分佈情況的統計特性圖表,與對比度緊密相連。

  3.圖像平滑

  圖像的平滑處理技術即圖像的去雜訊處理,主要是為了去除實際成像過程中因成像設備和環境所造成的圖像失真,提取有用信息,去除雜訊,恢複原始圖像是圖像處理中的一個重要內容。

  4.圖像編碼和傳輸

  數字圖像的數據量是相當龐大的,高通道速率意味著高投資,也意味著普及難度增加。因此,傳輸過程中,對圖像數據進行壓縮顯得非常重要。圖像數據的壓縮主要通過圖像數據的編碼和變換壓縮完成。

  5.邊緣銳化

  圖像邊緣銳化處理主要是加強圖像中的輪廓邊緣和細節,形成完整的物體邊界,達到將物體從圖像中分離出來或將表示同一物體錶面,它是早期視覺理論和演算法中的基本問題,也是中期和後期視覺成敗的重要因素之一。

  6.圖像識別

  圖像的識別過程實際上可以看作是一個標記過程,即利用識別演算法來辨別景物中已分割好的各個物體,給這些物體賦予特定的標記,它是機器視覺系統必須完成的一個任務。目前用於圖像識別的方法主要分為決策理論和結構方法。

電腦視覺的應用領域[1]

  電腦視覺的應用主要包括對照片、視頻資料如航空照片、衛星照片、視頻片段等的解釋、精確制導、移動機器人視覺導航、醫學輔助診斷、工業機器人的手眼系統、地圖繪製、物體三維形狀分析與識別及智能人機介面等。

  早期進行數字圖像處理的目的之一就是要通過採用數字技術提高照片的質量,輔助進行航空照片和衛星照片的讀取判別與分類。由於需要判讀的照片數量很多,於是希望有自動的視覺系統進行判讀解釋,在這樣的背景下產生了許多航空照片和衛星照片判讀系統與方法。自動判讀的進一步應用就是直接確定目標的性質,進行實時的自動分類,並與制導系統相結合。在導彈系統中常常將慣性制導與圖像制導結合,利用圖像進行精確的末制導。

  工業機器人的手眼系統是電腦視覺應用最為成功的領域之一。由於工業現場的諸多因素是可控的,使得問題大為簡化,有利於構成實際的系統。與工業機器人不同,對於移動機器人而言,由於它具有行為能力,於是就必須解決行為規劃問題,即對環境的瞭解。隨著移動式機器人的發展,越來越多地要求提供視覺能力,包括道路跟蹤、迴避障礙、特定目標識別等。目前移動機器人視覺系統研究仍處於實驗階段,大多採用遙控和遠視方法。

  在醫學上採用的圖像處理技術大致包括壓縮、存儲、傳輸和自動/輔助分類判讀。與電腦視覺相關的工作包括分類、判讀和快速三維結構的重建等方面。在地圖繪製上利用航測加上立體視覺中恢復三維形狀的方法繪製地圖,大大提高了地圖繪製的效率。同時,通用物體三維形狀分析與識別一直是電腦視覺的重要研究目標,併在景物的特征提取、表示、知識的存儲、檢索以及匹配識別等方面都取得了一定的進展,構成了一些用於三維景物分析的系統。

參考文獻

  1. 1.0 1.1 1.2 陳旭,呂小俊.淺談電腦視覺的發展及應用(J).科技信息.2013,16
本條目對我有幫助14
MBA智库APP

扫一扫,下载MBA智库APP

分享到:
  如果您認為本條目還有待完善,需要補充新內容或修改錯誤內容,請編輯條目投訴舉報

本条目由以下用户参与贡献

Mis铭,林晓辰.

評論(共0條)

提示:評論內容為網友針對條目"電腦視覺"展開的討論,與本站觀點立場無關。

發表評論請文明上網,理性發言並遵守有關規定。

打开APP

以上内容根据网友推荐自动排序生成

官方社群
下载APP

闽公网安备 35020302032707号