圖像搜索引擎
出自 MBA智库百科(https://wiki.mbalib.com/)
圖像搜索引擎(Image Search Engine)
目錄 |
圖像搜索引擎是一種專門用來查詢圖形、圖像(照片)並以縮略圖、網站名或網站內容等形式反饋檢索結果的網卜檢索工具。同文字搜索引攀類似一般可提供分類目錄式或基於關鍵詞的檢索功能,基於內容的圖像搜索技術正在不斷研究應用之中。
圖像搜索引擎的工作原理主要是利用其內部SPIDE(蜘蛛)程式自動對網站進行搜索並對在Web瀏覽過的圖像進行分析和判別,為圖像加註釋、存儲抽取出的索引信息,建立圖像索引庫,從索引庫中或者直接從大量存儲圖像的資料庫中杏找檢索出具有相似特征的圖像來。[1]
圖像搜索引擎的技術[1]
互聯網上的圖像檢索技術經歷兩個階段:基於文本方式的圖像檢索、基於圖像內容的圖像檢索。
1.基於文本方式的圖像檢索
圖像信息本身的特點使其在檢索上有別於文本信息。參照傳統文獻標引的方法,通過對圖像進行人工分折,對其物理特征和內容特征進行著錄或標引、建立類似於文本文獻的標引著錄資料庫,並通過檢索這些資料庫以獲得圖像編號索取實際圖像。檢索系統標引的圖像特征包括責任者、出版日期、描述圖像所含的關鍵詞、主題詞、解說文字或圖像物理特征(拍攝方式、長度、載體規格等)。
基於文本方式的圖像檢索的四種途徑:
1)利用文件擴展名和超文本標識符。圖像文件通常以gif,.Jpg等作為擴展名,影像文件以.Mpg,.mpeg,.moov,.vhs,.avi等作為擴展名,在支持URI欄位檢索的檢索工具中可輸入相應的擴展名檢得圖像信息。超文本文件的圖像標識符(IMGSRC)也可作為檢索圖像的信息。
2)利用圖像標題和文字說明。圖像帶有的標題和文字說明信息作為揭示圖像的重要內容是檢索圖像的關鍵信息源。
3)利用網頁標題。每個萬維網頁都有一個標題,如標題能準確反映網頁內容,而網頁的內容又是圖像信息,可以通過網頁標題進行查詢(如北京故宮三維If體環視照片)。
4)人工標引。通過人工對圖像信息進行關鍵詞標引檢索效果最好,但由於數據量大、費用高,難以採用,目前在網上只能檢索到極少量經過少、工標引的圖像信息。
2.基於圖像內容特征的圖像檢索
基於內容的圖像檢索主要依據圖像的畫面內容特征和主題對象特征(即圖像的實際內容)來標引和檢索。檢索時可依據用戶輸入圖像的某一特征(如繪製的草圖、輪廓圖或調用的相似圖像)輸出最佳匹配結果。檢索系統組織圖像數據時,根據圖像內容的類別進行內容特征分析,建立基於內容特征的標引信息(例如圖像色彩矢量)索引庫,在索引庫中將索引信息與實際圖像數據聯繫起來。當用戶進行檢索時,用戶在系統輔助下通過規定色彩比例、選擇描繪對象形狀、選擇描繪紋理結構、選擇範例圖等形式構成自己的圖像內容檢索系統以同樣的方法將用戶輸入的圖像內容進行特征分析,建立檢索特征索引,通過對圖像內容特征的提問信息與被檢信息之間的相似性計算,將與檢索特征相似的圖像檢索出來。
可用於網路檢索的圖像信息內容特征包括:
1)靜態圖像內容特征。這類特征包括顏色、形狀、紋理、結構等。利用顏色,用戶可通過規定不同色彩之間的比例,主體與背景顏色等來查檢顏色不同的圖像。用戶還可把事先規定併在屏幕上顯示的形狀(如一朵花、一匹馬)作為檢索依據,也可自己描繪所要檢索圖形的形狀。根據紋理和結構等內容特征的圖像檢索方法與顏色檢索類似。
2)動態圖像內容特征。動態圖像實質上是靜態圖像、影像和聲音信息的混合體,聲音信息的內容持徵包括音頻、響度、頻寬、音色和節奏等,而影像信息內容特征則包括圖內對象的運動特征(如一輛紅色的馬車從左到右駛過)、視場運動特征(鏡頭的變換)等。
幾種典型圖像搜索引擎的介紹[2]
1.通用類搜索引擎
①Google:其網址http://images.gogle.corn/o這是較全面、較好用的圖像搜索工具。目前,它擁有經過標引的圖像3.3億幅。其工作過程是:Google分析web網頁中與圖像相近的文本內容,圖像標題和用來確定圖像內容的其他多種因素,並使用複雜的演算法消除重覆的圖像以確保高質量的圖像首先出現在搜索結果中。Google的搜索結果具有一個直觀的縮略圖,可挑選感興趣的並點擊之。②Ditto:其網址是http://www.ditto.com/:這是一個純粹的圖像搜索引擎。它的圖像庫與日俱增。利用Ditto檢索圖像很簡單,首先在檢索框中輸入檢索詞,然後選擇瀏覽偏好決定如何顯示檢索結果,最後遞交。瀏覽偏好有簡結式和詳細式之分。
2.目錄搜索引擎
①雅虎圖像館(yaho picture Gallarr)目前有40餘萬幅圖像,這些圖像按動物、藝術、文化娛樂、自然、科技、體育和旅游等進行分類組織,供人們瀏覽、挑選。另外,用戶可以在檢索框輸入關鍵詞進行圖像檢索。結果也是從縮略圖顯示。⑦Corbis:其網址是http:,,www.Corbis.com/corbis可搜索100多萬內容,覆蓋各種主題的圖像和藝術作品。它提供多種目錄幫助用戶檢索所需的圖像信息。用戶可點擊略圖獲得較大圖像及其名稱,和版權信息。
3.元搜索引擎
(1)1stopstock:其網址是www.1stopstock.corn/該引擎提供了八家圖像供應商供用戶訪問。用戶檢索時有三種模式:①一選一;②所有免費作用;③所有版權保護。採用第一種模式,每次只搜索一個供應商的圖像資料庫。採用第二、三種模式可同時進行“多庫”搜索,每個被搜索的庫分別開一個視窗顯示搜索結果。具體過程是,首先在文本檢索框中輸入檢索詞,然後選定搜索模式。最後遞交。(2)ixquick:其網址ixquick.coral它是同時並行搜索許多傑出的搜索引擎,如:Ahavista、Fastsearch和yahoo等。這類引擎支持自然語言檢索,支持通配符和高級布爾檢索。其結果有些帶有文件名、尺寸大小、維素等。
圖像技術的成熟和人們對圖像信息需求的增強,使互聯網上的圖像引擎站點越來越多,如國內的中文數位圖像搜索,用戶可直接鍵入簡體中文或通過目錄便可瀏覽到2500個分類子目錄和120萬幅中文圖片索引。