圖像自動標註

圖像自動標註是由計算機系統自動通過圖片說明或關鍵詞的形式分配元數據給一張數字圖像的過程。這個計算機視覺技術的應用被用在圖像檢索系統來對數據庫組織和定位感興趣的圖像。

這種方法可以被看作是一種具有非常大量類別（有詞彙量那麼大）的多元分類的圖像分類問題。通常，提取特徵向量和訓練標註單詞的圖像分析使用機器學習技術來嘗試對新圖像自動標註標籤。剛開始的方法學習圖像的特徵和訓練標籤之間的相關性，之後技術發展為使用機器翻譯嘗試翻譯帶「視覺詞彙」的文本詞彙，或聚集區域blobs。遵循這些努力的工作包括分類方法、相關模型等。

與基於內容的圖像檢索相比，自動圖像標註的優點是，查詢可以由用戶更自然地指定[1]。基於內容的圖像檢索通常（目前）需要用戶去通過圖像的概念進行搜索，如顏色和紋理，或查找示例查詢。在示例圖像中的某些圖像特徵可能會覆蓋用戶真正關注的概念。圖像檢索的傳統方法，如被庫使用的，依賴於手動標註的圖像，而這是昂貴和費時的，尤其是給定大量不斷增長的圖像數據庫。

有些標註引擎是在線的，其中包括賓夕法尼亞州立大學研究人員開發的ALIPR.com實時標記引擎和Behold圖像搜索。

參見[編輯]

參考文獻[編輯]

Datta, Ritendra; Dhiraj Joshi; Jia Li; James Z. Wang. Image Retrieval: Ideas, Influences, and Trends of the New Age. ACM Computing Surveys. 2008, 40 (2): 1–60 [2016-02-15]. doi:10.1145/1348246.1348248. （原始內容存檔於2016-04-01）.
Nicolas Hervé; Nozha Boujemaa. Image annotation : which approach for realistic databases ? (PDF). ACM International Conference on Image and Video Retrieval. 2007 [2016-02-15]. （原始內容 (PDF)存檔於2011-05-20）.
M Inoue. On the need for annotation-based image retrieval (PDF). Workshop on Information Retrieval in Context: 44–46. 2004 [2016-02-15]. （原始內容 (PDF)存檔於2014-08-08）.

外部連結[編輯]

ALIPR.com - 賓夕法尼亞州立大學研究人員開發的實時自動標記引擎。
Behold Image Search（頁面存檔備份，存於互聯網檔案館） - 一個使用自動生成的標記的引用超過100萬張Flickr圖像的圖像搜尋引擎。
SpiritTagger Global Photograph Annotation - 來自加利福尼亞大學聖塔芭芭拉分校的140萬張圖像標註系統，預測照片在哪裏拍攝和建議標籤。
Akiwi - Semi automatic image tagging（頁面存檔備份，存於互聯網檔案館） - 帶用戶交互的圖像標註