圖像自動標註

維基百科,自由的百科全書

圖像自動標註是由計算機系統自動通過圖片說明關鍵詞的形式分配元數據給一張數字圖像的過程。這個計算機視覺技術的應用被用在圖像檢索系統來對數據庫組織和定位感興趣的圖像。

這種方法可以被看作是一種具有非常大量類別(有詞彙量那麼大)的多元分類的圖像分類問題。通常,提取特徵向量和訓練標註單詞的圖像分析使用機器學習技術來嘗試對新圖像自動標註標籤。剛開始的方法學習圖像的特徵和訓練標籤之間的相關性,之後技術發展為使用機器翻譯嘗試翻譯帶「視覺詞彙」的文本詞彙,或聚集區域blobs。遵循這些努力的工作包括分類方法、相關模型等。

基於內容的圖像檢索相比,自動圖像標註的優點是,查詢可以由用戶更自然地指定[1]。基於內容的圖像檢索通常(目前)需要用戶去通過圖像的概念進行搜索,如顏色和紋理,或查找示例查詢。在示例圖像中的某些圖像特徵可能會覆蓋用戶真正關注的概念。圖像檢索的傳統方法,如被庫使用的,依賴於手動標註的圖像,而這是昂貴和費時的,尤其是給定大量不斷增長的圖像數據庫。

有些標註引擎是在線的,其中包括賓夕法尼亞州立大學研究人員開發的ALIPR.com實時標記引擎和Behold圖像搜索。

參見[編輯]

參考文獻[編輯]

外部連結[編輯]