檢信智能 Allemotion OS 對圖像識別的簡單介紹
圖像識別是指利用計算機對圖像進行處理、分析和理解,以識別各種模式的目標(biāo)和物體。它是深度學(xué)習(xí)算法的實際應(yīng)用。現(xiàn)階段,圖像識別技術(shù)一般分為人臉識別和產(chǎn)品識別。人臉識別主要用于安檢、身份驗證和移動支付;產(chǎn)品圖像識別主要應(yīng)用于商品流通領(lǐng)域,尤其是無人貨架、智能零售柜等無人零售領(lǐng)域。
傳統(tǒng)的圖像識別過程分為四個步驟:圖像采集→圖像預(yù)處理→特征提取→圖像識別。另外,在地理學(xué)中,圖像識別是指對遙感圖像進行分類的技術(shù)。
圖像識別可以基于圖像的主要特征。每個圖像都有自己的特點。例如,字母A有一個尖點,P有一個圓,Y的中心有一個銳角。對圖像識別過程中眼球運動的研究表明,視線始終集中在圖像的主要特征上。此外,眼睛的掃描路徑總是從一個特征到另一個特征。可見,在圖像識別過程中,感知機制需要剔除冗余輸入信息,提取關(guān)鍵信息。同時,大腦中有一種負責(zé)信息整合的機制,可以將分階段獲得的信息組織成完整的知覺圖像。
在人體圖像識別系統(tǒng)中,復(fù)雜圖像的識別往往是通過不同層次的信息處理來實現(xiàn)的。對于一個熟悉的角色,因為你掌握了它的主要特征,你就會把它認作一個單元,不再關(guān)注它的細節(jié)。這種由孤立的單元材料組成的整體單元稱為塊,每個塊同時被感知。在文字材料的識別中,人們不僅可以將漢字的筆畫組合成一個塊,還可以將經(jīng)常一起出現(xiàn)的文字或單詞組合成塊單元進行識別。
在計算機圖像識別系統(tǒng)中,圖像內(nèi)容通常由圖像特征來描述。事實上,基于計算機視覺的圖像檢索也可以分為類似于文本搜索引擎的三個步驟:提取特征、建立索引和查詢。