檢信智能Allemotion OS 讓你讀懂什么是圖像識(shí)別
圖像識(shí)別是指利用計(jì)算機(jī)對圖像進(jìn)行處理、分析和理解,以各種模式識(shí)別目標(biāo)和物體。它是深度學(xué)習(xí)算法的實(shí)際應(yīng)用?,F(xiàn)階段,圖像識(shí)別技術(shù)一般分為人臉識(shí)別和產(chǎn)品識(shí)別。人臉識(shí)別主要應(yīng)用于安檢、身份驗(yàn)證和移動(dòng)支付;產(chǎn)品圖像識(shí)別主要應(yīng)用于商品流通領(lǐng)域,尤其是無人貨架、智能零售柜等無人零售領(lǐng)域。
傳統(tǒng)的圖像識(shí)別過程分為四個(gè)步驟:圖像采集→圖像預(yù)處理→特征提取→圖像識(shí)別。另外,在地理學(xué)上,圖像識(shí)別是指對遙感圖像進(jìn)行分類的技術(shù)。
圖像識(shí)別可以基于圖像的主要特征。每個(gè)圖像都有它的特點(diǎn),比如字母A有一個(gè)尖點(diǎn),P有一個(gè)圓,Y的中心有一個(gè)銳角。對圖像識(shí)別過程中眼球運(yùn)動(dòng)的研究表明,視線總是集中在圖像的主要特征上。而且,眼睛的掃描路徑總是從一個(gè)特征到另一個(gè)特征??梢?,在圖像識(shí)別過程中,感知機(jī)制需要排除輸入的冗余信息,提取關(guān)鍵信息。同時(shí),大腦中有負(fù)責(zé)整合信息的機(jī)制,可以將分階段獲得的信息組織成完整的感知圖像。
在人體圖像識(shí)別系統(tǒng)中,復(fù)雜圖像的識(shí)別往往是通過不同層次的信息處理來實(shí)現(xiàn)的。對于一個(gè)熟悉的人物,因?yàn)槟阏莆樟怂闹饕卣?,你就?huì)把它認(rèn)作一個(gè)單元,不再關(guān)注它的細(xì)節(jié)。這種由孤立的單元材料組成的整體單元稱為塊,每個(gè)塊同時(shí)被感知。在書面材料的識(shí)別中,人們不僅可以將漢字的筆畫組合成一個(gè)塊,還可以將經(jīng)常一起出現(xiàn)的字符或單詞組合成塊單元進(jìn)行識(shí)別。
在計(jì)算機(jī)圖像識(shí)別系統(tǒng)中,圖像內(nèi)容通常由圖像特征來描述。事實(shí)上,基于計(jì)算機(jī)視覺的圖像檢索也可以分為類似于文本搜索引擎的三個(gè)步驟:提取特征、建立索引和查詢。