檢信智能 Allemotion OS 對語音識別的簡單介紹
語言作為人類交流的基本方式,在幾千年的歷史長河中不斷傳承。近年來,隨著語音識別技術(shù)的不斷成熟,它在我們的生活中得到了廣泛的應(yīng)用,成為通過自然語言進行人機交互的重要方式之一。語音識別技術(shù)如何讓機器“理解”人類語言?隨著計算機技術(shù)的快速發(fā)展,人們對機器的依賴已經(jīng)達到了一個非常高的水平。語音識別技術(shù)使人和機器通過自然語言進行交互成為可能。通過語音識別控制房間照明、空調(diào)溫度和電視相關(guān)操作是很常見的。
根據(jù)識別對象的不同,語音識別任務(wù)大致可以分為三類,即孤立詞識別、關(guān)鍵詞識別(或關(guān)鍵詞檢測)和連續(xù)語音識別。其中,孤立詞識別的任務(wù)是識別先前已知的孤立詞,如“開放”和“封閉”。連續(xù)語音識別的任務(wù)是識別任何連續(xù)的語音,如句子或段落。連續(xù)語音流中的關(guān)鍵詞檢測針對的是連續(xù)語音,但它并不識別所有的文本,只檢測一些已知關(guān)鍵詞出現(xiàn)的位置。
根據(jù)目標(biāo)說話人,語音識別技術(shù)可以分為特定人語音識別和非特定人語音識別。前者只能識別一個或幾個人的聲音,而后者可以被任何人使用。顯然,獨立于人的語音識別系統(tǒng)更符合實際需求,但比識別特定的人要困難得多。
此外,根據(jù)語音設(shè)備和渠道,可分為桌面(PC)語音識別、電話語音識別和嵌入式設(shè)備(手機、PDA等)語音識別。不同的采集通道會扭曲人類發(fā)音的聲學(xué)特征,因此我們需要構(gòu)建自己的識別系統(tǒng)。
語音識別應(yīng)用廣泛。常見的應(yīng)用系統(tǒng)包括:語音輸入系統(tǒng),比鍵盤輸入更符合人們的日常習(xí)慣,也更自然;語音控制系統(tǒng),即使用語音識別控制設(shè)備比手動控制更快更方便,可應(yīng)用于工業(yè)控制、語音撥號系統(tǒng)、智能家電、聲控智能玩具等諸多領(lǐng)域。