檢信智能ALLEMOTION OS推薦免費下載的語音情感數(shù)據(jù)庫
檢信智能ALLEMOTION OS推薦免費下載的語音情感數(shù)據(jù)庫
計算機對從傳感器采集來的信號進行分析和處理,得出對方正處在的情感狀態(tài),這種行為叫作情感識別。
目前對于情感識別有兩種方式,一種是檢測生理信號如呼吸,心律和體溫等,另一種是檢測情感行為如面部表情識別,語音情感識別和姿態(tài)識別。
語音情感數(shù)據(jù)集是研究語音情感識別的重要基礎,按照情感描述類型可將數(shù)據(jù)集分為離散情感數(shù)據(jù)庫和維度情感數(shù)據(jù)庫,前者以離散的語言標簽(如高興,悲傷等)作為情感標注,后者以連續(xù)的實數(shù)坐標值表示情感。
下面介紹一些離散語音情感數(shù)據(jù)集:
Belfast英語情感數(shù)據(jù)庫:40位錄音者(20男20女,18-69歲),對五個段落(每個段落7-8個句子)進行演講錄制,演講者按照五種情感傾向進行演講:生氣(anger),悲傷(sadness),高興(happiniess),害怕(fear),中性(neutral)。
柏林Emo-DB情感數(shù)據(jù)庫:德國柏林工業(yè)大學錄制,10位演員(5男5女),對10個德語語音進行表演,包含了七種情感:生氣(anger),悲傷(sadness),高興(happiniess),害怕(fear),中性(neutral),厭惡(disgust),無聊(boredom)。共包含800句語料(10 位演員 x10 句話 x7 種情感+100 條某些語句的二次版本),后經(jīng)過篩選得到500多條,采樣率為 48kHz (后壓縮至 16kHz),16bit 量化。語料文本的選取遵從語義中性、無情感傾向的原則,且為日??谡Z化風格,無過多的書面語修飾。語音的錄制在專業(yè)錄音室中完成,要求演員在表演某個特定情感片段前通過回憶自身真實經(jīng)歷或體驗進行情緒的醞釀,來增強情緒的真實感。
FAU AIBO兒童德語情感數(shù)據(jù)庫:2009年在Interspeech會議上舉辦Emotion Challenge評比中指定的語音情感數(shù)據(jù)庫。通過兒童與索尼公司的AIBO機器狗進行自然交互,從而進行情感數(shù)據(jù)的采集。說話人由51名兒童組成,年齡段為10-13歲,其中30個為女性。語料庫包含9.2小時的語音,48401個單詞。采樣頻率為48kHz(后壓縮至 16kHz),16比特量化。該數(shù)據(jù)庫中情感數(shù)據(jù)的自然度高,數(shù)據(jù)量足夠大,是較為流行的一個語音情感數(shù)據(jù)庫。
CASIA漢語情感數(shù)據(jù)庫:中科院自動化所錄制,兩男兩女錄制500句不同的文本,通過演講者不同的感情演講得出,最后的語音又人工篩選,得到了大約9600條語句。分為六類情感。
ACCorpus系列漢語情感數(shù)據(jù)庫:清華大學和中科院心理研究所合作錄制,相對于CASIA錄制工作者更多,代表性更強。包含如下 5 個相關子庫:ACCorpus_MM 多模態(tài)、多通道的情感數(shù)據(jù)庫;ACCorpus_SR 情感語音識別數(shù)據(jù)庫;ACCorpus_SA 漢語普通話情感分析數(shù)據(jù)庫;ACCorpus_FV 人臉表情視頻數(shù)據(jù)庫;ACCorpus_FI 人臉表情圖像數(shù)據(jù)庫。以 ACCorpus_SR 為例,該子庫是由 50 位錄音人(25 男25女)對 5類情感(中性、高興、生氣、恐懼和悲傷)各自表演得到,16kHz 采樣,16bit 量化。
IEMOCAP: 南加利福尼亞大學錄制的,10個演員,1男1女演繹一個session,共5個session。錄制了將近12小時的數(shù)據(jù),有視頻,語音,人臉的變動捕捉和文本。包括即興自發(fā)的和照著稿子念的。每個utterance至少三個人評估。包括9種情感(anger,happiness,excitement,sadness,frustration,fear,surprise,other和neural)的離散標簽,以及三個維度的維度標簽(valence, activation and dominance)。
————————————————
版權(quán)聲明:本文為CSDN博主「醒了的追夢人」的原創(chuàng)文章,遵循CC 4.0 BY-SA版權(quán)協(xié)議,轉(zhuǎn)載請附上原文出處鏈接及本聲明。
原文鏈接:https://blog.csdn.net/qq_33472146/article/details/96433766