玩护士睡老师勾搭女下属_欧美变态另类牲交ZOZO_亚洲国产欧美另类久久综合_午夜福利无码a级_亚洲综合一二三_天天干免费视频播放_先锋美女情趣网站在线观看_免费一级毛片全部免费播放瓯_天堂精品mv在线观看99_影音先锋影AV色资源站

檢信智能ALLEMOTION OS 語義文本情感識別原理
日期:2021.09.20   來源:湖南檢信智能
檢信ALLEMOTION

檢信智能ALLEMOTION OS 語義文本情感識別原理

首先,當(dāng)然是文本預(yù)處理

輸入文本,在將輸入文本轉(zhuǎn)化成向量之前,我們需要將標點符號、括號、問號等刪去,只留下字母、數(shù)字和字符, 同時將大寫字母轉(zhuǎn)化為小寫,去除停用詞。

效果如下圖

 image.png

 

然后就是將文本轉(zhuǎn)化為詞向量(即漢字要轉(zhuǎn)化為計算機能識別的數(shù)字類(矩陣啥的))

在將深度學(xué)習(xí)運用于文本情感分析的過程中,我們需要考慮網(wǎng)絡(luò)模型的輸入數(shù)據(jù)的形式。在其他例子中,卷積神經(jīng)網(wǎng)絡(luò)(CNN)使用像素值作為輸入,logistic回歸使用一些可以量化的特征值作為輸入,強化學(xué)習(xí)模型使用獎勵信號來進行更新。通常的輸入數(shù)據(jù)是需要被標記的標量值。當(dāng)我們處理文本任務(wù)時,可能會想到利用這樣的數(shù)據(jù)管道。

 image.png

但是,這樣的處理方式存在著很多問題。我們不能像點積或者反向傳播那樣在一個字符串上執(zhí)行普通的運算操作。所以在這里我們不能將字符串作為輸入,而是需要將文本轉(zhuǎn)換成計算機可識別的格式,由于計算機只能識別數(shù)字,因此我們可以將文本中的每一個詞都轉(zhuǎn)化為一個向量,也稱作詞向量。詞向量是用一個向量的形式表示文本中的一個詞,通過這種轉(zhuǎn)化方式就能采用機器學(xué)習(xí)來把任何輸入量化成我們需要的數(shù)值表示,然后就可以充分利用計算機的計算能力,計算得出最終想要的結(jié)果,保證了操作的可行性。

 image.png

 

如圖所示,我們可以將上面的這段文本輸入數(shù)據(jù)轉(zhuǎn)化成一個 16*D 的輸入矩陣。

 image.png

我們希望創(chuàng)建這種詞向量的方式是可以表示單詞及其在上下文中意義的。例如,我們希望單詞 love” 和 “adore” 這兩個詞在向量空間中是有一定的相關(guān)性的,因為他們的意思相似,而且都在類似的上下文中使用,因此他們的空間相距距離會相對較小。而“love”、“adore”這兩個單詞與單詞“baseball”的意思有很大的不同,詞性也不相同,那么“love”、“adore”這兩個單詞的向量與單詞“baseball”的向量相距距離就會相對較大。單詞的向量表示也被稱之為詞嵌入。

 image.png

 

特征提?。?/span>

 

為了得到這些詞嵌入,我們采用一個很著名的模型 Word2Vec”?!?/span>Word2Vec”是近幾年很火的算法,它通過神經(jīng)網(wǎng)絡(luò)機器學(xué)習(xí)算法來訓(xùn)練N-gram 語言模型,并在訓(xùn)練過程中求出word所對應(yīng)的vector的方法。它是將詞表征為實數(shù)值向量的一種高效的算法模型,其利用深度學(xué)習(xí)的思想,可以通過訓(xùn)練,把對文本內(nèi)容的處理簡化為 K 維向量空間中的向量運算,而向量空間上的相似度可以用來表示文本語義上的相似。在這個模型中,每個詞的詞向量是根據(jù)上下文的語境來進行推斷的,如果兩個詞在上下文的語境中可以被互換,那么這就表示這兩個詞的意思相似,詞性相似,那么他們的詞向量中相距距離就非常近。在自然語言中,上下文的語境對分析詞語的意義是非常重要的。

 

簡單來說,Word2Vec這個模型的作用就是從一大堆句子(以 Wikipedia 為例)中為每個獨一無二的單詞進行建模,并且輸出一個唯一的向量,Word2Vec 模型的輸出被稱為一個嵌入矩陣。該嵌入矩陣將包含訓(xùn)練語料庫中每個不同單詞的向量。 傳統(tǒng)上,嵌入矩陣可以包含超過300萬個單詞向量。

 

Word2Vec模型是通過對數(shù)據(jù)集中的每個句子進行訓(xùn)練,在其上滑動一個固定大小的窗口,并試圖預(yù)測窗口的中心詞,給出其他詞。使用損失函數(shù)和優(yōu)化程序,該模型為每個唯一字生成向量。這個訓(xùn)練過程的細節(jié)可能會變得有點復(fù)雜,所以我們現(xiàn)在要跳過細節(jié),但這里主要的一點是,任何深度學(xué)習(xí)方法對于NLP任務(wù)的輸入可能都會有單詞向量作為輸入。

 

后面特征提取這一塊,應(yīng)該會將用word2vec提取的方式改為用doc2vec來提取,不過具體修改時間待定,得看我啥時候能將這一操作學(xué)會(哈哈噠)。

 

Google 已經(jīng)幫助我們在大規(guī)模數(shù)據(jù)集上訓(xùn)練出來了 Word2Vec 模型,它包括 1000 億個不同的詞,在這個模型中,谷歌能創(chuàng)建300萬個詞向量,每個向量維度為 300。在理想情況下,我們將使用這些向量來構(gòu)建模型,但是因為這個單詞向量矩陣太大了(3.6G),因此在此次研究中我們將使用一個更加易于管理的矩陣,該矩陣由 GloVe 進行訓(xùn)練得到。矩陣將包含 400000 個詞向量,每個向量的維數(shù)為 50。

這里有用到一些.npy文件,是通過glove已經(jīng)轉(zhuǎn)好的,存為了npy文件。

 

我們將導(dǎo)入兩個不同的數(shù)據(jù)結(jié)構(gòu),一個是包含 400000 個單詞的 Python 列表,一個是包含所有單詞向量值的 400000*50 維的嵌入矩陣。

結(jié)果對比:

 image.png

CNN網(wǎng)絡(luò)層數(shù)包括:卷積層,池化層,全連接層。

 

CNN神經(jīng)網(wǎng)絡(luò)模型運用于文本情感分析時效果不如LSTM神經(jīng)網(wǎng)絡(luò)模型效果好,經(jīng)典的CNN模型在文本情感分析正確率只有71.2%,而對經(jīng)典進行改進之后,增加了卷積層和池化層,CNN模型的正確率得到了提高,但正確率也是只有77.25%,仍然比不上只用了一層LSTM網(wǎng)絡(luò)的正確率高。從結(jié)果對比中我們可以知道,CNN不光可以應(yīng)用于圖像處理領(lǐng)域,也能成功有效地對文本信息進行分析,但LSTM在解決文本情感分析的問題時效果要比CNN好。

 

下面是一些運行結(jié)果:

訓(xùn)練數(shù)據(jù)集的結(jié)果

 image.png

…,訓(xùn)練了800多個數(shù)據(jù),發(fā)現(xiàn)最高的時候準確率在百分之七十幾,但是絕大多數(shù)穩(wěn)定在百分之五十左右,這個準確度還是有點低的,后面加強學(xué)習(xí),改進代碼,應(yīng)該可以將準確度提高。(方法推薦:改改epoch可能會提高準確度,模型收斂+準確率)

 

輸出詞列表的長度,詞向量的維數(shù)

 image.png

 

維度的個數(shù)

 image.png

這個項目采用的數(shù)據(jù)集是IMDB數(shù)據(jù)集,這個數(shù)據(jù)集是一個關(guān)于電影評論的數(shù)據(jù)集,在這個數(shù)據(jù)集上做訓(xùn)練和測試。這個數(shù)據(jù)集包含 25000 條電影數(shù)據(jù),其中 12500 條正向數(shù)據(jù),12500 條負向數(shù)據(jù)。將其中的23000個文本評論作為訓(xùn)練集,將剩下的2000個文本評論作為測試集。

 

下面為正面評價文本和負面評價文本示例

image.png

 

總結(jié):

CNNLSTM兩種神經(jīng)網(wǎng)絡(luò)模型應(yīng)用到了文本情感分析的問題當(dāng)中,使用Word2Vec模型及它的子矩陣GloVe來將文本信息進行預(yù)處理,轉(zhuǎn)換成了詞向量及向量矩陣,使用了IMDB數(shù)據(jù)集來對模型進行訓(xùn)練,并用TensorFlow進行建模、訓(xùn)練。

版權(quán)聲明:本文為CSDN博主「醒了的追夢人」的原創(chuàng)文章,遵循CC 4.0 BY-SA版權(quán)協(xié)議,轉(zhuǎn)載請附上原文出處鏈接及本聲明。


相關(guān)推薦
  • 檢信智能圓滿完成第84屆中國教育裝備展示會的參展工作
    檢信智能圓滿完成第84屆中國教育裝備展示會的參展工作 第84屆中國教育裝備展示會于2024年10月25日至27日在昆明滇池國際會展中心舉辦,本次展示會全面展示了科技創(chuàng)新成果在學(xué)前教育、基礎(chǔ)教育、職業(yè)教育、特殊教育和高等教育領(lǐng)域的應(yīng)用,包括實驗室設(shè)備、信息化設(shè)備及教學(xué)軟件、功能/學(xué)科教室設(shè)備,AI心理測評、音體美設(shè)備等,涵蓋教育領(lǐng)域各個應(yīng)用場景。參展的國家級高新技術(shù)企業(yè)有255家,占參展企業(yè)總數(shù)的33%。 檢信ALLEMOTION 多維度心理情緒測評系統(tǒng)依托機器紅外視覺識別技術(shù)采集人臉視頻數(shù)據(jù),結(jié)合心理計算大模型及深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)架構(gòu),預(yù)測篩查學(xué)生心理健康預(yù)警及建立學(xué)生心理健康檔案管理系統(tǒng)。通過本次展會與廣大客戶群體深入交流學(xué)習(xí),獲得了很多用戶意見及認同,對我們檢信品牌AI心理情緒識別具有很大的價值與作用。 湖南檢信智能科技有限公司成立于2016年,是一家專注于語音情緒識別,人臉表情識別,面篩情緒識別,眼動情緒識別等核心自主知識產(chǎn)權(quán)技術(shù)開發(fā)的人工智能型企業(yè),并結(jié)合湘雅醫(yī)學(xué)院心理專家團隊心理情緒分類模型,首創(chuàng)檢信 Allemotion OS心理情緒開發(fā)平臺, 應(yīng)用開發(fā)有多維度AI心理測評系統(tǒng)、崗前安全評測系統(tǒng)和心理意圖分析系統(tǒng)等主導(dǎo)產(chǎn)品。 檢信智能聚焦于心理情緒技術(shù)的開發(fā)與應(yīng)用,經(jīng)過8年的企業(yè)創(chuàng)新發(fā)展歷程,累計申請國家發(fā)明專利17項,2019年獲得武器裝備質(zhì)量管理體系認證,2021年獲得國防科大國科平臺優(yōu)秀創(chuàng)新獎,2022年非接觸式無創(chuàng)傷心理情緒監(jiān)測核心技術(shù)榮獲國家科技部發(fā)明創(chuàng)新創(chuàng)業(yè)成果二等獎,2023年榮獲國家高新技術(shù)企業(yè)。
    2024-10-31
  • 中國心理學(xué)會心理測量專業(yè)委員會2024年學(xué)術(shù)年會第一輪通知
    中國心理學(xué)會心理測量專業(yè)委員會2024年學(xué)術(shù)年會第一輪通知心理測量專委會中國心理學(xué)會2024年10月21日 09:01北京在人工智能時代,心理測量與測驗領(lǐng)域歷經(jīng)了顯著的變革和發(fā)展。人工智能技術(shù)(如機器學(xué)習(xí)、大數(shù)據(jù)分析等)已經(jīng)被廣泛用于心理測量指標的開發(fā)、心理測驗工具的研制及優(yōu)化。人工智能在心理測量與測驗領(lǐng)域的應(yīng)用,不僅提高了心理測量與測驗的準確性和效率,還為心理測量與測驗的創(chuàng)新和轉(zhuǎn)型提供了新的可能性。中國心理學(xué)會心理測量專業(yè)委員會2024年學(xué)術(shù)年會定于2024年12月13日至12月15日在貴州省貴陽市召開。本次學(xué)術(shù)年會的主題為“人工智能時代的心理測量與測驗”,會議將重點探討人工智能時代下心理測量與測驗的新趨勢、新動向和新發(fā)展。大會將邀請心理學(xué)、教育學(xué)、統(tǒng)計學(xué)、計算機科學(xué)等領(lǐng)域的專家做大會主旨報告,系統(tǒng)介紹心理測量與測驗的前沿方法、技術(shù)及應(yīng)用成果。熱忱歡迎各位學(xué)界同仁和研究生前來參會。一會議主題人工智能時代的心理測量與測驗二會議組織機構(gòu)主辦單位:中國心理學(xué)會心理測量專業(yè)委員會、貴州師范大學(xué)承辦單位:貴州師范大學(xué)心理學(xué)院協(xié)辦單位:凱里學(xué)院、貴州省社會心理學(xué)學(xué)會顧問:車宏生、余嘉元、戴海琦大會主席:趙守盈學(xué)術(shù)委員會:張敏強(主任)、甘怡群(副主任)、董圣鴻、傅根躍、王力、黎堅、曾平飛、涂東波、駱方組織委員會:方平(主任)、徐建平(副主任)、羅崢、卞冉、陳海平、程超、杜林致、李英武、李中權(quán)、彭恒利、孫健敏、董長江、王蕾、肖瑋、謝晶、閆鞏固、張穎執(zhí)行委員會:羅禹(主任)、陳維、羅杰、程剛、曾練平、高旭亮、劉國慶、趙鵬娟、許爽、裴子釗、姚成奎三會議時間、地點和日程安排1.會議時間:2024年12月13日至12月15日。13日全天報到,14-15日正式會議。2.會議地點:貴州省貴安新區(qū)花溪大學(xué)城貴州師范大學(xué)東校區(qū)。3.會議日程:日程安排簡表見附件,具體日程在第二輪通知中公布。四論文投稿本次年會設(shè)主旨報告、分組報告、研究生論壇等環(huán)節(jié),歡迎國內(nèi)外專家學(xué)者、同學(xué)及各界人士踴躍投稿。1.投稿截止日期:2024年11月30日。2.投稿提交方式:會議摘要請發(fā)送至郵箱[email protected]。提交時郵件主題及投稿文檔請命名為“×××(第一作者姓名)參加心理測量專業(yè)委員會2024年學(xué)術(shù)會議摘要”。3.摘要寫作格式要求如下:(1)語言為中文或英文,中文用宋體小四號字,1.5倍行距;英文用Time New Roman 字體小四號字,不超過800字。1.5倍行距。(2)論文摘要內(nèi)容要求包括論文題目、作者姓名、作者單位全稱、電子郵箱地址、聯(lián)系電話、摘要全文(其中,關(guān)鍵詞3~6個,之間用逗號分開)。五會議注冊繳費1.會議注冊費標準:參會代表1000元,中國心理學(xué)會在冊普通會員800元,在讀全日制學(xué)生(憑學(xué)生證)500元,中國心理學(xué)會在冊學(xué)生會員400元。2.本次會議由中國心理學(xué)會收費并開具發(fā)票,具體繳納方式在第二輪通知中公布。3.參會代表在會議期間的交通費和住宿費均自理。六參展單位邀請誠邀相關(guān)學(xué)術(shù)界與產(chǎn)業(yè)界人士參加本次會議,熱忱歡迎相關(guān)企業(yè)和研發(fā)機構(gòu)參會,共同推動心理測量與測驗的研究及應(yīng)用發(fā)展。請有意參展的單位于12月6日前發(fā)送郵件至[email protected]或聯(lián)系羅老師(電話:18786670954),郵件主題“心理測量與測驗?zāi)陼⒄埂保埜絾挝换厩闆r介紹、相關(guān)業(yè)務(wù)說明等。七會務(wù)組聯(lián)系方式陳維(貴州師范大學(xué)),15285959353羅杰(貴州師范大學(xué)),18786670954羅崢(專委會秘書處),13661135915中國心理學(xué)會心理測量專業(yè)委員會貴州師范大學(xué)2024年10月21日
    2024-10-21
  • 中國心理學(xué)會眼動心理研究專業(yè)委員會2024年學(xué)術(shù)年會第一輪通知
    中國心理學(xué)會眼動心理研究專業(yè)委員會2024年學(xué)術(shù)年會第一輪通知眼動心理專委會中國心理學(xué)會2024年10月20日 09:02北京中國心理學(xué)會眼動心理研究專業(yè)委員會2024年學(xué)術(shù)年會擬于2024年12月21日-22日在河南新鄉(xiāng)舉行。本次會議由中國心理學(xué)會眼動心理研究專業(yè)委員會主辦,由河南師范大學(xué)教育學(xué)部承辦,河南省心理學(xué)會、河南大學(xué)心理學(xué)院、信陽師范大學(xué)教育科學(xué)學(xué)院心理學(xué)系協(xié)辦。誠摯邀請眼動研究相關(guān)領(lǐng)域的科研工作者及社會各界人士參加本次大會。一、會議主題數(shù)智時代眼動追蹤助力教育強國建設(shè)二、會議組織機構(gòu)主辦單位:中國心理學(xué)會眼動心理研究專業(yè)委員會承辦單位:河南師范大學(xué)教育學(xué)部協(xié)辦單位:河南省心理學(xué)會、河南大學(xué)心理學(xué)院、信陽師范大學(xué)教育科學(xué)學(xué)院心理學(xué)系主 席:白學(xué)軍(中國心理學(xué)會眼動心理研究專業(yè)委員會主任)副主席:陳慶榮(中國心理學(xué)會眼動心理研究專業(yè)委員會副主任)馬國杰(中國心理學(xué)會眼動心理研究專業(yè)委員會副主任)閆國利(中國心理學(xué)會眼動心理研究專業(yè)委員會副主任)秘 書:張慢慢學(xué)術(shù)委員會(按姓氏拼音排序):陳黎靜、陳栩茜、陳中廷、崔磊、丁錦紅、高曉雷、高笑、高在峰、谷璜、顧俊娟、韓海賓、侯友、胡笑羽、賈磊、賈寧、江新、姜英杰、康廷虎、李興珊、梁菲菲、梁竹苑、林楠、劉萍萍、鹿士義、彭微微、屈青青、申薇、隋雪、譚瀅瀅、仝文、王福興、王敬欣、魏玲、聞素霞、吳巖、熊建萍、楊海波、楊錦綿、藥盼盼、臧傳麗、張錦坤、張慢慢、張運紅、周鈞毅、周蕾會議籌備組:羅紅艷(組長)、陳勇(組長)、苗學(xué)杰、康淑霞、肖廣軍、衡書鵬、劉小先、全金梁、張曉陽、熊建萍、孫文梅、張振、張煬、張利會、黨清秀、李雙雙、張瑞、李云云等三、會議時間、地點及日程安排1.會議時間:2024年12月21日至12月22日2.會議地點:河南師范大學(xué)(河南省新鄉(xiāng)市建設(shè)東路46號)3.主要日程:12月20日,全天報到。12月21-22日,開幕式、大會報告、分組報告、閉幕式。四、會議征稿1.征文主題本次會議征文涉及借助眼動技術(shù)開展的相關(guān)研究,主題涵蓋但不限于眼動控制機制、語言加工、場景知覺、社會發(fā)展、跨文化研究、特殊群體發(fā)展、人因工程、廣告/消費心理、駕駛行為和運動心理等。邀請國內(nèi)外專家學(xué)者分享最新的研究成果,共同研討如何采用眼動追蹤技術(shù)進行理論與行為研究。2.投稿要求本次會議將設(shè)主題報告、分組報告等學(xué)術(shù)交流環(huán)節(jié),歡迎專家學(xué)者、老師、同學(xué)及各界人士踴躍投稿。會議摘要以電子文稿形式提交,具體寫作格式要求如下:(1)會議摘要語言為中文或英文,以Microsoft Word編輯。中文用宋體5號字,不超過800字。英文用Times New Roman字體5號字,不超過800字。單倍行距。(2)摘要內(nèi)容要求包括:摘要題目、作者姓名、作者通訊地址(含單位全稱、院系部門、所在城市、郵政編碼)、電子郵箱地址、聯(lián)系電話、摘要全文(其中,關(guān)鍵詞3至6個,之間用逗號分開)。掃描下方二維碼查看摘要格式。請將論文摘要電子word文檔發(fā)至?xí)?wù)組專用郵箱[email protected]。郵件主題及投稿文檔命名為“×××(第一作者姓名)參加眼動專委會2024學(xué)術(shù)會議摘要”等字樣。投稿截止日期:2024年12月10日。3.歡迎專家學(xué)者組織會前/會后工作坊,有意組織工作坊的老師請與會務(wù)組聯(lián)系商議。五、會務(wù)事項1.參會人員歡迎中國心理學(xué)會眼動心理研究專業(yè)委員會委員、中國心理學(xué)會其他分支機構(gòu)的專家學(xué)者、高等院校和研究機構(gòu)的教師、研究生以及社會各界人士等參會。2.注冊繳費(1)會議注冊費標準:中國心理學(xué)會在冊普通會員1000元,非中國心理學(xué)會會員1200元,中國心理學(xué)會在冊學(xué)生會員500元,在讀全日制學(xué)生(憑學(xué)生證)600元。(2)本次會議由中國心理學(xué)會收費并開具發(fā)票,繳費方式詳見第二輪通知。(3)參會者會議期間的往返交通費和住宿費自理。六、會務(wù)組聯(lián)系方式聯(lián)系人:劉小先(河南師范大學(xué)),13569853542張振(河南師范大學(xué)),17737355922張煬(河南師范大學(xué)),17537417138聯(lián)系郵箱:[email protected]中國心理學(xué)會眼動心理研究專業(yè)委員會2024年10月20日
    2024-10-21