心理咨詢?cè)O(shè)備這樣的處理方式存在著很多問(wèn)題,我們不能像點(diǎn)積或者反向傳播那樣在一個(gè)字符串上執(zhí)行普通的運(yùn)算操作,所以在這里我們不能將字符串作為輸入,而是需要將文本轉(zhuǎn)換成計(jì)算機(jī)可識(shí)別的格式,由于計(jì)算機(jī)只能識(shí)別數(shù)字,因此我們可以將文本中的每一個(gè)詞都轉(zhuǎn)化為一個(gè)向量,也稱作詞向量。 詞向量是用一個(gè)向量的形式表示文本中的一個(gè)詞,通過(guò)這種轉(zhuǎn)化方式就能采用機(jī)器學(xué)習(xí)來(lái)把任何輸入量化成我們需要的數(shù)值表示,然后就可以充分利用計(jì)算機(jī)的計(jì)算能力,計(jì)算得出最終想要的結(jié)果,保證了操作的可行性,為了得到這些詞嵌入,我們采用一個(gè)很著名的模型 Word2Vec,Word2Vec是近幾年很火的算法,它通過(guò)神經(jīng)網(wǎng)絡(luò)機(jī)器學(xué)習(xí)算法來(lái)訓(xùn)練N-gram 語(yǔ)言模型,并在訓(xùn)練過(guò)程中求出word所對(duì)應(yīng)的vector的方法,它是將詞表征為實(shí)數(shù)值向量的一種高效的算法模型,其利用深度學(xué)習(xí)的思想。 可以通過(guò)訓(xùn)練,把對(duì)文本內(nèi)容的處理簡(jiǎn)化為 K 維向量空間中的向量運(yùn)算,而向量空間上的相似度可以用來(lái)表示文本語(yǔ)義上的相似,在這個(gè)模型中,每個(gè)詞的詞向量是根據(jù)上下文的語(yǔ)境來(lái)進(jìn)行推斷的,如果兩個(gè)詞在上下文的語(yǔ)境中可以被互換,那么這就表示這兩個(gè)詞的意思相似,詞性相似,那么他們的詞向量中相距距離就非常近,在自然語(yǔ)言中,上下文的語(yǔ)境對(duì)分析詞語(yǔ)的意義是非常重要的。
2021-12-10