摘要:【目的】對(duì)微博進(jìn)行細(xì)粒度情感分析,將情感分為8類,并計(jì)算其情感強(qiáng)度值,從而盡可能還原微博用戶情感?!痉椒ā客ㄟ^(guò)微博語(yǔ)料分析構(gòu)建疑問(wèn)詞詞表,在大連理工大學(xué)情感詞匯本體DUTIR的7類情感基礎(chǔ)上,豐富一類情感“疑”,并利用點(diǎn)互信息法構(gòu)建表情符號(hào)詞典,還綜合考慮否定詞和程度副詞對(duì)情感表達(dá)的影響,利用Python從新浪微博上獲取數(shù)據(jù),并用R語(yǔ)言的iiebaR包進(jìn)行分詞,對(duì)情感進(jìn)行分類并計(jì)算其強(qiáng)度?!窘Y(jié)果】得到微博用戶對(duì)于糖尿病7類常用藥物的8類情感占比及情感強(qiáng)度,并通過(guò)正確率、召回率、F值對(duì)結(jié)果進(jìn)行驗(yàn)證,其中“怒”和“哀”的正確率最高,分別為85.73%和83.05%,而“樂(lè)”和“好”的召回率與F值均最高,為81%以—匕本文新增情感“疑”的正確率、召回率、F值分別為77.33%、78.58%、77.95%,均值在8類情感中排名前列,說(shuō)明其情感識(shí)別較好?!揪窒蕖坑捎诒疚囊蕾囉谇楦性~典進(jìn)行情感分析,因此為了更好的分析結(jié)果,情感詞典仍需進(jìn)一步完善。【結(jié)論】本方法具有較高的識(shí)別率和可靠性,能夠更好地對(duì)微博上的情感分類進(jìn)行細(xì)粒度分析。
注:因版權(quán)方要求,不能公開全文,如需全文,請(qǐng)咨詢雜志社