基于關(guān)鍵詞和關(guān)鍵句抽取的用戶評論情感分析
摘要:情感分析的一項主要研究任務(wù)是根據(jù)文檔內(nèi)容對其情感極性(即正類和負類)進行判斷。在判斷文檔的情感極性時,不同的詞語和句子具有不同的情感貢獻度,因此如何從整個文檔中準確地提取與情感分類更相關(guān)的詞語和句子,從而提升分類性能,成為了一個重要問題。在有監(jiān)督實驗中,基于依存句法關(guān)系分析句子的邏輯結(jié)構(gòu),提取出了與表達情感更相關(guān)的詞語進行加權(quán),提高了分類性能。在半監(jiān)督實驗中,使用基于中文評論的關(guān)鍵句抽取和分類器融合算法,對整篇文檔中包含更多情感詞和總結(jié)意味的關(guān)鍵句進行了抽取,充分考慮了句子的情感詞屬性、位置屬性、標點符號屬性和關(guān)鍵詞屬性,并且使用分類器融合算法,讓置信度最高的子分類器決定分類效果。在大眾點評網(wǎng)和頭條新聞的數(shù)據(jù)集上將所提算法與已有的經(jīng)典算法進行對比,發(fā)現(xiàn)所提方法的性能更高,從而證明了基于依存句法分析的關(guān)鍵詞抽取和基于特征的中文關(guān)鍵句抽取算法的有效性。
注: 保護知識產(chǎn)權(quán),如需閱讀全文請聯(lián)系計算機科學(xué)雜志社