基于關鍵詞和關鍵句抽取的用戶評論情感分析
摘要:情感分析的一項主要研究任務是根據文檔內容對其情感極性(即正類和負類)進行判斷。在判斷文檔的情感極性時,不同的詞語和句子具有不同的情感貢獻度,因此如何從整個文檔中準確地提取與情感分類更相關的詞語和句子,從而提升分類性能,成為了一個重要問題。在有監督實驗中,基于依存句法關系分析句子的邏輯結構,提取出了與表達情感更相關的詞語進行加權,提高了分類性能。在半監督實驗中,使用基于中文評論的關鍵句抽取和分類器融合算法,對整篇文檔中包含更多情感詞和總結意味的關鍵句進行了抽取,充分考慮了句子的情感詞屬性、位置屬性、標點符號屬性和關鍵詞屬性,并且使用分類器融合算法,讓置信度最高的子分類器決定分類效果。在大眾點評網和頭條新聞的數據集上將所提算法與已有的經典算法進行對比,發現所提方法的性能更高,從而證明了基于依存句法分析的關鍵詞抽取和基于特征的中文關鍵句抽取算法的有效性。
注: 保護知識產權,如需閱讀全文請聯系計算機科學雜志社