基于潛在語義特性的語義雙關語檢測及雙關詞定位
摘要:語義雙關語是幽默、笑話和喜劇等作品的來源之一,在人類寫作的發展進程中具有重要的歷史地位。由于語義雙關語存在歧義難懂的特點,因此難以挖掘語義雙關語的潛在語義信息,故目前語義雙關語的檢測和雙關詞的定位是自然語言處理任務中的一項困難和挑戰。該文在語義雙關語的理論基礎上,挖掘了一系列的潛在語義特性,并構建了對應每個特性的特征集,用以檢測語義雙關語;同時從潛在語義特性出發,提出了一種基于詞向量和同義詞融合的語義相似度匹配算法實現語義雙關詞的定位。在SemEval 2017Task 7和Pun of the Day數據集上均取得了較好的實驗結果,驗證了該文所提出的檢測算法和定位算法。
注: 保護知識產權,如需閱讀全文請聯系中文信息學報雜志社