基于ESVM的科技政策文本標(biāo)簽分類研究
摘要:文本標(biāo)簽作為一種文本關(guān)鍵詞,能夠簡化科技政策中有效信息的挖掘。本文從科技政策類別角度,將標(biāo)簽類別分為科技投入、知識產(chǎn)權(quán)、農(nóng)村科技和稅收四類,針對傳統(tǒng)SVM算法的缺點和標(biāo)簽數(shù)據(jù)不平衡的缺點,結(jié)合歐式距離思想,提出一種帶有懲罰因子的ESVM科技政策文本標(biāo)簽分類方法。最后,對比SVM和ESVM兩種分類方法,驗證了本文方法在處理科技政策文本標(biāo)簽數(shù)據(jù)上的有效性。
注: 保護知識產(chǎn)權(quán),如需閱讀全文請聯(lián)系河北省科學(xué)院學(xué)報雜志社