基于ESVM的科技政策文本標(biāo)簽分類研究
摘要:文本標(biāo)簽作為一種文本關(guān)鍵詞,能夠簡(jiǎn)化科技政策中有效信息的挖掘。本文從科技政策類別角度,將標(biāo)簽類別分為科技投入、知識(shí)產(chǎn)權(quán)、農(nóng)村科技和稅收四類,針對(duì)傳統(tǒng)SVM算法的缺點(diǎn)和標(biāo)簽數(shù)據(jù)不平衡的缺點(diǎn),結(jié)合歐式距離思想,提出一種帶有懲罰因子的ESVM科技政策文本標(biāo)簽分類方法。最后,對(duì)比SVM和ESVM兩種分類方法,驗(yàn)證了本文方法在處理科技政策文本標(biāo)簽數(shù)據(jù)上的有效性。
注: 保護(hù)知識(shí)產(chǎn)權(quán),如需閱讀全文請(qǐng)聯(lián)系河北省科學(xué)院學(xué)報(bào)雜志社