基于遷移學(xué)習(xí)和BiLSTM-CRF的中文命名實(shí)體識別
摘要:針對中文命名實(shí)體識別問題,該文提出了一種基于遷移學(xué)習(xí)和深度學(xué)習(xí)的TrBiLSTM-CRF模型.該模型采用基于實(shí)例的遷移學(xué)習(xí)算法,通過權(quán)值生成和樣本選擇,將源域的知識遷移到目標(biāo)域,有效地解決了深度學(xué)習(xí)對少量數(shù)據(jù)學(xué)習(xí)能力不足的問題;通過詞向量、BiLSTM、CRF等操作融合了上下文語義信息,克服了對人工特征和專家知識的依賴.實(shí)驗(yàn)結(jié)果表明,TrBiLSTMCRF模型在小規(guī)模數(shù)據(jù)集上進(jìn)行中文機(jī)構(gòu)名命名實(shí)體識別時,其準(zhǔn)確率、召回率和F值分別為91. 57%、72. 29%和0. 80%,相比于該文提到的其他方法,取得了較好的效果.
注: 保護(hù)知識產(chǎn)權(quán),如需閱讀全文請聯(lián)系小型微型計(jì)算機(jī)系統(tǒng)雜志社