基于匯編指令詞向量與卷積神經網絡的惡意代碼分類方法研究
摘要:針對目前惡意代碼分類方法使用特征集過于依賴專家經驗,以及特征維度較高導致的高復雜度問題,文章提出了一種基于匯編指令詞向量與卷積神經網絡(Convolutional Neural Network,CNN)的惡意代碼分類方法。文章首先逆向惡意代碼可執行文件獲取匯編代碼,將其中的匯編指令看作詞,函數看作句子,從而將一個惡意代碼轉換為一個文檔,然后對每個文檔使用Word2Vec算法獲取匯編指令的詞向量,最后依據在訓練樣本集中統計的Top100匯編指令序列,將每個文檔轉換成一個矩陣。使用CNN在訓練樣本集上訓練分類模型,結果表明該方法的平均準確率為98.56%。
注: 保護知識產權,如需閱讀全文請聯系信息網絡安全雜志社