GPU中卷積神經(jīng)網(wǎng)絡(luò)加速單元的設(shè)計(jì)
摘要:GPU已經(jīng)被廣泛應(yīng)用于卷積神經(jīng)網(wǎng)絡(luò)加速,而傳統(tǒng)的GPU執(zhí)行單元主要適用于對(duì)3D圖形渲染進(jìn)行加速,其性能功耗比與神經(jīng)網(wǎng)絡(luò)專(zhuān)用加速芯片有一定的差距。針對(duì)卷積神經(jīng)網(wǎng)絡(luò)計(jì)算和數(shù)據(jù)的特點(diǎn),在充分利用GPU現(xiàn)有計(jì)算單元的基礎(chǔ)上,提出了新的稀疏矩陣加速單元的設(shè)計(jì)方案,解決了GPU加速神經(jīng)網(wǎng)絡(luò)低性能功耗比的問(wèn)題。
注: 保護(hù)知識(shí)產(chǎn)權(quán),如需閱讀全文請(qǐng)聯(lián)系集成電路應(yīng)用雜志社