午夜亚洲国产日本电影一区二区三区,九九久久99综合一区二区,国产一级毛片视频,草莓视频在线观看精品最新

加急見刊

基于多并行計算和存儲的CNN加速器

李宗凌; 汪路元; 禹霽陽; 程博文; 郝梁; 張偉功 北京空間飛行器總體設計部; 北京100094; 首都師范大學信息工程學院; 北京100048

摘要:根據深度卷積神經網絡(CNN)前向推理結構特點,設計了基于多并行計算和存儲的深度卷積神經網絡加速器,從運算效率與數據重用兩個角度分析了卷積運算的并行特征,并研究了全連接層的全并行流水實現方式。該加速器采用并行流水結構提升計算效率,在卷積層運算中,充分利用多種卷積運算并行架構平衡運算效率與參數及數據載入帶寬的需求,通過三種加速方式實現卷積層內全流水加速;在全連接層運算中,將乘累加運算設計成全流水處理架構,流水延時不超過20個處理時鐘,并通過并行計算實現16倍加速。在基于ImageNet公開數據集驗證實驗中,該加速器每周期最多運行2304次乘累加運算,在150MHz的工作頻率下,峰值運算速率達到691.2Gops,能效比為i7-6700-CPU的2700倍以上,為GTX-1050-GPU的290倍以上。該加速器在硬件資源、計算精度、速度以及功耗等多方面達到良好平衡,便于在星載嵌入式環境應用。

注: 保護知識產權,如需閱讀全文請聯系計算機技術與發展雜志社