午夜亚洲国产日本电影一区二区三区,九九久久99综合一区二区,国产一级毛片视频,草莓视频在线观看精品最新

加急見刊

一種基于卷積神經網絡的端到端語音分離方法

范存航; 劉斌; 陶建華; 溫正棋; 易江燕 中國科學院自動化研究所模式識別國家重點實驗室; 北京100190; 中國科學院大學人工智能學院; 北京100190; 中國科學院腦科學與智能技術卓越創新中心; 北京100190

摘要:大部分的語音分離系統僅僅增強混合的幅值譜(短時傅里葉變換的系數),但是對于相位譜卻不做任何處理。然而,最近的研究表明相位信息對于語音分離的質量起著很重要的作用。為了同時利用幅值和相位信息,本文提出了一種有效的端到端分離方法。這種方法是直接利用原始語音波行點作為特征,是一種基于編解碼器的卷積神經網絡結構。跟其他的說話人獨立的語音分離系統不同,本文提出的方法其神經網絡只輸出一個說話人的信號,其他的語音可以由混合語音與網絡輸出信號的差值獲得。我們在TIMIT數據集上驗證本文提出的方法。實驗結果表明,本文提出的方法明顯優于句子級別的排列不變性訓練(utterance-level permutation invariant training,uPIT)基線方法,對于信號失真比(signal-to-distortion ratio,SDR)相對提高了16.06%。

注: 保護知識產權,如需閱讀全文請聯系信號處理雜志社