記者23日從內蒙古大學計算機學院獲悉,該院劉瑞研究員所在科研團隊與日本大阪大學科學與工業研究所科研團隊合作,在國際信號處理領域TOP期刊《IEEE/ACM音頻、語音和語言處理會刊》發表了“通過源濾波網絡將獨立于說話人的情感解耦以進行語音轉換”的最新研究成果。
據介紹,情感語音轉換(VC)旨在將中性語音轉換為情感聲音,同時保留語言信息和說話者的身份。科研團隊注意到,將情感特征與其他語音信息(例如內容、說話者身份等)解耦是實現高質量轉換效果的關鍵。由于情感語音中聲學特征的解耦更加復雜,面向中性語音的特征解耦一直無法得到很好的處理。
科研團隊針對情感語音轉換的聲學特征解耦問題開展研究,提出了一種基于“源—濾波器”模型的情感語音轉換系統,具體來說,是為了解決情感語音轉換的特征解耦問題而提出一種新穎的基于“源—濾波器”模型的情感VC模型(簡稱SFEVC),以從音色和音調特征中準確過濾說話人獨立的情感線索。SFEVC模型由多通道編碼器、情感獨立編碼器、預訓練的說話人相關編碼器和相應的解碼器組成。所有編碼器模塊都采用信息瓶頸自動編碼器。
為了進一步提高各種情緒的轉化質量,研究團隊還提出了基于二維VA(激活度—效價)空間的訓練策略。實驗結果表明,SFEVC模型以及VA訓練策略的表現均優于所有基線系統,并基于非平行數據在說話人無關的情感VC場景下實現了最優性能。(記者張景陽 通訊員胡紅波)
標簽: 情感語音轉換技術研究 取得新進展 情感語音 轉換技術
記者23日從內蒙古大學計算機學院獲悉,該院劉瑞研究員所在科研團隊與日本大阪大學科學與工業研究所科研團隊合作,在國際信號處理領域TOP期
風力發電是一種越來越受歡迎的可再生能源。然而,將風能轉化為電能的巨型渦輪機葉片被更換下來如何處置是一個問題。在23日舉行的美國化學學
記者23日從內蒙古大學計算機學院獲悉,該院劉瑞研究員所在科研團隊與日本大阪大學科學與工業研究所科研團隊合作,在國際信號處理領域TOP期
風力發電是一種越來越受歡迎的可再生能源。然而,將風能轉化為電能的巨型渦輪機葉片被更換下來如何處置是一個問題。在23日舉行的美國化學學
美國北卡羅來納大學醫學院的科學家們以前所未有的分辨率繪制了年輕人類大腦皮層的表面圖,揭示了從出生前兩個月到出生后兩年關鍵功能區域的
今夏全球酷熱難耐,空調的使用量劇增。但空調中的氫氟烴制冷劑是強效的溫室氣體,也是氣候變化的主要驅動力之一。研究人員在美國化學學會的
俄羅斯研發出一種有效的強放射性廢物處理方法,并已獲得專利。此項發明是正在開發的核電站乏核燃料創新處理技術的一個階段,該方法可減少廢
俄羅斯研究人員開發出對二氧化碳進行工業處理的新型高效催化劑。除了對環境具有意義之外,所得化合物還具有合成方法簡單、成本低和許多其它
目前帕金森病的診斷主要依賴于患者出現的運動癥狀,例如手抖。但運動癥狀出現時意味著疾病已經進展了很久。而帕金森病的前驅期,已經存在的
記者從中國科學技術大學獲悉,該校盧征天教授團隊利用激光冷原子方法對鐿-171原子的固有電偶極矩進行了首次測量,獲得了該電偶極矩小于上限
旗袍,中國和世界華人女性的傳統服裝,被譽為中國國粹和女性國服。雖然其定義和產生的時間至今還存有諸多爭議,但它仍然是中國悠久服飾文化
7月21日,北京市政府發布《北京市電影局關于在疫情防控常態化條件下有序推進電影院恢復開放的通知》,宣布全市低風險地區影院,可于7月24日
?武漢7·16渡江節組委會14日發布公告,由于長江武漢關水位超警戒水位,按照規定取消2020年第46屆武漢7·16渡江節。受近期持續強降雨影響,
過去一段時間,國家級非遺項目灰塑傳承人邵成村,多次在陳家祠等工作現場,向身邊那些帶著好奇目光的人們講解灰塑的種種技術細節:草根灰、
7月13日,位于璧山區南門唐城夜市街區的璧山冷酒夜市開街。這是璧山區打造夜間經濟消費載體、培育夜間經濟活動品牌的舉措之一。璧山市民一