AI讓口語更清晰

基於深度學習之語音訊號增強及其應用

測驗及評量研究中心 | 吳冠倫

  本院測驗及評量研究中心於2022年11月29日以混成方式辦理「基於深度學習之語音訊號增強及其應用」專題演講,邀請中央研究院資訊科技創新研究中心曹昱研究員兼任副主任,並由本中心蔡明學主任擔任主持人、劉奕帆助理研究員擔任與談人。

  曹研究員首先介紹 Artificial intelligence (AI) ,意思就是能夠和真人做一樣的事,只是它是假的、人工的。近年AI研究發展迅速,譬如類神經網路 Artificial Neural Network (ANN) 是一個計算模型,模仿人類大腦運作,執行各項計算任務。

  目前最新穎的AI技術是基於深度類神經網路 (Deep Learning, DL) 的語音增強系統,但為何會需要語音增強系統?你是否曾發現,當想要專注閱讀某本書或做某件事的時候,如周遭有其他的環境音與雜音,我們根本無法專心接受到資訊,而語音增強系統就是要試圖解決這個問題,曹昱研究員的團隊提出基於深度學習的語音增強處理演算法,有效消除環境噪音,降低訊號失真,期能夠還原乾淨的語音。

  AI語音增強技術可以應用於聽覺輔助,譬如人工電子耳,人工電子耳雖然可以讓耳損者重新聽到聲音,但是僅限於乾淨環境的條件下,才能讓耳損者聽清楚並理解,若是處於有干擾的情況下(特別是有背景雜訊),配戴者理解度明顯降低,這時使用深度學習語音增強模型,將有助於提升配戴者的語音理解度。不僅如此,深度學習語音增強模型運用新穎的序列對序列 (Seq2seq) 轉換演算法,也可以改善說話障礙。

  曹昱研究員及其團隊對於AI技術的終極目標是透過以其為基礎的語音增強系統,將不清楚的語音轉換為正確語音,提升語音品質與理解度,協助構音異常患者進行表達及溝通,提高溝通效率,進而改善人際互動與生活品質。人工智慧不再只是電影幻想的情節,更重要的是對人類社會有實質的助益,將科學研究回饋於社會。


口語溝通輔助系統 AI AI聽覺輔具 AI構音輔具