李琳山教授常用「輕舟已過萬重山」形容他的研究走過的千山萬水,以及如何峰迴路轉,柳暗花明的歷程;事實上他幾十年的研究歷程,就像是一整片遼闊的崇山峻嶺,山高水長。他把歷年的研究,歸納為「華語語音」、「語音資訊搜尋」、「多元語音技術」等五大主題,也就是這裡論述的主要架構。
概述 Overview | 華語語音 Mandarin Chinese | 語音資訊搜尋 Speech Retrieval | 多元語音技術 Blooming Technologies | 深層學習 Deep Learning | 早期電信研究 Early Communications |
---|
百花齊放 – 網路環境下的多元語音技術
在 1996-1997 年間琳山老師決定將原來「華語語音打字機」的單一研究主軸調整為一個新主軸:「網路環境下的多元語音技術」;考量網路環境的蓬勃發展,有不少新的語音相關問題隨著網路環境出現,其中有不少都值得探索,就多考慮並分別進行研究,因此對其中不少問題都深入到一定程度並獲得若干成果。其中最具體且成果豐碩,廣受全球語音學界肯定推崇的是「語音資訊搜尋」,並發展出擁有宏觀視野的大方向「語音版的 Google」; 事實上除此之外,他的實驗室在其他不少領域也都百花齊放、各有成績,這裡簡述後面這一部分的故事。
語音辨識技術之多元進階方向
在2000年前後及以後若干年內,不論是華語或其他語言,語音辨識之基礎架構及技術雖已成形,但與使用者的期待有明顯落差,尤其正確率仍未盡理想;世界各國的研究團隊都分別下功夫......
新一代語音合成
在九零年代後期,世上出現了一套全新的語音合成技術:先由一位語者仔細錄製一整套語料庫,其中包括非常多語句,各種音的各種互相銜接及抑揚頓挫的變化......
語音情緒(Emotion)分析
在大約2016以後,由於機器學習及深層學習的能力大為進步,可用以分析語音信號中語者說話時的情緒,這方面的研究乃有較多人重視;殊不知琳山老師的團隊早在2006年就......
語音對話(Spoken Dialogues)技術
讓使用者「直接和機器對話」多年來一直是語音技術研究者的目標之一,只是越近年做得越好;要做到這件事機器除了要能辨識使用者說的話,要能說出機器對使用者的回覆......
電腦輔助語言學習(Computer-Assisted Language Learning, CALL)
在全球化的世界中,除母語以外學習第二種或更多其他語言是每個人都必須做的事;學習母語以外的語言最有效的方式是一對一的家教,只是語言家教老師少而昂貴......
語音增強(Speech Enhancement)
真實世界中的語音信號永遠會受到背景雜訊(Noise)或各種環境上的干擾破壞,而且這類雜訊可以變化萬千,無窮無盡;因此自早年至今日,任何時間都有相當多的研究想要......
後記
語音信號變化萬千,相關問題層出不窮;語音又是與人類日常生活長相左右不可或缺的關鍵元素,不同想法自動引出不同的應用機會;而風起雲湧的網路世界尤其創造出無限多的空間......