李琳山教授常用「輕舟已過萬重山」形容他的研究走過的千山萬水,以及如何峰迴路轉,柳暗花明的歷程;事實上他幾十年的研究歷程,就像是一整片遼闊的崇山峻嶺,山高水長。他把歷年的研究,歸納為「華語語音」、「語音資訊搜尋」、「多元語音技術」等五大主題,也就是這裡論述的主要架構。

開天闢地 – 華語語音技術誕生的故事

眾所周知,今日所有華語語音技術,包括智慧型手機上的各種華語語音功能,其核心基礎架構均出自琳山老師之手,或他所帶領的學生團隊。在今日超強軟硬體及深層學習、巨量數據、雲端資訊等環境下,這些技術或不足為奇;但早在 1980 年,多數人仍不知個人電腦為何物,當時台灣仍是經濟沙漠,沒有竹科,也沒有電子或資訊產業;當時臺大仍是學術沙漠,要做研究是「沒有經費,沒有電腦,沒有實驗室」的;而當時琳山老師已經在臺大開始進行這方面的研究工作了。這項工作可以說是在沙漠中灌溉出綠洲,再在綠洲中種出作物,而終能開花結果;這裡所說的就是這段故事。

緣起

琳山老師在美留學時專攻衛星通信,對透過人造衛星傳送越洋電話有點瞭解。1979年回到台灣時當然不可能在台灣作衛星通信的研究,因此正想找新的研究題材......


第一階段

由於這個問題太難,他決定由一個「反向問題(Inverse Problem)」開始著手,也就是先讓機器「說」出任一句話。想想這不太難,只要在機器裡存好那一千多個音......


第二階段

在上一階段的工作進行中,琳山老師在1984決定同時開始研究他構想中的「語音打字機」。為了讓目標有可行性,他首先設定三個條件......


第三階段

「金聲一號」的最大弱點是計算量太大,因此需要平行電腦並等好幾秒才能辨識一個音。琳山老師認為簡化其計算是必要的一步;他相信計算量大主要是因為......


第四階段

「金聲二號」的最大弱點,就是每一個字必須斷開來以單音輸入,因而充分利用了華語「一字一音」的特性及好處,但也因此較為不方便;如何可以輸入連續的語音......


後記

今日任何人都可十分方便地對手邊輕巧的智慧型手機說華語,機器就正確寫成文字,或用流利的華語回覆,感覺上極為自然......