隨着科技進步,計算方法逐漸深入人文學科,不僅革新了人文研究的固有模式,也為人文學科帶來新視野和新路向。「數碼人文」的概念,愈來愈受到注視。
語言研究大改進
「數碼人文」作為一種研究方法,主要利用電腦與資訊科技,協助研究人員處理龐大的人文學資料和數據。以語言研究為例,我們觀察到人類可以透過氣流通過喉、口和鼻發出各種聲音進行溝通。要研究這些聲音,首先要有一套記錄語音的工具,比如漢語拼音、注音字母、粵語拼音、國際音標等。利用音標系統,語言學家可將聽到的聲音轉寫為符號,記錄在紙質媒介上,亦可將紙質媒介上記錄的音標符號拼讀出來,為語音研究提供最基本的數據。
而隨着數碼技術進步,符號文本等可以數碼化,聲音亦可以數碼化,利用電腦直接進行分析及檢索。因此,語音資料不再局限於紙質媒介上的符號,而變得形式多元,儲存量亦愈來愈大。我們更可隨時隨地透過互聯網,搜尋世界各地不同機構開發或收藏的語音資料,比如UCLA Phonetics Lab Language Archive、The World Atlas of Language Structures、中文語言資源聯盟構建的語音庫等。
大數據、量化統計、算法模型等為人文學科,尤其語言研究帶來便利,引發研究革新。「數碼人文」的研究方法,除了利用電腦更有效、精準地處理龐雜的資料和數據,從中發掘新論據和佐證,還注重數據分析的多樣性,注重比較、反思和批判討論,提倡跨學科、跨領域合作,為社會帶來裨益和影響。
在語音研究上,最引人注目的莫過於AI語音,包括「語音識別」和「語音合成」。「語音識別」將語音數據轉換成對應的文本,而「語音合成」將文本轉換成相應的音頻以供播放。目前,語音識別準確率在理想實驗環境下可高達98%以上;語音合成則不僅能模擬流暢自然的真人語音,還可以做到個性化的語音播報。再結合自然語言處理技術,電腦就具備了聽懂、理解、回答語言的能力,實現了人工智慧的重要一步。這些矚目成果歸功於資訊科技與人文學的結合,不僅開啟了學術研究的新領域,還帶來廣闊的應用。
發展多媒體學習
「數碼人文」是香港教育大學人文學院(學院)近年重點發展的學術領域。作為學院主要組成之一的中國語言學系(學系),積極探索數碼科技與漢語研究及中文教育的結合,透過建構數碼化資料庫,深入開展佛典與漢語演變、二語學習者漢字書寫發展等學術研究;鼓勵知識轉移,開發應用程式輔助漢字及古典詩歌的學習。此外,學系還開設語文教學與資訊科技素養、漢語二語教學與資訊科技、中國語文電子化學習等科目,以應用數碼科技提升中文教育水平。
而前面提及的AI語音,也是學系「數碼人文」系列活動的重要內容。比如以學系同事為主要成員的中國語言及中文教育研究中心,最近申請了大學資助的研究項目,計畫推行人工智慧(包括AI語音)開拓中國古典詩歌學習的新方法,包括開發學習應用程式、以及設計多媒體學習活動等。
「數碼人文」是一個相對較新的概念,它提倡的合作、跨學科、與電腦及資訊科技結合等,將會持續影響人文學科的研究、教學與出版,我們對此充滿期待。
梁源博士
香港教育大學中國語言學系署理系主任
本專欄由香港教育大學人文學院學者輪流執筆,內容屬個人分享及學術見解,讀者如有任何意見,歡迎電郵至[email protected]
文章刊於《星島日報》2023年1月30日教育版專欄「數碼‧人文」。
延伸閱讀:
《星島頭條》APP經已推出最新版本,請立即更新,瀏覽更精彩內容:https://bit.ly/3yLrgYZ