客委會從106年開始啟動「臺灣客語語料庫建置計畫」,這個臺灣第一個本土語言語料庫,預計最快在今年10月正式上線,除了透過蒐集資料整理,讓客語文字語音能保存下來,未來結合人工智慧數位科技,還可以廣泛應用在教學、長照等不同面向,讓客語發展迎上時代潮流。
「矺年錢。」
不論什麼腔調,點一下就可以聽到正確的發音,客委會委託政大建置團隊耗時5年蒐集整理,臺灣第一個本土語言語料庫「臺灣客語語料庫」,最快預計在今年10月上線,目前已經蒐集書面語料600萬字、口語語料40萬字以及6種客語腔調。
客委會語發處 處長 孫于卿:「這對於就是說我們當、當代來使用的客家話的保存,研究以及對於未來的應用,這是一個很重要的一個基礎的工作。」
記者 劉宜頻:「Hey siri,幫我播細妹按靚。」
「我不太清楚您想要表達什麼。」
「幫我播細妹按靚,馬上播放羅時豐的細妹按靚。」
講客語聽不懂,要講華語,才有辦法播出這首,耳熟能詳的客家歌曲,不過有了客家語料庫的建置,未來要跟人工智慧軟體講客語,也不是問題。
共同計畫主持人 政大資科系教授 劉吉軒:「我們可以用客語的資料,來訓練電腦可以聽得懂客家話,電腦可以把它翻譯成文字,文字就再,譬如說電腦要回應,可以又再用語音合成,講出客家話出來。」
匯聚上萬筆資料的語料庫,未來結合人工智慧技術,從數位學習、客語認證,即時翻譯到長照服務等等,都可以靈活運用客家語料庫,除了保存流失日益嚴重的客語,如何加值應用,也是未來的發展重點。
文章出自: http://n.yam.com/Article/20220208955276
離婚證人
、台北離婚證人
、新竹離婚證人
、彰化離婚證人
、高雄離婚見證人
遺囑見證人
、結婚證人
- Feb 09 Wed 2022 02:15
「臺灣客語語料庫」擬10月上線 數位應用多元
close
全站熱搜
留言列表