“方言保護(hù)計(jì)劃”首支AI方言文化公益短片《懶畫眉》海報(bào)。鄉(xiāng)音未改予安客串藍(lán)衣侍女。搶救(受訪者供圖/圖)
“mo55老;w55大;wo55wo31幫助……”
這是將成一本獨(dú)龍語(yǔ)發(fā)音與漢語(yǔ)詞匯的對(duì)照詞典。如今,永恒獨(dú)龍語(yǔ)母語(yǔ)者少于一萬(wàn)人,鄉(xiāng)音未改且普遍年齡大、搶救文化水平低,將成不會(huì)寫“獨(dú)龍文字”,永恒因此該詞典收集的鄉(xiāng)音未改語(yǔ)料多為錄音,直接用國(guó)際音標(biāo)表示。搶救
詞典的將成制作者是人工智能,通過(guò)一種特殊算法,永恒整個(gè)過(guò)程只需要輸入兩種語(yǔ)言的鄉(xiāng)音未改獨(dú)立語(yǔ)料,不需要現(xiàn)有翻譯,搶救也不需要操作人員有任何關(guān)于獨(dú)龍語(yǔ)的將成知識(shí)儲(chǔ)備,就能獲得對(duì)應(yīng)詞典。
該詞典和背后的算法由英國(guó)謝菲爾德大學(xué)計(jì)算機(jī)系在讀博士彭煦潭主導(dǎo)完成,為瀕危語(yǔ)言的記錄和保護(hù)提供了一種新思路。
聯(lián)合國(guó)教科文組織在2020年的調(diào)查數(shù)據(jù)顯示,全球七千多種語(yǔ)言中至少有40%處于某種程度的瀕危狀態(tài)。據(jù)商務(wù)印書館出版的“中國(guó)瀕危語(yǔ)言志”叢書記錄,全國(guó)130多種語(yǔ)言中,有68種使用人口在萬(wàn)人以下,有48種使用人口在五千人以下,有25種使用人口不足一千人,有的語(yǔ)言只剩下十幾個(gè)人甚至幾個(gè)人會(huì)說(shuō)。
“‘少小離家老大回,鄉(xiāng)音無(wú)改鬢毛衰’道出了鄉(xiāng)音的無(wú)限情感魅力;一個(gè)浪跡天涯、久別鄉(xiāng)井的游子,偶爾在異國(guó)他鄉(xiāng)邂逅素昧平生然而鄉(xiāng)音無(wú)改的鄉(xiāng)親,那種喜悅、親切、激動(dòng)之情始終是使用國(guó)家通用語(yǔ)言——普通話所難以表達(dá)的。”著名語(yǔ)言學(xué)家詹伯慧曾在《語(yǔ)文雜記》描繪了這樣一個(gè)場(chǎng)景,并寫道,“方言將永遠(yuǎn)在它所通行的范圍內(nèi)充分發(fā)揮其無(wú)可替代的作用。”
“沒(méi)有任何一種方言是一成不變的,以后方言也會(huì)‘適者生存’,而我錨定的是我們這個(gè)時(shí)代的話。萬(wàn)一它今后斷層了,還能靠現(xiàn)在留下的音頻文字資料喚回。”在保護(hù)方言方面活躍了近十年的85后蘇州姑娘予安說(shuō)道。
2014年,予安忽然發(fā)現(xiàn)家鄉(xiāng)的年輕人很少講蘇州話了。這一年,從事西班牙語(yǔ)教學(xué)的她回到蘇州工作,一講蘇州話,11歲的表弟已經(jīng)完全聽(tīng)不懂了。予安很吃驚,因?yàn)楸淼?歲之前說(shuō)著一口流利的蘇州話,予安還錄過(guò)他唱方言兒歌的影像。
原來(lái),表弟小學(xué)六年均在寄宿學(xué)校上學(xué),完全失去了蘇州話的語(yǔ)言環(huán)境。而再往下了解,予安發(fā)現(xiàn)像表弟這樣的00后大多不會(huì)說(shuō)蘇州話,能聽(tīng)懂的年輕人寥寥無(wú)幾。
予安打算為此做點(diǎn)什么。她報(bào)名參加蘇州市語(yǔ)委舉辦的蘇州話輔導(dǎo)師培訓(xùn)班,并通過(guò)了口語(yǔ)評(píng)定。培訓(xùn)班上,予安發(fā)現(xiàn)身邊的“同學(xué)”平均年齡六十歲左右,而自己的蘇州話在他們聽(tīng)來(lái)非常“洋涇浜”(不正宗)。直到通過(guò)考核,拿到蘇州話輔導(dǎo)師資格證書時(shí),予安仍覺(jué)得自己“會(huì)教,但講得不好”。很多同班同學(xué)則情況相反,他們講得好,但是不會(huì)教,有人甚至沒(méi)參加最后的考核。
考核結(jié)束后,學(xué)員們問(wèn)負(fù)責(zé)人“我們拿了這個(gè)證能干嘛”,對(duì)方表示“你們自己去找街道搞活動(dòng)”。于是很多人拿到資格證書后就沒(méi)了下文。但予安沒(méi)有停下,她繼續(xù)想辦法提高自己說(shuō)蘇州話的水平。
西班牙語(yǔ)專業(yè)的她決定像對(duì)待一門新語(yǔ)言一樣來(lái)重新學(xué)習(xí)蘇州話。蘇州話所屬的吳語(yǔ)在國(guó)內(nèi)方言中研究資料較多,但予安找到這些資料后發(fā)現(xiàn)看不懂,于是從頭開(kāi)始自學(xué)與現(xiàn)代漢語(yǔ)教學(xué)相關(guān)的基礎(chǔ)知識(shí),并補(bǔ)充了國(guó)際音標(biāo)