您当前的位置: 交通界 > 国内 > 《你好AI》用声音拯救濒危语言 方言保护计划千里寻“音”

《你好AI》用声音拯救濒危语言 方言保护计划千里寻“音”

发布日期:2019-09-12

  近日,中国首部8K全画幅变形宽银幕纪录片《你好,AI》在优酷视频首播,展现人工智能在不同领域的应用以及对人类社会发展与文明延续的推动与帮助。在《我用AI修文物 人工智能复活千年历史》的记录中,一名科大讯飞研究院多语种研究员远赴边远地区采集满语数据,作为讯飞输入法“方言保护计划”的珍贵语料,用声音留存历史的故事令人动容,也让观众看到人工智能对拯救濒临语言的重要意义和作用。

云图片

  联合国教科文组织数据显示,世界范围内,平均每两周就有一种语言消失。在我国,随着普通话的普及,一些少数民族语言、方言等弱势语言已经濒临灭绝。从小生长于方言环境的人们,承载着年少的记忆和独特的文化特质,内心希望好好说自己的家乡话,但“归宿感”却变得越来越弱。以满语为例,每一亿个中国人中,只有一人能够熟练掌握这种语言。然而,语言的意义除了作为交流工具而存在,更是民族文化和历史的载体。每当一种语言走向消亡,同时远离我们的还有绵延留长、用语言来传承的人类文化遗产。

云图片

  如今留存方言的技术手段更加完善,尤其人工智能的出现,让濒危的弱势语言又有了“复活”的可能。正如纪录片中描述的那样,借助讯飞输入法的人工智能技术对濒危语言的语句数据采集和运算,可以合成个体语言样本,在没有任何满语相关数据的基础上,人工智能可以帮助寻找语言中不同尺度的音节语义之间的关联和模式,在超强算力的服务器的协同配合下,最终形成语音库,实现语言的留存甚至“复制”。

云图片

  值得注意的是,人工智能声学模型训练需基于真实的、有规律的真人朗读音频数据,那么,如何去收集到更多弱势语言的发音人呢?为保护语言资源的多样性,早在2017年,讯飞输入法联合中国声谷发起“方言保护计划”,在线上配套“方言保护”APP及“我AI说方言”微信小程序,掀起全民为乡音发声的热潮。

云图片

  当然,收集方言语音不是目的,作为“方言保护计划”的一部分,为了让智能语音加速推动方言保护,讯飞输入法还免费开放方言语音识别服务,截至目前通用语音识别准确率达98%,独家支持粤语、四川话、上海话等23种方言语音识别。凭借先进的智能语音技术,科大讯飞覆盖30多个语言、少数民族语言及方言的语音系统已经在讯飞输入法、翻译机、自动评测以及播报中得到实际应用,进一步推进民族语言、地方方言的保护和传承。

  保护语言多样性就是保护文化多样性,也是保护人类命运共同体的多样性。如今的技术可以为我们留存历史,但是不能代替我们认知历史,以科大讯飞为代表的人工智能企业,以A.I.为媒让濒危语言得以留存,而想要让弱势语言真正“脱危”,我们清楚认识到,人类主观能动的“爱”比“A.I.”更为重要。


?