加纳最受欢迎的语言将提供给更多人在线使用

在英语是教育和商业的官方语言的加纳,五分之四的人将 Twi 作为第一语言或第二语言。 不同的变体已将其使用范围扩展到贝宁和科特迪瓦的其他西非城镇,使扬声器的估计人数达到 1800 万人。

这个数字可能很快就会增加。

网络浏览器公司 Mozilla 表示,它已将 Twi 添加到 Common Voice 中,这是它的开源语言数据库,由说这些语言的真人众包而来。 其目的是将数据输入语音识别软件并增加互联网上各种本地语言的可用性,解构一个欧洲殖民语言是默认(在某些情况下,唯一)在线交易所媒介的世界。

南非比勒陀利亚大学数据科学系主任 Vukosi Marivate 表示,多年来,非洲语言学家一直抱怨互联网正在抹杀整个历史,因为“如果机器不理解你的语言,它就好像它从未存在过一样”。去年。 这主要是由于基于互联网的平台缺乏努力,未能提供必要的支持功能:根据牛津互联网研究所的一项调查,大多数不为超过 90% 的非洲人提供第一语言界面支持——支持的调查发现。

即使是支持功能相对较好的谷歌和维基百科,“在主要语言的基础上也排除了几乎一半的非洲人口”。

Twi 加入其他主要非洲语言

Twi 是加入 Mozilla 通用语音的第 100 种语言。 它加入了该项目的其他非洲语言斯瓦希里语、卢干达语、豪萨语、提格里尼亚语、蒂格雷语、伊博语和基尼亚卢旺达语,尽管根据用户贡献的成交量样本,每种语言都处于不同的验证级别。

Common Voice 的产品负责人 EM Lewis-Jong 在一份声明中表示,添加这些语言将使使用这些语言的社区“利用语音技术的可能性——创建一个更健康、更开放的人工智能生态系统”。

非洲使用多达 2,000 种语言,其中 75 种语言至少有 100 万使用者。 虽然不一定能将所有这些语言都放在网上,但 Common Voice 迄今为止仅收集了七种语言,这表明非洲语言要想在互联网上获得成熟的影响,还有一段路要走。

也就是说,Twi 的加入加入了最近在这个方向上的包容性努力:去年,语言学习应用程序 Duolingo 开始计划提供南非最受欢迎的两种语言祖鲁语和科萨语。

至于有时用来证明互联网上没有非洲语言的挑战,即大多数是口头的,几乎没有书面语料库,更多的大学正在提供非洲语言价格以扩大专业知识。 例如,Twi 在新泽西州的罗格斯大学任教。 去年,牛津大学的现代语言系正式开始教授伊博语(尼日利亚东南部约有 2500 万人使用)作为一门带有指导手册和经过批准的讲师的价格。

资讯来源:由0x资讯编译自QUARTZ。版权归作者所有,未经许可,不得转载
你可能还喜欢