
加纳语言学、文学翻译学院学者Banewel Mark正在教授濒危的德格语。图片来源:Rodney Ballard
长期以来,语言学暑期研究所(SIL)的预算一直支持着一个叫做“民族语”的项目,许多人视后者为世界语言信息的权威来源。
“民族语”的用户高达数十万人。该数据库可以追踪说希伯来语、豪萨语和客家话等不同语言的人群数量。该数据库以1到10的比例显示每种语言的灭绝风险。根据最新计数,世界上存有 7111种语言。对于语言学家来说,该数据库是一种参考资源;而对于学生来说,这是通向人类语言多样性的一个窗口。
但是,对于从事民族语言应用近20年的计算机语言学家Gary Simons来说,情况不容乐观。自2015年,SIL的闲置资金开始枯竭。为了支付近100万美元的年度运营成本,2015年底,“民族语”成立了第一个付费专区,非付费访问者在阅读几页后就会被拒之门外。2019年10月起,付费专区采用了一种新的形式:它允许访问者访问每个页面,但过滤掉有关该语言的使用者数量以及他们的住址等信息。目前数据库的订阅费用为每人每年480美元。
此举激起了网友不满。许多语言学家发誓要放弃这个网站,寻找其他资源。德国马普学会人类历史科学研究所进化语言学家Simon Greenhill表示,“在过去几年里,人种学变得越来越昂贵,而且被限制了。这是非常可悲的一步。”
目前,Greenhill和其他学者正在努力寻找一种便宜或免费的可获得人口数据的方法。长期以来,对于研究语言多样性的研究人员来说,这些有关民族语言的数据是他们的“唯一选择”。
“我从根本上不反对为数据付费,但这是一项艰巨的任务。” Greenhill表示,在最近的一篇关于地理如何影响语言多样性的论文中,他的团队使用了以前购买的较旧版本的民族语言数据,因为访问其最新数据库将花费数千美元。
Simons理解语言学家的愤怒,但他表示由于财政负担太重,此举实属无奈。 “除非改变经济状况,否则我们什么也做不了。如果我们继续保持现状,那只会崩溃。”Simons说。(程唯珈)
《中国科学报》 (2020-02-24 第2版 国际)