一些研究依据考古学、历史学的发现认为,早在人类鸿蒙初醒时期,受战争、天灾等因素影响,人类迁徙,在这一过程中,语言也传往新的居住地,并于当地的原住民的语言相融合,形成了汉藏语系的不同语族、语支。
但这些都是猜想,长期缺乏科学证据证实这些猜想的正确性。近日,复旦大学金力院士团队宣布,综合运用语言学和遗传学等多学科交叉的分析方法,揭示了汉藏语系在新石器时代晚期起源于中国北方,汉藏语言大概在5900年前分开。
4月25日,相关结论以《语言谱系证据支持汉藏语系在新石器时代晚期起源于中国北方》为题,在线发表于《自然》杂志。这是中国语言学研究领域首次在《自然》杂志发表科研成果。
汉藏语系起源存争议
汉藏语系是什么?语言学家一般认为汉语、藏语、缅语、羌语等存在一个共同祖先,统称为汉藏语系,这些语言有很多词汇,尤其是一些基础名词、亲属关系词、助词等的基本词汇同源,比如“日”,古汉语读“nit”,汉语读“ri”,藏语读“ni”,缅语读“ne”。在23日召开的《自然》电话新闻发布会上,该论文共同第一作者、复旦大学人类表型组研究院助理研究员严实介绍。
“‘人类从哪里来’之于哲学,就像汉语言的起源之于中华民族。”上海师范大学教授、复旦大学人文社会科学数据研究所东亚语言数据中心负责人潘悟云说,语言是文化的重要载体,由于中华文明史历史渊源深厚,历史资料缺乏,系统认识语言起源一直是研究界热衷的难题,也存在诸多争议。
一直以来,语言学家对汉藏语系内部各语支亲缘关系、分化时间以及起源地点长期存在争议。“北方起源假说”认为汉藏语系起源于大约4000—6000年前中国北方的黄河流域,而“西南起源假说”则认为它起源于至少9000年前的东亚西南部某地。
金力研究团队早在十几年前,研究团队就用依托遗传学数据和分析手段,研究汉藏语人群的起源,以及汉语和藏缅语族人群的关系,初步证实大概在约6000年前汉语人群与藏缅语人群分开。但由于当时采样量的限制,加之东亚群体活动的丰富性,结论的普适性有待进一步扩大。
该论文通讯作者、复旦大学遗传工程国家重点实验室、生命科学学院人类遗传学与人类学系教授、中国科学院院士金力表示,研究人员希望借助语言学的材料,用遗传学方法系统分析汉藏语系各语言,共同回答汉藏语人群的演化、汉藏语系起源等问题。
将6000年精确到5900年
从2016年开始,金力院士团队对109种汉藏语系语言的近千个词汇词根-语义组合进行了收集和整理,并进行谱系建模,重构了汉藏语系诸语言间的亲缘关系,以此推算汉藏语系的分化时间和起源地。
该论文共同第一作者、复旦大学现代语言学研究院青年研究员张梦翰表示,语言是研究群体演化和文化演化的桥梁,此前借助遗传学的数据及研究方法只回答了不同族群的人群差异问题,此次研究团队希望引入数理统计方法,回答不同族群间语言差异的演化关系和模式问题。
研究人员摒弃了传统的语言年代学认定方法,采用贝叶斯系统发生学分析方法,先后推翻了3次实验模型,以期找到最准确、最科学的研究方法,最终认为,原始汉藏语分化成现代语言的最早年代在距今约5900年前,地点可能在中国北方。严实表示,该研究的结论支持了东亚地区汉藏语系诸多语言的同源关系,证实了汉语从原始汉藏语分离成独立语族(支)的观点,并且汉藏语系中的其余语言构成一个单系语言群,即为藏缅语族。
为了印证结论的科学性,研究人员又参照考古、历史、文化等的相关证据,发现汉藏语系的起源和分化对应仰韶文化的晚期、马家窑文化的早期,也符合语言随农业扩散的观点,而且扩散的时间点与考古证据相符——此前的考古证据揭示出独特建筑形式和陶器类型向南扩散的特征,进一步证实了北方起源假说的科学性。
新文科建设研究范式初现
值得关注的是,本研究涉及的语言主要包括汉语和藏缅语族诸多语言,潘悟云介绍,同源语素是语言的“基因”,“基因”的广泛性影响结论的普适性,该研究只是一个开始,未来的研究有望进一步扩充材料与同源词的认定数量。
据了解,目前研究团队已开发出同源语素的切分及认定软件。潘悟云表示,这是现代技术对语言学的贡献,接下来,研究团队将关注汉语言研究中更为复杂的问题——方言的形成过程。“该研究还原了古人说话的部分语音,现在人类已经可以用唐朝的语音语调诵读李白的《蜀道难》,未来用春秋时期的语音语调朗读孔子的《论语》可期。”说。
谈及该研究的价值,金力表示,该研究不仅为探寻中华文明的起源和发展历程,了解中国及周边邻国的各汉藏语系语言之间的演化关系提供了重要依据,为认识东亚人口迁移历史提供了重要启示。其研究方法综合运用了语言学和遗传学等多学科的知识,促进了传统的语言学与计算机科学、脑学科、人类学、心理学、医学等学科的交叉融合,将为新文科建设拓展新的前沿领域、开创新的研究范式。
相关论文信息:DOI: 10.1038/s41586-019-1153-z