声声交融,多彩共生——北京大学中文系中国语言研究纪事
声声交融多彩共生
中文系中国语言研究纪事
编者按
语言是文化的载体,我国类型丰富的民族语言展示出了多彩的文化特质。各民族通过持续的语言文化交流与文明互鉴,共同孕育了博大精深的中华文明。这些语言既是民族交融进程的历史见证,更是铸牢中华民族共同体意识的文化纽带。因此,对多民族语言的谱系渊源、演化机制及接触关系等课题的探究,不仅是解码中华文明发展脉络的关键,更是当代语言学研究的前沿领域。为此,北京大学校报采访了中文系孔江平、汪锋和李子鹤三位老师,通过呈现他们的研究经历,为读者勾勒出北大人在中国语言研究领域的多维图景。
常常有人好奇地问:我是谁,我从哪里来,我要到哪里去?不过,我们是否思考过这样的问题:古往今来我们所说的语言携带着怎样的基因,中国民族语言之间缔结着何种关系,又会发挥哪些作用?
在千百年的融汇中,中国民族语言声声交融,多彩共生。正如北大中文系长聘副教授李子鹤所说:“从根本上来说,这些关于中国民族语言的问题可以看作苏格拉底人生三问的现实或具体版本,它始终关乎我们‘最基本的好奇心’。”
在北大中文系,一批学者正在为了回答这些问题作出努力,透过语言学之窗,让我们用新的视角发现中华民族和中华文化背后的故事。
扎根历史土壤
中国语言多彩共生
“中华民族是有着五千多年文明史的伟大民族。中华民族共同体的形成和发展是人心所向、大势所趋、历史必然。”习近平总书记在全国民族团结进步表彰大会上说。
根据《中国语言地图集》(2012)的统计说明,在五千年漫长而悠远的历程中,我国形成了分属汉藏、阿尔泰、南亚、南岛、印欧五大语系的,包括汉语在内的130余种民族语言,它们又创造出了约30种文字。这些多彩的民族语言是文明历程的记录者,是民族交流、交融的见证者,也是中华民族共同体的粘结剂。
民族语言为何对中华民族的历史和现在有如此重要的作用?
从语言共性的广泛视角来看——这是因为,语言是人类文明发展史上最重要的事件之一,很多文明发展的历程都会凝结在语言当中,或在语言中得到体现。牲畜的驯化、农业的进步、生产工具的更新……在语言学家的视角下,人类的每一次创造都会被编入语言的密码,成为历史和文明的一部分。
对于中华民族而言,多民族语言的意义更是多方面的。
起源于距今约3000年前殷商时期的甲骨文,被视为中国最早的文字,也是世界上历史最悠久的文字之一。而在甲骨文尚未形成的时候,语言就已经产生了。它依靠声音的载体让人们在文明早期阶段就得以实现基本的思维和交际功能。
时间来到距今大约1.2万年以前,在末次冰期结束后,农耕文明兴起,人们使用的语言就进入到接触、交融和融合的状态。此后,这样彼此接触、相互融合的基本形态一直塑造着中国多民族语言的样貌,影响着民族语言之间的关系。各民族的历史和文化也借由不断变化的民族语言被书写了下来。
历史悠久,长期交融,多彩共生。中国多民族语言对中华民族有着不可替代的宝贵价值。如北大中文系教授、语言学实验室主任孔江平所说:“中华民族的语言是文明的基石,是各民族的思维方式和交际工具,也是文化传承的载体。”
然而部分民族语言却面临着严峻的“生存挑战”。根据《民族语言》(Ethnologue)记录,在全球现存的7159种语言中,超过40%的语言濒临灭绝。“大部分语言使用的生态环境会越来越小,它们实际上只在某个村落或某一民族聚居区的社区里使用。”孔江平介绍道。
不过,世界上的每种语言都同等重要。正如《民族语言》卷首语上写的那样:“语言对人类的身份认同至关重要。我们使用的语言构成了我们的一部分,也赋予了我们赖以生存的社群和意义。”
为更好保护我国多民族语言,健全的法律法规体系被建立起来,语言资源保护行动随之展开。
根据《中华人民共和国宪法》规定:“各民族都有使用和发展自己的语言文字的自由。”《中华人民共和国民族区域自治法》指出:“教育各民族的干部和群众互相信任,互相学习,互相帮助,互相尊重语言文字。”
2015年教育部、国家语言文字工作委员会启动了中国语言资源保护工程。截至2021年,该工程已经建立了1700多个调查点,收集了我国境内的123种语言和方言的1000多万条原始语料数据,成为世界上最大的语言资源保护工程。
对多民族语言的起源、演化关系、亲疏关系等问题的研究,自然也构成更大的中华文明发展问题研究中的一个重要部分。北大中文系语言学教研室和语言学实验室就一直扎根历史土壤,承担着这份责任。
紧握现实特性
理论研究传统深厚
紧握“汉藏语”的现实特性,北大中文系民族语语言理论研究传统深厚。他们关注的一个重要问题就同我国民族语言的起源相关。
人类究竟从何而来?数千年来,各领域学者都在竭力尝试回答这个根本性的问题。我国著名语言学家王士元先生曾把“语言学”视为考察人类历史的三个窗口之一。因此在探寻人类语言起源和谱系关系的道路上,语言学家们始终不断努力为我们拭去那扇通往人类历史之窗上的浮尘。
当我们将视线范围集中在中国境内的语言上,一个响亮的名号会从20世纪初传来——它的名字是“汉藏语”。1786年英国语言学家威廉·琼斯(SirWilliamJones)在亚洲学会三周年演讲会上向世界宣告:梵语、拉丁语和希腊语或许同出一源。他是提出“印欧语假说”的第一人,此后这一构想也被推为比较语言学领域的重要研究方向之一,它的余波在100多年后还启发了来自中国的语言学家。
在印欧语研究经验的基础上,他们特别发现:藏语和汉语之间的对应跟印欧语很相像,可能也是从同一个语言演化来的,于是“汉藏语”的名字应运而生。
但是在研究过程中,语言学家们渐渐发现:中国境内的民族语言之间存在着复杂的亲缘和接触关系,能够被并入“汉藏语”体系的“语言名单”也应该随之改动。为了把复杂多样的语言整合在一起,他们仍选择以汉语和藏语为代表,给整个语系命名。
作为一个概括,“汉藏语”是仿照印欧语而来的,不过它的内涵始终存在超越后者的部分。孔江平关注到了这些语言更复杂的特性:“不同社会形态中的语言,它的演化形式是不一样的。中华民族在历史上一直都在融合的过程中,中国的语言演化形式和西方实际上是不同的。”
不同的形成过程让“汉藏语”和“印欧语”有了全然不同的样貌。无论是更复杂的互动关系,更少的文献资料,还是更独特的语言特征,都会让“汉藏语”研究天然地遇上一些问题。
因此,如何构建语言关系的本质、探寻语言演化的模式、寻找语言发展的机制,成了“汉藏语”研究面对的特殊情况。为了揭示语言变化背后的这些原理,他们正借助不同的研究工具开始攀登这座充满挑战和机遇的高峰。
“汉藏语起源和谱系关系问题的研究难度是很大的,所以研究这个问题可以看作是对普通语言学理论方法的一个检验。”李子鹤说。最初,在分析“汉藏语”相关问题时,中国语言学家借助更多的是传统小学和历史语言学的理论和方法。现在,传统方法不断更新迭代,研究工具持续更新。
在传统历史语言研究中有一个不得不提的概念——同源词。对它的寻找是使用历史比较法时难以略过的关键环节。“同源词就是从同一个祖先来的词,它们的语音之间有一系列的对应,比如成套的声母和韵母会产生一样的变化。”北大中文系教授、北大中国语言学研究中心副主任汪锋解释道:“如果找到同源词就可能确定语言之间的同源关系。”
不过在这个过程中,还存在着一片由“借词”构成的“沼泽地”:借词是从其他语言借来的词,长得跟同源词差不多,它们让研究者一不小心就会建立了错误的同源关系。为了躲避“借词”的陷阱,更多改进后的方法被一一提出。
如果从本科毕业后来到云南深入调查当地语言开始算起,年近七旬的北大中文系陈保亚教授已经坚守在民族语言研究的阵地上整整四十年了。1996年他的博士毕业论文《语言接触与语言联盟》出版,这部著作不但获得了1997年“王力语言学一等奖”,而且给后续学者的研究带来了方法上的巨大更新。
“我们做语音对应的时候,总想找有什么东西是不能借用的。”在汪锋看来,语言学家寻找这些词语的过程“就像寻找人类遗传中的Y染色体和线粒体DNA”。然而,同以往研究思路不同的是陈保亚认为,词的借用是不存在像“基因无法被转移”一般的限制。不过,“核心词”的相似程度却能反映出语言间的关系。
具体来说,在一种语言借用另一种语言的成分时,往往是没有界限,但有阶段和先后顺序——例如我们的普通话不可能先从英语中借用“hand”(手)这样的核心概念,再借用“coffee”(咖啡)这样的文化概念。与之相反,“coffee”(咖啡)很容易成为普通话中的音译词。
这种差异的产生正是因为,核心概念像每个语言中的稳定特征,而远离核心的概念在语言间有更强的“流动性”。因此,两个语言间的核心词汇相似性越高,文化词汇相似性越低,那么二者更可能为同源关系;反之,则更可能是接触导致的词汇借用的结果。
这条被称为“有阶无界”的规律,在此后近30年来一直被视为该领域“最有效的方法”之一。它在一定程度上帮助语言学家们通过鉴别两个语言中共同的核心词的数量,来实现鉴别二者之间亲缘关系和接触关系的目的。
汪锋和李子鹤是北大中文系理论语言学教研室中青年一代的语言学家。白语在汪锋的研究中尤受关注,李子鹤则更聚焦纳西语的“前世今生”。他们正在陈保亚研究成果的基础上,基于不同的民族语言现实,对方法作新的反思和尝试。
从徐通锵和王洪君先生提出的“叠置式音变”理论,到陈保亚提出的“语言接触的有阶无界理论”和鉴别同源关系的“阶曲线”模型,再到汪锋提出的历史比较中的“还原比较法”和“不可释原则”,以及李子鹤提出的“分步比较原则”。老、中、青三代学者的传承和创新,正不断拓展着民族语及其关系研究的边界,也吸引着更年轻一代的学生投身到民族语言的理论研究中,为该学科的发展注入新的活力。
践行全新方法
学科研究硕果累累
考古学家以物证史,要挖掘最准确的遗址;遗传学家透物见人,要把握最本质的基因;同样,语言学家的研究也需要掌握最严谨的方法,探寻最有效的线索。
除了对原有方法的改良,新手段和新观点也逐渐显现出来——
孔江平根据语言接触融合的调查发现“语言是多次融合的结果”。他的团队通过调查,用科学的计算方法对中华民族语言接触融合的现状进行了科学的分析和类型计算。“我们想根据中华民族语言的具体数据去建立一套新的语言学谱系分类和知识体系。”这是他们的愿景。
在教育部和北京大学的共同支持下,2021年一项名为“中华民族语言文字共同研究”的大项目,依托北京大学语言学实验室的平台落地实施。此后,研究团队又申请到国家社科基金重大项目——“中华民族语言文字接触交融”。他们的最终目标是,建立一个大型的数据库,解释中华民族形成和中华民族语言文字的形成过程以及现状。
为了实现这一目标,研究团队对中华民族110种语言和方言进行了多方面大规模的田野调查。现在,“中华民族语言共同体”数据库规模不断扩大,动态的语言演变模型趋近精确。
中国民族语言研究的新版图还出现在跨学科合作的交界处——
在李子鹤看来,用传统方法研究语言学的人更像是专注研究“如何把一扇窗做得更好看”的工匠,未来的语言学家则更像是要透过这扇窗“让我们观察到人类历史演化的各个方面”,学科间协作的展开“可能是语言学研究自身的一个转型”。
“讨论历史无外乎通过历史、基因和语言三个方面,它们各有优劣。”汪锋把三个传统学科得以互相补充的条件概括为:“拥有共同的议题”。在北大,以中国民族语言及之间关系为题的跨学科合作已然展开,成果逐步显现。
2016年,围绕“语言接触与语言演化的跨学科视野”的主题,五场别开生面的“黉门对话”在来自语言学、历史学、基因学、考古学、心理学和数学领域的10位学者间展开。五场对话的分享内容都被集结在一起,出版为《黉门对话:以语言接触与语言演化为中心的跨学科视野》。汪锋是这场对话的主持者之一,也是该书的主编。
如今,汪锋和对话者之一,北大历史学系教授、历史人类学家王明珂的合作研究还在继续,来自各学科领域的学者将同语言学家一起,用共同的议题将跨学科的切口逐步缝合起来,展开有关人类历史、现在和未来的图卷。
孔江平团队描绘“中华民族语言文字共同体”的过程就是一个特别的展示跨学科研究魅力的图例。在他们的研究中,历史学、生命科学和人工智能都在发挥独特的作用。
各民族的历史情况是怎样的?这是孔江平团队近两年来一直在关注的问题之一。历史学材料就像一座未经开发的语言学宝库,他们发现:无论是来自各朝各代的少数民族语言的词汇,还是来自中国古代文献的文本记录,都同语言学研究的关系异常密切。
“我们还在了解生命科学的成果,最主要是要寻找基因的材料。”尽管基因和文化之间不存在必然的对应关系,但从人类学角度来看,基因确实可以反映和证明两个民族在历史上是否发生过融合。沿着这样的思路,几位专攻生命科学的学生助理加入到了团队中。在基因材料的佐证下,他们正步履扎实地接近中华民族语言“DNA”秘密的真相。
以往的语言学跨学科合作关涉传统的历史学、考古学,关涉与人群关系密切的自然科学。未来,它的边界还将不断向人工智能领域推进。“过去的语言保护项目只能记录一些材料,一旦语言消亡了,它能继续提供的材料是非常有限的。”
如何让语言“保持”鲜活?孔江平团队正同北大计算机学院数据科学与工程研究所研究员杨仝团队开展合作。“如果训练一个汉语和少数民族语言的机器翻译系统最少需要10万句话,能够翻译10个少数民族语言的系统就需要至少100万句话的材料。”现在,他们让人工智能系统学“说”哈尼语的尝试刚刚开始。
“当后人的科技登上更高台阶的时候,再回头看现在人类语言的思维方式和编码方式,这对人类未来的文明有很大的作用。”这是跨学科研究带给语言学研究、带给人类未来发展的更大价值。
走向广袤田野
触摸多民族的肌理
独自驱车翻越数个海拔5000米以上的垭口,深入喜马拉雅山下寻找珞巴语;坐上车轮缠好铁链的摩托历经两个小时前往洛水河畔探索刺瓦摩梭文化的本源。“我们语言学的诗和远方就在田野里面。”这是孔江平常常对学生说的话,也是一代代语言学家始终践行的誓言。
从攻读博士学位到成为中文系的老师,李子鹤是一直在田间地头跟纳西语打交道的记录者、研究者。“纳西语的历史地位长期得不到解决,我期待能从它入手,一方面找到判断语言谱系关系的一些方法,另一方面也能用它的材料补充汉藏语对应的材料。”在实现目标的过程中,如何“到当地去获取一手材料”是他必须面对的第一重难关。
云南省迪庆州维西傈僳族自治县塔城镇柯那村汝可组,是坐落在横断山脉云岭纵谷中的自然村落。这里的玛丽玛萨语成了李子鹤研究纳西语的第一个目标。
“我第一次去的时候,从镇上到村里只有土路,路很难走,镇上的领导带着我也绕了半天。”相比较路途的艰险,让李子鹤至今记忆犹新的还是村民的热情:“他们会主动到我住的那户村民家去,希望我通过研究确定他们的祖居地。”尽管语言学研究的结果一时还难以满足村民们朴素的愿望,但他们始终充满热情地配合着李子鹤的调查。“学术研究跟普通老百姓对自身身份问题的疑惑结合起来。”这段经历始终提醒着他“学术不仅仅是在大学里做的”,更要“脚上沾满泥巴,踏踏实实做事”。
“语言是活在整个生态当中的,每一次调查都会发现语言学的力量”,因为“在补充一些问题所需材料的过程中,田野也总会带给你一些新的东西。”汪锋每年都会参与方言调查,在一次次地交流和记录中,他已经成了当地人眼里名副其实的“白族人”了。而正是千万次地融入田野让他变成了真正的当地人——
如果你跟布朗族人说:“你这里有茶吗?”他们就会从罐子里掏出一团揉得像泡菜一样的东西,拌一拌辣椒,递给你,并回答道:“这就是我们的茶,这是酸茶,它要被埋在坑里发酵一到两个月才能被食用。”一次有关“茶”的对话,让汪锋在语言现场再一次改变了固有的认知,也让他得以破解布朗族的“茶”并非从汉族的“茗”得来的借词的秘密,更让他坚信:“不调查就相当于不跟语言接触,很容易造成跟语言之间的隔离;到了真正的语言环境中之后,你才能了解这个语言是什么样的情况。”
“只有生长于斯的人们才能发现它,并用世代相传的语言赋予它层累的意义。”在海南省七仙岭调查黎语的赵炳亮在谈起七仙岭的命名时,也有与汪锋相似的体悟。赵炳亮是北大中文系2023级硕士研究生,他也是“中华民族语言文字接触交融研究”项目的成员。
从2022年开始,北京大学语言学实验室的师生正式踏上了“中华民族语言大融合田野调查”的征程。三年来,他们已经到达了位于祖国位置最西端的新疆维吾尔自治区的帕米尔高原、最西南端的云贵高原、最南端的海南省,以及海拔最高的青藏高原。每次调查的结果都将成为构成项目坚实基础的一部分,越来越多的高校师生的加入也将为项目的开展带来新的活力。
每一次出发都会迎接新的机遇,如同汪锋等写在《到田野去:语言学田野调查的方法与实践》编者序中的那段话:“鲜活的田野语言持久地冲击着语言学家的想象力,也构成了语言学理论的不竭的源泉。异彩纷呈的鲜活语言在中国的山川田野中无处不在。”
回归真实人群
发现语言背后的故事
方法进步、学科融合,在不断扩展语言学研究边界的时刻,仍要紧握手中最初的那份人文信仰,因为它关乎具体的人,关乎多样的文化,关乎我们的过去、现在和未来。
“学术研究最根本的就是满足人的好奇心。”这是李子鹤提之又提的思考:比起时刻翻新的技术,“语言学本身仍然是有意义的”,更值得语言学家关注的是“实地的情况、不同的人群,真实的生活、真实的文化”,这些才是“更本质的东西”。
“对于少数民族语言研究来说,好的材料积累都并不多,这些语言没有文字和大数据,一些新的技术和方法就没办法使用,你可以说是困难,也可以说是机遇。”李子鹤说。
“现在说起文化的重要性,大家好像都觉得没有太大的问题,但说起语言重要,大家可能觉得比较远。”不过在汪锋眼中,“语言是最大的文化,各种文化都是靠语言记录。”
怀着相同的信念,在“中华民族语言大融合田野调查”中,孔江平团队还做了很多保护文化多样性的工作。
从响彻广西村落大地的烟墩大鼓,到穿透西藏高原冰雪的佛教诵经,再到游荡云南红河两岸的芦笙小曲。北京大学语言学实验室记录语言,也捕捉声音,更关注每种“有声文化”背后蕴含的文化生命力和情感寄托。他们把各类声音形式都视为民族文化和认同的宝库,努力让声音诉说每个民族独有的记忆。
“我们是中国语言文学系,而不是汉语语言文学系。”如何保护中国境内丰富的语言资源?如何探索深入埋藏于声音和文字之下的奥秘?这是北大中文系语言学学者始终思索的问题,也是他们前后相继的使命。因为,就像汪锋说的那样:“这些研究不光关乎你的过去,关乎你的现在,也一定关乎你的将来。”
来源:《北京大学校报》第1692期第3版
文字:李沛原