馬家窯文化、仰韶文化、磁山文化的地理分布區(qū)域。 圖源:參考文獻3
撰文 | 楊 梟
責編 | 陳曉雪
一萬年前,歐亞大陸見證了兩大語系的誕生:西方誕生了印歐語系,東方誕生了漢藏語系,如今,世界上超過60%的人口所講的語言均屬于這兩大語系。漢藏語系分布極廣,從太平洋西岸至內陸的尼泊爾、巴基斯坦,都有漢藏語系的 “主講人”。然而,漢藏語系在何時何地誕生一直以來都飽受爭議。
4月25日,《知識分子》介紹了復旦大學金力團隊的研究 [1]:通過系統(tǒng)發(fā)生學(phylogenesis)方法,研究人員重構了漢藏語系下各個分支的親緣關系,推算出漢藏語系起源于新石器時期的中國北部,大約5900年前的黃河上游,并且與馬家窯文化和仰韶文化的出現(xiàn)有關。
短短11天之后,《美國國家科學院院刊》(PNAS)發(fā)表了一篇相似的研究 [2](下簡稱List團隊的研究)。法國東亞語言研究所、德國馬克斯普朗克人類歷史科學研究所、巴黎決策數(shù)學研究所組成的科學家團隊同樣采用了系統(tǒng)發(fā)生學的研究方法,得出了相似但不同的結論:漢藏語系起源于7200年前的中國北部,并與晚期磁山文化和早期仰韶文化相關。
兩項研究的結論為何有差異?
首先,兩項研究所采用的數(shù)據(jù)庫不同。在List 團隊的研究中,數(shù)據(jù)庫由該研究的專家構建,包含50種漢藏語系的分支語言,每種語言約有180個左右的核心詞匯,同時包含了一千多年前的古代語言,包括上古漢語、古緬語、古藏語以及通過田野調查收集的現(xiàn)代語言的一手語料。而金力團隊采用的數(shù)據(jù)庫由伯克利大學的專家構建,包括109種分支語言,每種語言大約100個詞,但是不包含方言。
在研究方法上,List 的團隊構建并分析了更多種可能發(fā)生的譜系,在所有這些譜系中,僅有33%的譜系表明,漢語最先從整個語系中獨立出來;但是在金力團隊的研究中,漢語總是最先獨立,自成一支。
也就是說,List 團隊對于漢語是否最先獨立并無較大把握,但是金力團隊的研究對此更為確定。另一方面,金力團隊的譜系分析結合了系統(tǒng)地理分析,從而探討了語言演化的路徑,如下圖;而List等人考慮了更多與馴化物種相關的詞語。
兩項研究存在諸多差異,因此也得到了不同的結論,還需要進一步的研究才能確定究竟誰的時間判斷更合理。
“兩個獨立的研究團隊,采用不同來源的語言材料,通過計算得到了相近的語言演化歷史,這是非常不容易的,尤其是在語言學這個領域內。我們雙方的結論是相互兼容的,也是可以相互驗證的?!?金力告訴《知識分子》。
通過系統(tǒng)地理學方法,估算漢藏語言原始家園的概率密度。圖源:參考文獻1
新研究的結論如何得出的?
本研究的作者之一、馬克斯普朗克人類歷史科學研究所的游涵(Johann-Mattis List)博士告訴《知識分子》,在開展研究工作時,兩個團隊知道彼此的工作,但為了確保獨立性,并沒有查看彼此的研究結果。
游涵(Johann-Mattis List),馬克斯普朗克人類歷史科學研究所高級研究員,曾在復旦大學交換學習。
在這項研究中,List 團隊研發(fā)了一套針對性的標注方法,它不僅可以標注出具有相同來源的詞,而且可以標注哪些音是相互聯(lián)系的。然后,通過運用系統(tǒng)發(fā)生學方法,推測出它們的歷史關系,構建了它們的譜系。
語言學界認為,語言演化與農業(yè)擴張息息相關。當人類進入新石器時代,種植業(yè)和畜牧業(yè)越發(fā)達的部落,其所講語言的地位也會越高。
因此,研究人員特別考察了諸多有關農耕家庭的詞匯,以解釋農業(yè)發(fā)展與語言演化的關系。在他們所構建的譜系中,至少六項馴化物種可以找到相對應的古詞,包括粟(小米)、豬、綿羊、水稻、牛和馬,如下圖??脊艑W上,這些物種也的確在當時被馴化。粟、豬、綿羊等詞甚至在7200年前就已經出現(xiàn)在原始語系中,但最早講漢藏語的祖先,并不知道“水稻”。
這些詞語來源于農耕民族,按時間和地點推算,他們屬于晚期磁山文化和早期仰韶文化。與北方起源假說(*)一致,這一語言產生后,主要分化為兩支,東支演化為漢語,而西支則演化出了包括藏語在內的多種語言。
公元前1400年(當時中國為商朝),漢文字誕生,從此東支漢語的傳播勢不可擋,鄰近地區(qū)的少數(shù)族語很快被同化。而西支則在多樣性上發(fā)展壯大,部分原因在于文字產生的較晚,其分支下最早的藏文、西夏文形成于公元764年和1070年。
語言傳播與對應的早期馴化物種。圖源:參考文獻2
語言學研究的新方法
系統(tǒng)發(fā)生學(又簡稱譜系學)原本用來研究生物個體的演化歷史,但現(xiàn)在越來越多的學科采用了這一方法。簡單來講,當兩個等位基因出現(xiàn)變異,通過分析它們的特征,向上建立譜系,找到出現(xiàn)變異的根源,這樣逐層建立,得到一個完整的發(fā)生譜系。因為語言演化中也存在譜系,因而越來越多語言學研究開始采用譜系學的方法。
“基于語言譜系,結合群體遺傳學以及進化生物學的分析方法,我們可以更有效地估算這些語言的分化年代,并推測分化地點。這對了解語言的歷史,尤其是史前歷史是非常重要的?!苯鹆Ω嬖V《知識分子》。
他同時表示:“國際頂級刊物上連續(xù)發(fā)表兩篇有關漢藏語系演化的重要文章,也可以反映出國際科學領域對中國語言學的歷史研究也是非常的重視。這是一個非常不錯的開端。我們也希望有更多的不同學科的專家能夠加入到漢藏語系研究的這個行列中。”
List 也抱有相同的期望。“我希望科學界批判性地看待這些結果,并試圖改進這項工作。”他在郵件中回復道:“我們的數(shù)據(jù)可以自由訪問(https://dighl.github.io/sinotibetan/),任何人都可以閱讀并改進我們對詞語關系的詳細判斷?!?/p>
*注:北方起源假說認為漢藏語系起源于大約4000-6000年前中國北方[4];與之相對應的西南起源假說認為,漢藏語系出現(xiàn)在9000年前的中國西南或印度東北部[5]。
參考文獻:
1. Zhang M, Yan S, Pan W, et al. Phylogenetic evidence for Sino-Tibetan origin in northern China in the Late Neolithic[J]. Nature, 2019: 1.
2. Sagart L, Jacques G, Lai Y, et al. Dated language phylogenies shed light on the ancestry of Sino-Tibetan[J]. Proceedings of the National Academy of Sciences, 2019: 201817972.
3. LaPolla R J. The origin and spread of the Sino-Tibetan language family[J]. 2019.
4. LaPolla, R.J. In Areal Diffusion and Genetic Inheritance: Problems in Comparative Linguistics (eds Aikhenvald, A. Y. & Dixon, R. M. W.) 225-254 (Oxford Univ. Press, 2001).
5. van Driem, G. in Trans-Himalayan Linguistics (eds Owen-Smith, T. & Hill, N. W.) 11-40 (de Gruyter, 2014).
制版編輯 | 皮皮魚