免费视频淫片aa毛片_日韩高清在线亚洲专区vr_日韩大片免费观看视频播放_亚洲欧美国产精品完整版

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

開通VIP
全文翻譯| Nature首篇大陸語言學(xué)研究:漢藏語起源于新石器晚期中國北方的譜系發(fā)生學(xué)證據(jù)

翻譯者按:

2019年4月25日,復(fù)旦大學(xué)金力團(tuán)隊(duì)在《自然》上發(fā)表了探討漢藏語言起源相關(guān)問題的文章(綜合報(bào)道),并引發(fā)學(xué)界熱議(這里)。發(fā)布后,拓跋(山東師范大學(xué)語言學(xué)及應(yīng)用語言學(xué)在讀研究生張濤)第一時(shí)間看了這篇文章,并決定譯成漢語,以饗同學(xué)。(感謝董慶進(jìn)一同翻譯,也感謝百度翻譯軟件作為參考)

  文章包括兩部分,一是文本(下文),多闡述總結(jié)性的成果;二是若干附件壓縮包,主要是原始材料、數(shù)據(jù)的整理。一般讀者讀文本即可,想更深入理解文章的讀者建議去下載原始材料。原文中的圖表在本文中僅附少數(shù),其余請點(diǎn)擊“原文”自行到原網(wǎng)站下載觀看。

漢語堂小編說:這樣積極主動(dòng)又有學(xué)術(shù)敏感性的碩士在讀學(xué)生,不讀博士真是可惜了。期待有大佬課題組注意~



漢藏語起源于新石器晚期中國北方的譜系發(fā)生學(xué)證據(jù)

摘要:語言起源和分化的研究對于理解人類及其文化的歷史具有重要意義。漢藏語系是世界上僅次于印歐語系的第二大語系,關(guān)于其譜系發(fā)生和原始分化的時(shí)間深度一直存在爭論。本文對漢藏語系起源的兩個(gè)相互競爭的假說——“北方起源假說”和“西南起源假說”進(jìn)行了貝葉斯系統(tǒng)發(fā)生分析。北方起源假說指出,漢藏語言的最初擴(kuò)散發(fā)生在距今約4000-6000年前(以公元1950年為基準(zhǔn)),發(fā)生在中國北方黃河流域,并且這種擴(kuò)散與仰韶和(或)馬家窯新石器文化的發(fā)展有關(guān)。西南起源假說指出,漢藏語言的早期擴(kuò)散發(fā)生在9000年前的中國四川西南部地區(qū)或印度東北部地區(qū),那里如今存在著非常多樣的藏緬語言。

我們對109種語言的949個(gè)詞根義進(jìn)行了貝葉斯譜系發(fā)生分析,估算出漢藏語言的分化時(shí)間深度約為4200-7800年,平均值約為5900年,這與北方起源假說相一致。此外,譜系發(fā)生分析支持了漢語族和藏緬語之間的二分法。我們的研究結(jié)果與考古記錄相吻合,與中國農(nóng)業(yè)擴(kuò)張和語言傳播假說相吻合。我們的研究結(jié)果為進(jìn)一步跨學(xué)科研究東亞史前人類活動(dòng)提供了語言基礎(chǔ)。

正文

史前人類的知識建立在三個(gè)學(xué)科上:考古學(xué)、遺傳學(xué)和語言學(xué)。遺傳學(xué)和語言學(xué)之間的相似性反映了歷史人口活動(dòng)的可比的潛在過程。因?yàn)檎Z言承載著文化信息,語言的進(jìn)化提供了對史前人類文化的洞察。

漢藏語系是世界第二大語系,由400多種語言和方言組成,約15億母語者共同使用這些語言和方言。漢藏語系在地理上分布于東亞、東南亞半島和南亞北部,包括有良好記錄的語言,如漢語、緬甸語和藏語。了解漢藏語系的歷史,將有助于我們深入研究其成員語言之間的關(guān)系,以及它們與阿爾泰語系、南亞語系、苗瑤語系、侗臺語系和南島語系的相互作用。此外,這一知識對于解決整個(gè)歐亞大陸東部人口遷移的來源、形成和歷史問題至關(guān)重要。

盡管漢藏語言的語言學(xué)研究最近蓬勃發(fā)展,但重建漢藏語系早期歷史的三個(gè)基本問題仍未解決。第一個(gè)問題涉及漢藏語言的基本分類,特別是漢藏語言的地位。漢藏語系的基本分類有三種假設(shè),其中最為廣泛接受的一種假設(shè)提出了漢語族和藏緬語族之間的二分法:即漢語族(主要是漢語及其方言)被認(rèn)為是漢藏語系的一個(gè)主要分支,所有的藏緬語族都被認(rèn)為是漢藏語系的一個(gè)單系群體。一個(gè)對立的假設(shè)認(rèn)為,漢語族是漢藏語系主要分支的一個(gè)次分支。第三個(gè)假設(shè)認(rèn)為,漢藏語系底下分出若干個(gè)平行的分支(并且漢語族是這些分支之一)。除這些假設(shè)外,還有“落葉”模型,它認(rèn)為漢藏語系的主要亞群之間沒有明顯的內(nèi)部關(guān)系。

在漢藏語系分類爭議的基礎(chǔ)之上,其他有爭議的問題包括漢藏語言分化和擴(kuò)散的時(shí)間和起源地。這些爭議可分為兩個(gè)主要假設(shè):北部起源和西南起源假說(表1)。北方起源假說認(rèn)為,黃河上游和(或)中游地區(qū)的人講漢藏語系祖先的語言,他們在距今4000-6000年間分成了兩部分:一部分向西遷移到西藏,然后向南遷移到緬甸(成為說藏緬語的當(dāng)代人口的主要祖先),而另一部分(說漢語的祖先)向東和南移動(dòng),最終成為漢人。大多數(shù)歷史語言學(xué)家傾向于這種假設(shè),并認(rèn)為漢藏語言的擴(kuò)散與新石器時(shí)代仰韶文化(約7000-5000年前)和(或)馬家窯文化(約5500-4000年前)的發(fā)展有著合理的聯(lián)系。

相比之下,西南起源假說認(rèn)為,漢藏語系的擴(kuò)散發(fā)生在約距今9000-10000年的東亞西南地區(qū)。西南起源假說主要有兩種形式(見表1),這里稱為假說II和假說III。假說II認(rèn)為,講漢藏語的人口最早起源于13500年前的四川省西南部,并在大約距今9000年前分為兩組:一組人進(jìn)入印度東北部,另一組向北進(jìn)入黃河流域;后者被認(rèn)為是當(dāng)代中國人和西藏人民的祖先。假說III認(rèn)為漢藏語言起源于大約9000年前的印度東北部,最早講漢藏語言的人從事游牧畜牧活動(dòng)而非農(nóng)業(yè)。

有關(guān)漢藏語言起源地的爭論交織著譜系發(fā)生的不確定性和對語言何時(shí)分化的巨大分歧。所有討論過漢藏語言與東亞農(nóng)業(yè)文明之間關(guān)系的語言學(xué)家都把仰韶文化、馬家窯文化和漢藏語系聯(lián)系了起來,因?yàn)橹袊艹让窈徒裉煺f藏緬語的一些人在文化考古上具有清晰的聯(lián)系。問題在于,和仰韶和馬家窯新石器文化有關(guān)的地理區(qū)域是否就是漢藏語系主要的播遷之地。明確的語言譜系重建和可靠的語言分化估算時(shí)間是推斷漢藏語言發(fā)源地的必要條件。在歷史語言學(xué)中,運(yùn)用豐富的當(dāng)代材料和歷史文獻(xiàn)的比較方法是一種廣泛應(yīng)用于建立語言關(guān)系的方法。語言年代學(xué)是語言比較方法的一個(gè)擴(kuò)展,它使用詞匯數(shù)據(jù)來估計(jì)語言分化的年代。然而,語言年代學(xué)有相當(dāng)大的局限性(例如它假定語言進(jìn)化的速率是恒定的),并且不考慮語言接觸、環(huán)境變化或不同種類的詞之間不同的替換速率、語言進(jìn)化不同的速率等,但這些問題也經(jīng)常出現(xiàn)在漢藏語言研究中。例如,在東亞,漢藏語系與周邊非漢藏語系,如苗瑤和侗臺之間的語言接觸很普遍。此外,缺乏對漢藏語言完整的歷史記錄和全面的語言調(diào)查,這些都對語言比較方法造成了挑戰(zhàn)。然而,進(jìn)化生物學(xué)的貝葉斯譜系發(fā)生方法的最新進(jìn)展提供了繞過這些局限性的替代機(jī)會。這些方法允許靈活的進(jìn)化模型,并且是推斷全球語言家族進(jìn)化速度和變化模式的有力工具。

為了研究“北方起源”和“西南起源”假說,我們對分布在中國、東南亞(例如緬甸)和南亞(例如印度、尼泊爾和不丹)的109種漢藏語系的949個(gè)二進(jìn)制編碼詞根義進(jìn)行了貝葉斯譜系發(fā)生分析(圖1,擴(kuò)展數(shù)據(jù)圖1)。通過匹配Swadesh 100單詞表中的詞義,根據(jù)多種選擇標(biāo)準(zhǔn)(補(bǔ)充信息,第1.1節(jié))手動(dòng)識別和整理詞根含義。利用已知?dú)v史事件的多次時(shí)間校準(zhǔn)來估算漢藏語言的分化時(shí)間(補(bǔ)充表2),并比較了幾種模型組合(擴(kuò)展數(shù)據(jù)圖2)。與以前的研究不同,我們在沒有任何祖先限制或單系限制的前提下進(jìn)行分析,以避免在系統(tǒng)發(fā)育重建過程中出現(xiàn)人為偏差。

貝葉斯譜系發(fā)生分析的結(jié)果顯示,漢語族和藏緬語之間存在二分法,其中傳統(tǒng)分類的藏緬語族被確認(rèn)為一個(gè)單系,后驗(yàn)值為0.68(圖1,擴(kuò)展數(shù)據(jù)圖3)。分析還評估了漢藏語系幾個(gè)有爭議的亞組的可靠性(補(bǔ)充資料,第2.3節(jié),擴(kuò)展數(shù)據(jù)圖4)。漢藏語言最初分化的平均時(shí)間估計(jì)(距今5871年)(圖1,擴(kuò)展數(shù)據(jù)圖5)發(fā)生在仰韶新石器文化時(shí)期,而最初的藏緬語分化時(shí)間(距今4665年)(圖1,擴(kuò)展數(shù)據(jù)圖6)估計(jì)發(fā)生在源于仰韶文化的馬家窯文化中期。因此,譜系發(fā)生和分化時(shí)間與北方起源假說相一致,也就是說,漢藏語言的最初分化可能與中國北方的這兩種新石器文化有關(guān)(圖2a,補(bǔ)充資料,第2.4節(jié))。所估藏緬語分化的時(shí)間與Y染色體數(shù)據(jù)的遺傳證據(jù)也是一致。

考古證據(jù)表明,漢藏語言分化擴(kuò)散與新石器時(shí)代兩種文化發(fā)展之間的聯(lián)系可能歸因于人口的快速增長和農(nóng)業(yè)的普及。黃河流域考古遺址和持續(xù)的森林砍伐數(shù)量迅速增加,表明兩次快速的人口增長開始于大約距今6000年前,并在距今5000-4500年加?。▓D2b,c)。這一時(shí)間線與本研究中漢藏語和藏緬語分家的估計(jì)時(shí)間一致。此外,漢藏語傳播可能與距今6000年后谷粟農(nóng)業(yè)的傳播有關(guān),這與“農(nóng)業(yè)和語言傳播”假說相一致。一系列考古證據(jù),如建筑形式、陶器的圖案和形狀,也顯示出沿著藏-彝走廊向南擴(kuò)散到川西和云南西部省份的連續(xù)波;這種擴(kuò)散可以追溯到仰韶、馬家窯和齊家文化(新石器時(shí)代到青銅時(shí)代期間馬家窯文化的延續(xù),大約距今4300-3500年)。特別是,距今5000年后,谷粟農(nóng)業(yè)的傳播主要發(fā)生在中國北方(特別是黃河流域)(補(bǔ)充資料,第2.5節(jié)),并沿著青藏高原邊緣向西部和南部擴(kuò)散。此外,根據(jù)之前的工作,我們對漢藏語進(jìn)行了起源地推測(擴(kuò)展數(shù)據(jù)圖7)。不過對于漢藏語言,起源地推測的前提條件并不滿足(補(bǔ)充資料,第2.7節(jié))。

雖然我們采用譜系樹模型來證明漢藏語系的血統(tǒng),但我們并不認(rèn)為漢藏語系的文化史確實(shí)是樹形的。人口遷移和漢藏語使用者之間的互動(dòng)是復(fù)雜的,并在很長一段時(shí)間內(nèi)發(fā)生。因此,漢藏語言之間的大量語言接觸可能發(fā)生在這些語言多樣化的早期階段,并可能一直持續(xù)到現(xiàn)在。這些接觸以前已知發(fā)生在漢藏語言之間,以及與周圍的南島語、侗臺語和苗瑤語之間(補(bǔ)充資料,第2.5、2.6節(jié))。不幸的是,我們還不能為識別這些影響提供具體的數(shù)據(jù),因此我們不能重建漢藏語言和其他語言家族之間的顯性遺傳關(guān)系。許多漢藏語言的描述仍然很差,這使得在歷史語言學(xué)中進(jìn)行明確的比較變得困難。因此,對漢藏語言演變的研究尚處于起步階段,需要更多的跨學(xué)科數(shù)據(jù)。為了明確地展示漢藏語言的演變,我們需要全面的考古調(diào)查和從古代DNA研究中獲得足夠的證據(jù)。

方法

沒有使用統(tǒng)計(jì)方法來預(yù)先確定樣本量。在實(shí)驗(yàn)和結(jié)果評估過程中,實(shí)驗(yàn)不是隨機(jī)的,研究者也沒有對分配視而不見。

詞根意義數(shù)據(jù)

根據(jù)一系列選擇標(biāo)準(zhǔn)(見補(bǔ)充資料,第1.1節(jié)),我們選擇了109個(gè)漢藏語言樣本,這些樣本在低級亞組中得到了很好的描寫。109種語言包括108種當(dāng)代語言和一種古代語言(上古漢語),它們的語言分支根據(jù)語言文字和民族語(補(bǔ)充表1)命名。根據(jù)Swadesh 100單詞表中的項(xiàng)目,我們在多種嚴(yán)格的選擇標(biāo)準(zhǔn)(補(bǔ)充信息,第1.1節(jié))下,從STEDT數(shù)據(jù)庫中整理了109種漢藏語言的949個(gè)詞根-含義。這些根含義被編碼為離散二進(jìn)制字符(補(bǔ)充表1;作為補(bǔ)充數(shù)據(jù)以nexus格式提供(文件名'109sinotibetanlanguage_swadesh100.nex'))。

譜系發(fā)生重建和分化時(shí)間估計(jì)

我們使用Beast2軟件(v.2.4.8)33和babel包建立了漢藏語言譜系樹,并估計(jì)了樹根的時(shí)間深度。babel包用于執(zhí)行語言分析(https://github.com/rbouckaert/babel)。Beast中不需要任何例外組;相反,Beast將對根位置以及樹中的其余節(jié)點(diǎn)進(jìn)行采樣。我們評估了兩個(gè)詞根-意義模型(連續(xù)時(shí)間馬爾可夫鏈(CTMC)和協(xié)變)、時(shí)鐘模型(嚴(yán)格和寬松的對數(shù)正態(tài)時(shí)鐘)和伽馬率異質(zhì)性的六個(gè)組合,其中一個(gè)或四個(gè)比率類別屬于CTMC模型(補(bǔ)充信息,第1.2節(jié))。因?yàn)樵谖覀兊姆治鲋胁⒉皇撬械恼Z言樣本都是當(dāng)代的,所以我們選擇合并貝葉斯天際線模型作為樹優(yōu)先模型。

為了估計(jì)漢藏語系的根年齡,我們根據(jù)已知的人類學(xué)和人口統(tǒng)計(jì)學(xué)證據(jù)以及歷史事件(補(bǔ)充表2,補(bǔ)充數(shù)據(jù)(文件名'binarycovation.releadclock.xml')對譜系樹進(jìn)行了校正。這些校準(zhǔn)用概率分布表示。根據(jù)之前工作中校準(zhǔn)的設(shè)置,我們選擇了兩種分布:涉及估計(jì)誤差系數(shù)均勻分布的可能日期的情況下的正態(tài)分布,以及評估發(fā)散時(shí)間潛在范圍的均勻分布。我們的目標(biāo)是獲得推斷的漢藏語言的譜系。因此,我們并沒有預(yù)先設(shè)置任何單系約束,即使它們是經(jīng)過良好證明的語言分支。

利用時(shí)鐘模型、站點(diǎn)模型和速率異質(zhì)性的六種組合分析詞根義數(shù)據(jù)集。我們對這6種組合進(jìn)行了5千萬代的測試,每5000代進(jìn)行一次采樣,結(jié)果得到了1萬棵樹的樣本。前10%的迭代被視為老化,并被丟棄。示蹤劑(v.1.6)35用于檢查自相關(guān)和收斂狀態(tài),并通過log10貝葉斯因子(補(bǔ)充信息,第2.1節(jié),補(bǔ)充表3)測試最佳擬合模型組合。使用Beast v.2.4.8中的TreeanNotator包生成最大clade可信度樹。

語言分化的速度估計(jì)和考古遺址數(shù)量的變化

為了估計(jì)語言分化的速度,我們在語言系統(tǒng)中應(yīng)用了一個(gè)滑動(dòng)窗口,從7000年前到現(xiàn)在。在每個(gè)窗口中,我們計(jì)算內(nèi)部節(jié)點(diǎn)的數(shù)量。每個(gè)內(nèi)部節(jié)點(diǎn)的平均高度是從給定的漢藏語言系統(tǒng)中獲得的(參見補(bǔ)充數(shù)據(jù)中的高度數(shù)據(jù)(文件名'109sino tibetan language.mcc.tree')。推拉窗的長度設(shè)定為500年,移動(dòng)步距設(shè)定為50年。利用這個(gè)估計(jì),我們得到了整個(gè)系統(tǒng)發(fā)育的節(jié)點(diǎn)數(shù)曲線。在Matlab 2015b中,使用作為平滑函數(shù)的局部加權(quán)散點(diǎn)圖平滑算法36對曲線進(jìn)行平滑處理,其中參數(shù)“平滑跨度”設(shè)置為0.1。

同樣,我們采用同樣的方法來計(jì)算考古遺址數(shù)量的變化,如圖2b、c所示。具體來說,我們調(diào)查了中國西北部(包括甘肅、青海、寧夏和陜西)和西南部(包括四川、云南和西藏自治區(qū))兩個(gè)地理區(qū)域的考古遺址數(shù)量。收集的考古遺址的數(shù)據(jù)來自先前的出版物(補(bǔ)充信息,第1.5節(jié))。在距今7000到2500年(移動(dòng)步驟設(shè)置為1)之間的每個(gè)時(shí)間點(diǎn),我們計(jì)算了覆蓋時(shí)間點(diǎn)的時(shí)間范圍內(nèi)的站點(diǎn)數(shù)量(補(bǔ)充數(shù)據(jù)(文件名“Matlab codes for estimation of Sino-Tibetan evolutionary tempo.zip”)。

(譯者:張濤   董慶進(jìn))

本文轉(zhuǎn)載自

本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊舉報(bào)。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
漢藏語言的“有聲之旅”
漢藏語系起源于北方還是南方?新研究:支持北方假說
藏語系的語言譜系圖
漢語、藏語、羌語、緬語等400多種東亞語言被認(rèn)為擁有共同的祖先語言,合稱為漢藏語系
大數(shù)據(jù)算出漢族第一個(gè)故鄉(xiāng)——復(fù)旦漢藏語系研究通俗版
漢語、藏語、緬甸語三語同源,上古漢藏緬三個(gè)民族是一家的嗎?
更多類似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服