2021年12月23日,《分子生物学与进化》(Molecular Biology and Evolution)在线发表了复旦大学生命科学学院徐书华教授团队的研究成果“Genetic connections and convergent evolution of tropical indigenous peoples in Asia”。研究团队产生和收集了全球热带地区近1000例原住民的基因型数据(见图1),重点分析了来自南亚的安达曼群岛、东南亚的马来半岛和菲律宾群岛以及大洋洲的新几内亚岛的原住民全基因组测序数据,系统研究了人群的遗传关系、祖源构成和迁徙历史,并以深肤色为例探索人群适应性进化的遗传机制,为理解现代人类表型多样性产生和和演化机制研究提供了参考模型和典型案例。
图1 研究涉及的热带原住民人群分布
照片来源网站:https://www.gettyimages.in/,https://www.pinterest.com和https://www.vladivlad.com;部分照片由马来西亚UCSI大学Boon-Peng Hoh教授团队提供。
如果说现代人类的演化是一部辉煌的史书,那么东南亚必定是其中不可或缺的重要篇章。东南亚地处连结亚洲和大洋洲、印度洋和太平洋的交通要道,且人口稠密,聚集了世界上现存的大多数原住民族群。近年来,以东南亚为中心广泛分布的亚洲热带原住民族群逐渐引起了人类学、遗传学、考古学等领域学者的重视,成为研究现代人类跨时空迁徙、融合并不断适应新环境的复杂过程的重要突破口。在热带地区考古资源相对缺乏的情况下,原住民族群的研究对于回答现代人类起源和演化的几个关键问题具有重要意义。
问题一:现代人“走出非洲”的历程是怎样的?从非洲至亚洲的迁徙是如何发生的?
曾有学者推测,分布在安达曼群岛、马来半岛、菲律宾群岛和新几内亚岛的原住民可能代表了最早从非洲迁徙至亚洲的现代人的一支,但目前仍缺乏足够的证据支持。该研究团队发现,全球热带原住民族群的总体遗传关系与其地理分布密切相关,其中亚洲地区的族群在常染色体、线粒体DNA和Y染色体上均表现出较大的遗传差异和复杂的祖源构成。然而,有趣的是,研究人员在不同亚洲热带原住民族群中均检测到一个底层亚洲祖先成分(the basal Asian ancestry),该成分尤其富集在安达曼群岛、马来半岛、菲律宾群岛和新几内亚岛的原住民基因组中,而并不存在于亚洲之外的地区。通过与全球史前现代人和历史更为久远的古人(如尼安德特人和丹尼索瓦人)基因组对比,研究人员排除了该早期亚洲祖先成分来源于古人对现代人基因渗入的可能性,并且发现该成分在旧石器时代晚期(距今约5万年)的亚洲人中相对富集,并且随着古DNA样本测年推近而逐渐减少。该研究进一步构建了人群遗传混合模型,提出该成分最有可能是最早从非洲沿亚洲南部海岸线迁徙至东南亚和大洋洲地区的亚洲祖先人群的遗存(见图2)。根据早期亚洲祖先成分的人群分布规律,研究人员在不借助任何古DNA的情况下,从现有的亚洲热带原住民基因组中鉴定出代表该成分的基因片段,发现其可能与人群的毛发形态(如LIMS1基因)、骨骼发育(如COL24A1基因)等的适应性进化具有密切关联。
图2 早期亚洲祖先成分的全球分布以及由此推测的亚洲人群早期迁徙路线
问题二:现代人的环境适应性表型是如何产生的?某些非洲和亚洲热带原住民的“趋同表型”,如矮身材、深肤色、卷毛发、宽鼻翼等,是从共同祖先继承而来的特征,还是人群分化后各自演化而来?
该研究基于文献和数据库报道的1057个色素相关基因和其中包含的103个功能效应明确的位点,对其在全球人群中的遗传变异模式进行分析,归纳出几种可能的演化模型(见图3)。其一,来源于共同祖先的肤色相关变异在人群分歧后发生平行进化。分析显示,之前基于非洲人群的研究报道的绝大多数深肤色关联变异(如位于DDB1/DAK基因中的若干变异),在亚洲热带原住民人群中也以一定的频率存在,并且携带这类变异的单倍型为现代人中较为古老的类型,这表明前述亚洲早期祖先成分可能构成了该地区原住民人群深肤色表型的部分遗传基础。其二,人群分歧后在其各自的演化历程中分别获得相同的肤色相关变异,即趋同进化。一种可能的来源是独立发生的古人基因渗入事件,古人与亚洲热带原住民的遗传混合可能在后者基因组中重新引入了“走出非洲”时曾经丢失的深肤色相关变异(如与紫外线调控叶酸水平相关的MTHFD1基因);另一种可能的来源是独立发生的新发突变,例如多个亚洲热带原住民人群在参与紫外线诱导的DNA损伤修复的基因STK11上携带同一新发突变,虽然不同人群独立发生新发突变的概率较小,但就目前的分析无法完全排除其可能性。同样有趣的是,研究人员还发现了基因水平的趋同进化特征,即不同人群在同一基因的不同区域发生遗传适应,比如受古人基因渗入影响发生正选择的RAD18基因(参与紫外线诱导的DNA损伤修复)和受负选择影响的MC1R基因(参与多物种色素决定的著名基因)。本研究未涉及肤色表型数据分析,根据已知功能的基因变异和其人群分布规律来建立基因和表型的联系,这正体现了群体遗传和计算生物学的特点和优势。诚然,肤色的决定因素异常复杂,本研究构建的模型无法包揽所有场景与细节,但预期为今后更深入、更精细的机制和功能研究提供理论依据。
图3 深肤色相关基因变异的遗传演化模型
本研究工作由复旦大学徐书华教授团队和马来西亚USCI大学Boon-Peng Hoh教授团队共同完成。复旦大学生命科学学院青年研究员邓恋博士和博士生潘雨闻(中国科学院上海营养与健康研究所)为本文共同第一作者;徐书华教授为该文通讯作者。复旦大学生命科学学院为第一单位与通讯作者单位。
该项工作得到了国家自然科学基金委、中国科学院、英国皇家学会牛顿基金、国家重点研发计划、上海市科委、马来西亚高等教育部和科技创新部等多项基金的资助,同时得到马来西亚原住民事务单位的支持。特别致谢为本研究提供样本的马来西亚单位和志愿者!