李川昀课题组在WIRES RNA发表从头起源新基因起源特征的综述

2024年4月13日,北京大学蛋白质与植物基因研究国家重点实验室、北京大学未来技术学院李川昀团队应邀在WIREs RNA发表了题为“Origin of FunctionalDe NovoGenes in Humans from “Hopeful Monsters””的综述文章(http://dx.doi.org/10.1002/wrna.1845),系统综述了人类从头起源新基因(de novo gene)的鉴定与分子特征,阐明了其起源过程,并系统定义了这类新基因起源的前体(“hopeful monsters”)。随后,讨论了这类全新的基因如何与原有基因调控网络整合,在人脑发育、肿瘤发生等复杂生物过程中发挥功能。

探究人类特有基因是否作为人类特有性状的遗传基础,参与编码人类高级智能,已成为最引人入胜的科学问题之一。长期以来,人们认为新基因主要通过基因复制(gene duplication)产生,而近年的研究发现新基因同样可以从头模式,起源于非编码区域,且在起源伊始即具备了生物学功能。本综述首先总结了de novo基因鉴定的原则:1、其编码的全新开放阅读框仅存在于一个物种中,这个全新的ORF与任何已知的蛋白质没有同源性(图1a);2. 该全新的ORF在特定的物种中需要有转录与翻译证据,并在多个外类群中存在“common disabler”,以排除基因丢失模型(图1b)。

图1.de novo基因的鉴定标准

通过比较de novo基因与保守编码基因、非编码RNA的序列特征、基因组分布、表达谱等,发现de novo基因优先起源自特定的前体 (“hopeful monsters”)。由于这些预适应特征(preadapation),这些新基因表现出起源即有功能的特征。该综述文章对这些“hopeful monsters”的特征进行了系统总结,并探讨了转录本出核屏障、翻译降解屏障在促成上述预适应特征中的贡献(图2)。

图2.de novo新基因前体的主要特征

2023年,李川昀课题组与胡宝洋课题组合作,发现并验证了两例人类新近起源的de novo基因在人脑发育中的功能。同时,近年来,也有研究将部分de novo基因与肿瘤联系起来,如NCYM、CLLU1、PART-1、PBOV1和GR6。该综述系统讨论了de novo基因在人脑发育和肿瘤发生中的功能,并对未来的功能研究进行了展望。

李川昀实验室自2011年成立,以恒河猴为特色模型探究人脑特异发育的分子基础。研究以多组学数据挖掘、机器学习算法开发与解析、新模型建立与机制发现为主线,解决了恒河猴研究的多个技术瓶颈,为运用其人类近缘特色开展精准的演化与机制研究奠定了基础。据此,准确鉴定人类特有新基因、新调控,提出新模型探究其起源与演化规律,并通过开展多层次实验研究,阐明新基因、新调控促进人脑增大、提升认知功能的新机制,以通讯作者在Nature Ecology & Evolution、Science Advances、PNAS、Genome Biology等发表论文22篇,工作多次被Science等专题评论。该综述文章基于这些前期工作,对新基因起源与功能进行了系统总结与展望。

北京大学未来技术学院博士生刘笑歌、肖淳夫为本文共同第一作者。北京大学未来技术学院李川昀教授和安妮副研究员、北京脑科学与类脑研究所张力研究员、美国石溪大学文艺复兴医学院Nicholas Delihas研究员为本文共同通讯作者。本研究受到国家重点研发计划、国家自然科学基金委、北京脑科学与类脑研究所的经费支持。