天普大学Sudhir Kumar教授访问我室并做学术报告

2019年12月9日应陆剑研究员邀请,美国天普大学(Temple University) Sudhir Kmuar教授访问了北京大学蛋白质与植物基因重点实验室,并在金光生命科学楼邓祐才报告厅进行了题为“Molecular Evolution informs Genomic Medicine”的报告,讲座由陆剑研究员主持。

Sudhir Kumar教授任职于天普大学生物学系,并担任基因组学和进化医学研究所主任、Molecular Biology and Evolution杂志主编。其实验室致力于用分子进化和比较基因组学方法分析不同物种之间的亲缘关系和分歧时间,并将进化生物学方法应用于基因组医学研究,迄今发表170余篇文章,合计被引用超过17万次。其领导开发的MEGA软件累计引用已超15万次。

在当天的报告中, Kumar教授主要介绍了分子进化方法在基因组医学中的应用。人类外显子组中有大量的功能未知非同义单核苷酸变异(nSNV),预测这些nSNV对生物体的影响对解析人类遗传疾病至关重要。然而,当前已有的预测nSNV影响的软件包括Condel和polyphen-2的假阳性很高,尤其是在已知的富集疾病相关nSNV的超级保守位点。这是由于基因组中保守位点和不保守位点中的疾病相关突变的比例相差悬殊,这些方法将保守性不同的位点放在一起训练预测模型时很容易高估保守位点中疾病相关位点的比例。为此其课题组开发了EvoD算法,首先将nSNV根据所在位点的保守性分成不同组,在每组中分别考虑nSNV所在位点的进化速率和保守性以及所编码的氨基酸的化学性质来训练预测模型。与之前的方法相比,EvoD算法降低了疾病相关nSNV预测的假阳性率,并且在保守性不同的位点有相似的准确率。然而,EvoD算法仍然需要群体中的多态性数据以及已知的训练数据,然而很多时候我们很难获得理想的训练数据,并且一些低频的疾病相关突变可能很难在小群体中被检测到,为了解决这一问题,他们开发了不依赖于群体多态性数据和已知训练数据集的新算法。这一方法基于多物种氨基酸序列的比对,利用贝叶斯算法计算人类蛋白质序列中一个位点的不同氨基酸的进化概率(EP):一个等位基因所编码的氨基酸EP越低,即演化过程中越不可能出现,这个等位基因越有可能会导致人类疾病。EP可以用来区分中性的和与疾病相关的等位基因,跟其它需要更多数据的软件预测的结果有很高的一致性。另一方面,如果一个nSNV对应的氨基酸在演化过程中出现的概率很低 (EP<0.05)但在人类群体中的出现的频率反而较高(>0.05),这样的位点可能是受到正选择的位点。基于此,他们在人类群体中鉴定了超过18,000个Candidate Adaptive Polymorphism (CAP)位点,并通过多种方法排除了其它的可能解释,估计这其中至少有一半以上是真的适应性的位点。这些研究展现了如何用进化生物学方法对疾病相关的突变进行预测,为我们进行进化生物学研究并将发现与医学应用结合起来提供了范例。

Kumar教授还介绍了Molecular Biology and Evolution杂志的发展历史和审稿流程,并鼓励中国学者踊跃向该杂志投稿。