苏晓东课题组揭示短序列锚定元件AE在DNA与蛋白质结合中的重要作用
转录因子(TFs)作为基因表达的“指挥家”,通过与双链DNA(dsDNA)上的特定序列——转录因子结合位点(TFBS)结合,来调控基因的转录。早期TF与dsDNA的结合序列的确定实验是由DNA酶切的“足迹”(Foot-printing)法获得。借助此办法,科学家发现了很多不同DNA结合序列,即Motifs。 随着基因组学的发展,成千上万个TFs已被确定出来。如何高效、准确地识别和刻画TF的TFBS,特别是理解这些不同的TFs是如何快速靶向其特异结合位点,一直是分子生物学家探索的难题之一。科学家相继开发了ChIP-seq方法及其多种现代版本、SELEX 及其HT-SELEX (high-throughput systematic evolution of ligands by exponential enrichment)方法和PBM (protein binding microarray)以及各种Kitomo单分子实验等等体内和体外实验方法来探索该问题。 在计算方面,通常采用位置权重矩阵(PWM)来描述和计算TFBS Motif的特征,但PWM方法假设碱基间相互独立,得到Motif(通常长度在8‑10 bp)受实验方法和序列比对的影响并不一致,且该方法只能从序列的角度总结TF的特异性结合规律,无法从物理机制角度来解释TF如何高效识别并结合到目标位点。近年来的多项研究表明,TF在基因组中的搜索过程可能受到TFBS周围重复简并序列的引导。基因组中普遍存在的短串联重复序列(STRs;2‑6个碱基对的串联重复)在转录调控中也发挥着作用。然而,这些DNA结合方式的具体机制细节仍不清晰,也很难用传统的Motif概念来解释。
2025年3月26日,基因功能研究与操控全国重点实验室、北京大学生物医学前沿创新中心(BIOPIC)/生命科学学院苏晓东课题组在Advanced Science上发表了题为DNA–Protein Binding is Dominated by Short Anchoring Elements的研究论文。该研究揭示了TF与DNA结合时短序列(3-4个碱基对)起到主导作用,并将该短序列命名为锚定元件(Anchoring Elements, AEs)。论文还指出AE的密度(AED)能够吸引相应TF并促进其进一步搜索并结合到其TFBS上。
研究团队此前已经基于二代深度测序技术(NGS)开发了一种全面测量热平衡态下TF与所有可能的DNA序列的结合能力的实验方法KaScape(Chen, H., Xu, Y., Jin, J. et al.Sci Rep 13, 16595 (2023))。本研究进一步以拟南芥WRKY1和人类PU.1等转录因子为模型,利用KaScape方法系统分析了TF与DNA的结合特性。研究发现,结合能力较强的序列中均含有一段共有的3-4个碱基对的短序列且只要含有该短序列,其结合能力均较强,这说明该短序列在TF与DNA的结合中起决定性作用。由此,本研究将该短序列命名为锚定元件(Anchoring Element;AE)。拟南芥WRKY1的AE为GAC/GTC(GAC和GTC为反向互补序列),而人类PU.1的AEs为GGAA/TTCC(GGAA和TTCC为反向互补序列)。为了进一步验证AEs的作用,研究团队开发了AEEscape算法。该算法能够计算随机序列区域每个位置的k-mer结合能量,将PWM从1-mer拓展到了k-mer。该算法发现,以WRKY为例,当短序列长度为2时,各个位置的2-mer结合能全景图不一致;当短序列长度为3时,各个位置的结合能全景图类似,GAC或者GTC在随机区域的各个位置的结合能力均最强;当短序列长度为4时,随机区域各个位置的结合能力最强的那些4-mer序列均含有GAC或者GTC。以上分析客观系统地说明了AE是TF与DNA结合时的最核心、最基本的元件。本研究随后使用AEEscape算法得到的k-mer能量全景图预测了基因组中TFBS区域的能量谱,发现在TFBS区域存在“能量漏斗”现象,该现象的存在说明TFBS周围的序列能够帮助TF快速搜索到其目标位点。进一步研究发现,该现象与TFBS附近AE的密度有关。
图1. WRKY1 N端DNA结合结构域(WRKY1N)与DNA的复合物结构(6j4e.pdb)。WRKY1N覆盖的区域(Foot-printing or Motif region)用蓝色双箭头标出,结合时起主导作用的的短DNA序列Anchoring Element(AE)对应的碱基由蓝框标注。两条DNA链分别标注为Watson strand和Crick strand。对于WRKY1N来说,其主要与Crick strand上的GTC(AE)相互作用。
为了探究AE的广泛存在性,本研究还进一步分析了公共数据库中相应TF的PBM数据。结果发现了非常有趣的相似现象,验证了AE的广泛存在性。本研究中鉴定的AEs与DNA-蛋白质复合物结构研究中描述的“核心序列”很好对应(图1),复合物结构可以解释结构的稳定性及相互作用的细节,但是目前的计算方法还无法很好得到结合能,因而不能确切鉴定到最小相互作用单元的必要的核心序列。这些核心序列代表了参与静电、氢键、范德瓦尔斯等相互作用的关键碱基。这些相互作用对于DNA与TF结合的热力学稳定性和“特异性”至关重要,只要这些“核心”碱基存在于实验的序列中,KaScape方法即可以将其拉下来(pull-down), 因此,与本研究中的AEs类似,这些“核心序列”较短,一般远小于Motif长度。综上所述,AE可以被视为负责TF结合的最小结构(序列)单元,也表明构成AE的短k-mer序列与TF相互作用时,应被视为一个整体,而不是独立的碱基。由于仅从复合物结构无法准确计算出结合能,基于结构来定义“核心序列”具有一定的主观性和随意性,而KaScape实验的pull-down富集结果客观地得到了这些“核心序列”在DNA结合机制中起关键作用的客观而重要的结论。
这项研究不仅为TF与DNA结合的分子机制提供了全新的视角,还为基因表达的调控研究开辟了新的方向,为未来设计基因调控工具和开发基因治疗策略提供了重要的理论基础。陈红博士为论文的第一作者。北京大学生物医学前沿创新中心/生命科学学院苏晓东教授为该论文的通讯作者。研究团队未来将进一步探索AEs在更复杂生物系统中的作用,例如在染色质环境下TF与核小体DNA的相互作用,以及多TF协同调控基因表达的机制。这些研究将有助于更深入地理解基因调控的复杂性,并为生物信息学、精准医学和合成生物学提供新的工具和方法。
论文链接: https://advanced.onlinelibrary.wiley.com/doi/10.1002/advs.202414823
- 白洋团队联合多位顶尖科学家系统解析根际微生物组调控水稻分蘖的功能与机制2025.04.24
- 瞿礼嘉/钟声课题组发现植物传粉过程中“未雨绸缪”的“两步授粉”备份新机制,为作物逆境下的育性优化提供新思路2025.04.15
- 曾虎课题组应邀撰写综述:空间组学技术的研究进展2025.04.06
- 张迪课题组受邀综述蛋白质L-乳酰化的研究进展2025.04.04
- 苏晓东课题组揭示短序列锚定元件AE在DNA与蛋白质结合中的重要作用2025.03.31
- 魏文胜团队实现人类肿瘤免疫调控网络的单碱基精度解析2025.03.21
- 白洋团队构建全球首个作物根际"细菌+病毒"基因组数据库2025.03.13
- 季雄团队揭示RNA聚合酶亚基RPB7偶联磷酸酶CTDP1稳定Pol II并介导转录再起始2025.03.05
- 何爱彬团队利用全景单细胞组蛋白修饰实现胚胎发育谱系追踪2025.03.04
- 赵进东课题组揭示蓝细菌藻胆体与光系统II结合的新分子机制2025.02.17
- 高歌课题组提出面向大规模异质性空间转录组学切片的表征与解析新方法2025.02.12
- 周岳课题组揭示拟南芥雄性生殖细胞发育过程中染色质三维结构的动态变化过程及其重要作用2025.02.12
- 魏文胜团队发布新一代线粒体碱基编辑器助力建立疾病动物模型2025.01.23
- 贺新强课题组揭示木质部管状分子发育的microRNA调控网络2025.01.19
- 周岳课题组在Genome Biology发文揭示了拟南芥中启动子空间调控模式和喷泉结构形成机制2025.01.02
- 高歌课题组提出人类转录调控元件建模与相关非编码变异功能解析方法2025.01.02
- 魏文胜团队利用碱基编辑器筛选绘制DNA损伤应答功能元件图谱2024.12.16
- 秦跟基课题组揭示弱光下种子萌发调控新机制2024.12.05
- 刘启昆课题组开发了全新的植物细胞谱系追踪工具2024.11.26
- 周岳课题组揭示植物首个三维基因组结构蛋白及其调控机制2024.11.22
- 周岳课题组揭示植物特有的PWWP结构域蛋白调控基因表达的分子机制2024.11.22
- 国家重点实验室陈雪梅教授获得2024年度“求是杰出科学家奖”2024.11.08
- 秦跟基课题组应邀撰写品牌综述“Tansley insight”总结TCP转录因子在细胞器、细胞和器官命运决定中的重要功能2024.10.28
- 郑晓峰课组揭示USP1-ATF4-CD98hc调控ENKTL淋巴瘤患者耐药的新机制2024.09.30
- 肖俊宇课题组揭示IgM–CD5L复合物的分子机制2024.09.30
- 陆剑课题组揭示密码子使用偏好性对翻译调控的影响2024.09.30
- 魏文胜团队实现蛋白质组中丝氨酸、苏氨酸和酪氨酸位点的功能解析2024.09.24
- 王继纵/邓兴旺课题组合作解析植物光敏色素phyB光信号转导的机制2024.09.24
- 刘君/杨雪瑞课题组合作揭示m6A-cenRNA调控癌细胞着丝粒稳态的机制2024.09.23
- 伊成器教授荣获2024年“科学探索奖”2024.08.29
- 王伟课题组报道蛋白酶体调控SG稳态抵御高温胁迫的新机制2024.08.22
- 肖俊宇团队阐明IgE 高亲和力受体FcεRI 复合物的组装机制2024.08.22
- 朱玉贤院士团队发布首个棉花基因组完整图谱,阐述棉族独特折叠胚胎形成的分子与演化机制2024.08.16
- 李晴课题组报道了滞后链核小体组装和冈崎片段成熟的协同机制2024.08.13
- 魏文胜团队报道非脱氨酶依赖的嘧啶碱基编辑器TBE2024.08.03
- 李晴研究组与合作者报道真核DNA复制体介导的亲本组蛋白表观遗传信息继承新机制2024.08.02
- 张迪课题组与合作者共同报道区分蛋白质乳酰化修饰同分异构体的新方法2024.07.22
- 国际遗传工程和生物技术中心(ICGEB)总干事Lawrence Banks教授一行访问陆剑课题组2024.06.26
- 郭强课题组与合作者揭示Synaptophysin调控突触小泡生成与功能的机制2024.06.06
- 2024年全国科技周开放活动2024.05.28
- 李磊课题组解析miR408平衡植物生长和抗旱的分子机制2024.05.16
- 李晟课题组与合作者研究揭示华北地区华北豹栖息地及其景观连通性现状2024.05.06
- 陆剑课题组揭示黑腹果蝇演化历史和环境适应机制2024.04.19
- 李川昀课题组在WIRES RNA发表从头起源新基因起源特征的综述2024.04.16
- 秦跟基课题通过构建拟南芥十二重突变体揭示雌蕊顶端命运决定的分子机制2024.04.08
- 李川昀课题组与合作者揭示结构变异编码人脑特异发育的新机制2024.04.07
- 肖俊宇课题组阐明磷酸化酶激酶PhK的组装与激活机制2024.04.01
- 陆剑课题组研发SIRSVIDE模型解析病毒进化动态2024.03.28
- 陈雪梅课题组鉴定了一个新的非典型帽子修饰RNA(NAD-capped RNA)脱帽酶,揭示了NAD+帽子修饰参与基因表达调控的新机制2024.03.18
- 祝贺瞿礼嘉教授成果入选 2023 年度“中国生命科学十大进展”2024.03.08
- 李晴、高宁及合作者揭示亲本组蛋白在DNA复制叉回收的关键分子机制2024.03.07
- 伊成器课题组开发升级版RNA编辑技术RESTART v32024.03.06
- 魏文胜课题组揭示肿瘤逃逸非HLA-I类分子依赖多效型T细胞杀伤的新机制2024.02.21
- 秦跟基课题组与合作者揭示水稻花药适时开裂的分子机制2024.02.21
- 陆剑课题组发表综述探讨新冠病毒刺突蛋白的功能演化2024.02.20
- 李磊课题组与合作者揭示巨胞饮的转录调控机制2024.02.19
- 焦雨铃课题组与合作者完成首个多细胞植物染色体的部分设计与合成2024.01.27
- 伊成器和合作者报道m1A修饰酶在调控造血干细胞衰老过程中的新机制2024.01.18
- 陆剑课题组与合作者共同揭示猴痘病毒蛋白质序列和密码子使用的分子演化规律2023.12.15
- 陆剑课题组与合作者发表综述总结动物microRNA调控的趋同和趋异演化2023.11.24
- 魏文胜团队实现人类蛋白质组中赖氨酸位点的功能解码2023.11.23
- 张蔚课题组受邀撰写综述揭示蝶翅花纹的演化创新模式2023.11.22
- 郭强课题组和杨竞课题组合作阐释粒细胞(granulocytes)细胞核分叶的全新分子机制2023.11.21
- 王忆平课题组在创建稳定高效联合固氮系统方面取得了突破性进展2023.11.20
- 高歌课题组提出跨平台、多模态空间组学比对与整合方法2023.11.13
- LEAPER 2.0在非人灵长类动物和人源化小鼠中实现了高效精准的长时RNA编辑2023.10.25
- 李川昀、刘颖团队建立单碱基分辨率鉴定DNA 6mA修饰的新方法,揭示真核生物6mA促进转录的新机制2023.10.23
- 又一教科书级的重大突破!瞿礼嘉/钟声课题组揭示植物通过有性生殖实现远缘杂交的新机制2023.10.08
- 王忆平研究团队与合作者成功创制2.0版多聚蛋白型固氮酶系统,为实现真核系统自主固氮迈进坚实的一步2023.09.18
- 秦跟基课题组揭示高温下植物种子前身胚珠命运的保护机制2023.09.15
- 焦雨铃课题组与合作者发现蛋白相分离调控植物茎分生组织活性2023.09.12
- 罗述金团队古DNA研究揭示中国是虎演化史上基因大熔炉2023.09.01
- 王伟课题组及合作者报道酚酸类化感物质通过促进相变抑制翻译从而调控物种间竞争的新机制2023.08.29
- 国家重点研发计划“病原变异及其跨物种传播的回溯和演进方法体系构建”项目推进会暨专家研讨会在北京大学成功召开2023.08.18
- 王继纵课题组与邓兴旺课题组合作揭示植物远红光受体phyA高度光敏感性的分子机制2023.07.28
- 赵进东、高宁、翁羽翔课题组合作揭示了CpcL藻胆体能量传递机制2023.07.10
- 郑晓峰课题组揭示乙酰转移酶ESCO2通过稳定Cohesin复合物促进NHEJ修复的作用和机制2023.07.10
- 伊成器课题组综述mRNA上非m6A修饰的调控与功能2023.07.04
- 郑晓峰课题组揭示SUMO化修饰通过调控液-液相分离来影响NHEJ修复效率和肿瘤细胞耐药的分子机制2023.07.03
- 郭强课题组开发适用于组织样品原位结构研究的方法2023.06.16
- 张蔚课题组综述以山地蝶类为体系开展生物多样性研究的进展2023.06.12
- 陆剑课题组与合作者揭示新冠病毒密码子演化规律并提出mRNA疫苗优化策略2023.06.05
- 张蔚课题组和合作者开发基于深度学习的基因渐渗推断方法2023.06.01
- 高歌课题组提出基因丢失鉴定新方法2023.05.29
- 2023年全国科技周开放活动2023.05.28
- 魏文胜课题组报道新型线粒体碱基编辑器2023.05.23
- 刘启昆课题组解析DDR4-ISWI染色质重塑复合体调控基因弹性表达的分子机制2023.05.23
- 张蔚课题组揭示动物不完美拟态的生态学意义2023.05.18
- 肖俊宇研究组发现恶性疟原虫演化出多种“劫持”IgM的分子机制2023.05.09
- 白书农课题组与合作者组织众筹,构建研究植物生活周期核心形态建成过程的模式植物2023.04.25
- 白书农课题组对于有关葫芦科CRC在单性花发育中调控功能的研究论文发表观点评论2023.04.25
- 王伟课题组与合作者开发新型新冠病毒检测分型传感器2023.04.21
- 周岳课题组阐述BMI1和组蛋白H2A单泛素化对拟南芥三维基因组的调控作用2023.04.19
- 陆剑课题组揭示冠状病毒Spike蛋白演化规律2023.04.17
- 李磊课题组揭示孢粉素聚合的分子机制2023.03.31
- 何跃辉团队揭示植物“越冬记忆”形成的分子与表观遗传机制2023.03.23
- 肖俊宇研究组阐明免疫球蛋白IgM被特异性受体FcμR识别的分子机制2023.03.23
- 钟上威团队揭示植物光温受体phyB的入核调控机制2023.03.17
- 高歌课题组成果入选2022年度“中国生物信息学十大进展”2023.03.06
- 遇赫课题组与合作者共同揭示冰期前后欧洲狩猎采集人群的遗传历史2023.03.02