高歌团队开发长非编码RNA全面注释平台AnnoLnc2
长非编码RNA(Long noncoding RNAs,lncRNA)是一类新型调控分子,近期研究发现其在从胚胎发育到肿瘤发生等多种生理病理过程中发挥核心调控作用(1–5)。因此,随着越来越多的长非编码RNA被鉴定(6, 7),一批计算工具应运而生,为生物学家预测lncRNA的GO功能和调控网络(8)、亚细胞定位(9)(10)、乃至lncRNA-RNA(11)、lncRNA-蛋白(12)相互作用等提供了重要的工具。然而,这些工具仅支持从单一角度对长非编码RNA进行注释,难以涵盖lncRNA的功能全谱。
2016年,北京大学高歌课题组开发了长非编码RNA在线注释平台AnnoLnc(13),基于700多套高通量数据和先进的计算流程实现了对任意人类长非编码RNA从序列结构到进化模式的全面注释。作为国际首个长非编码RNA在线注释平台,AnnoLnc自2016年11月正式上线以来已成为相关领域的主流工具,支撑了来自全球5万余用户提交的近7千万条序列分析,并获邀为SpringNatureMethods in Molecular Biology系列丛书撰写专题介绍章节。
日前,高歌课题组在此基础上全面更新升级了AnnoLnc平台。新版本AnnoLnc2整合了十个注释模块(图1),注释内容涵盖了序列和结构、表达和调控、功能和相互作用、以及演化和遗传关联,为研究长非编码RNA的功能及其作用机制提供了高效、全面的分析平台,并为后续的生物学研究提供了重要的线索。例如,演化模块的注释结果可以揭示长非编码RNA是否具有保守的功能(14);亚细胞定位模块的注释结果可以揭示它们在何处发挥功能(15);功能富集模块的注释结果可以揭示它们发挥怎样的功能(16);miRNA调控和蛋白相互作用模块的注释结果可以揭示潜在的功能机制(17, 18)等。
图1. AnnoLnc2框架
AnnoLnc2网站操作便捷。用户仅需上传或者输入待分析的序列,选择相应物种,即可进行一键式分析(图2A)。每条序列的注释结果均有一个对应的网页界面,各模块的注释结果以交互式的图表的形式展示,以便用户检索感兴趣的条目。用户可批量下载所有的注释结果(图2B)以用于后续研究。与AnnoLnc1相比,AnnoLnc2首次对小鼠长非编码RNA提供了全面支持。
图2. AnnoLnc2网页界面。用户可通过一个三步骤的操作运行AnnoLnc2(A),并查看详细的注释结果,以及批量下载所有的注释结果(B)。
为了满足批量分析的需求,AnnoLnc2还为用户提供了可进行大规模线下分析的单机版本(下载链接:http://annolnc.gao-lab.org/download.php)。该单机版不仅包含了在线版本的全部功能,还支持自定义模块和自定义注释数据,用户可以基于自产数据(如RNA-seq数据)指定感兴趣的模块进行批量分析。
相比于AnnoLnc,AnnoLnc2整合了更多的注释资源。其中,表达模块可支持对目标序列在96个人类RNA-seq样本(涵盖26个组织,39个癌细胞系和2个正常细胞系)或69个小鼠RNA-seq样本(涵盖28个组织和7个细胞系)中的表达进行实时计算;转录调控模块整合了来自1339个人类转录因子和738个小鼠转录因子的结合位点;蛋白相互作用模块整合了来自188个人类RNA结合蛋白和62个小鼠RNA结合蛋白的结合位点。此外,AnnoLnc2还整合了一个新的注释模块-亚细胞定位,该模块可报告长非编码RNA的核质定位,以及已知的定位信号在目标序列中的分布。详细的数据介绍可参见http://annolnc.gao-lab.org/help.php#link-update。
该研究于2020年5月14日以AnnoLnc2: the one-stop portal to systematically annotate novel lncRNAs for human and mouse为题在线发表于Nucleic Acids Research。PTN项目博士生柯岚、杨德昌为共同第一作者,北京大学生物医学前沿创新中心(BIOPIC)/北京未来基因诊断高精尖创新中心(ICG)、生物信息中心(CBI)暨蛋白质与植物基因研究国家重点实验室高歌研究员为通讯作者,王宇、丁阳等合作者在平台构建和文章写作方面作出贡献。该研究得到国家重点研发计划,ICG和蛋白质与植物基因研究国家重点实验室的支持和资助。
AnnoLnc2网址:http://annolnc.gao-lab.org/
原文链接:https://doi.org/10.1093/nar/gkaa368
参考文献
1. Batista,P.J. and Chang,H.Y. (2013) Long noncoding RNAs: Cellular address codes in development and disease.Cell,152, 1298–1307.
2. Wapinski,O. and Chang,H.Y. (2011) Long noncoding RNAs and human disease.Trends Cell Biol.,21, 354–361.
3. Faghihi,M.A., Modarresi,F., Khalil,A.M., Wood,D.E., Sahagan,B.G., Morgan,T.E., Finch,C.E., St. Laurent,G., Kenny,P.J. and Wahlestedt,C. (2008) Expression of a noncoding RNA is elevated in Alzheimer’s disease and drives rapid feed-forward regulation of β-secretase.Nat. Med.,14, 723–730.
4. Mourtada-Maarabouni,M., Pickard,M.R., Hedge,V.L., Farzaneh,F. and Williams,G.T. (2009) GAS5, a non-protein-coding RNA, controls apoptosis and is downregulated in breast cancer.Oncogene,28, 195–208.
5. Gupta,R.A., Shah,N., Wang,K.C., Kim,J., Horlings,H.M., Wong,D.J., Tsai,M.-C., Hung,T., Argani,P., Rinn,J.L.,et al.(2010) Long non-coding RNA HOTAIR reprograms chromatin state to promote cancer metastasis.Nature,464, 1071–1076.
6. Frankish,A., Diekhans,M., Ferreira,A.M., Johnson,R., Jungreis,I., Loveland,J., Mudge,J.M., Sisu,C., Wright,J., Armstrong,J.,et al.(2019) GENCODE reference annotation for the human and mouse genomes.Nucleic Acids Res.,47, D766–D773.
7. Jiang,S., Cheng,S.-J., Ren,L.-C., Wang,Q., Kang,Y.-J., Ding,Y., Hou,M., Yang,X.-X., Lin,Y., Liang,N.,et al.(2019) An expanded landscape of human long noncoding RNA.Nucleic Acids Res.,47, 7842–7856.
8. Zhou,J., Huang,Y., Ding,Y., Yuan,J., Wang,H. and Sun,H. (2018) lncFunTK: a toolkit for functional annotation of long noncoding RNAs.Bioinformatics,34, 3415–3416.
9. Cao,Z., Pan,X., Yang,Y., Huang,Y. and Shen,H.-B. (2018) The lncLocator: a subcellular localization predictor for long non-coding RNAs based on a stacked ensemble classifier.Bioinformatics,34, 2185–2194.
10. Su,Z.-D., Huang,Y., Zhang,Z.-Y., Zhao,Y.-W., Wang,D., Chen,W., Chou,K.-C. and Lin,H. (2018) iLoc-lncRNA: predict the subcellular location of lncRNAs by incorporating octamer composition into general PseKNC.Bioinformatics,34, 4196–4204.
11. Li,J., Ma,W., Zeng,P., Wang,J., Geng,B., Yang,J. and Cui,Q. (2015) LncTar: a tool for predicting the RNA targets of long noncoding RNAs.Brief. Bioinform.,16, 806–12.
12. Zhang,W., Yue,X., Tang,G., Wu,W., Huang,F. and Zhang,X. (2018) SFPEL-LPI: Sequence-based feature projection ensemble learning for predicting LncRNA-protein interactions.PLOS Comput. Biol.,14, e1006616.
13. Hou,M., Tang,X., Tian,F., Shi,F., Liu,F. and Gao,G. (2016) AnnoLnc: a web server for systematically annotating novel human lncRNAs.BMC Genomics,17, 931.
14. Ponjavic,J., Ponting,C.P. and Lunter,G. (2007) Functionality or transcriptional noise? Evidence for selection within long noncoding RNAs.Genome Res.,17, 556–65.
15. Zhang,K., Shi,Z.M., Chang,Y.N., Hu,Z.M., Qi,H.X. and Hong,W. (2014) The ways of action of long non-coding RNAs in cytoplasm and nucleus.Gene,547, 1–9.
16. Guttman,M., Amit,I., Garber,M., French,C., Lin,M.F., Feldser,D., Huarte,M., Zuk,O., Carey,B.W., Cassady,J.P.,et al.(2009) Chromatin signature reveals over a thousand highly conserved large non-coding RNAs in mammals.Nature,458, 223–7.
17. Yoon,J.-H., Abdelmohsen,K. and Gorospe,M. (2014) Functional interactions among microRNAs and long noncoding RNAs.Semin. Cell Dev. Biol.,34, 9–14.
18. Castello,A., Fischer,B., Eichelbaum,K., Horos,R., Beckmann,B.M., Strein,C., Davey,N.E., Humphreys,D.T., Preiss,T., Steinmetz,L.M.,et al.(2012) Insights into RNA biology from an atlas of mammalian mRNA-binding proteins.Cell,149, 1393–406.
- 苏晓东课题组揭示清道夫受体CD163识别底物的分子机制2025.07.23
- 陈雪梅课题组系统阐释植物miRNA成熟与功能调控机制2025.07.23
- 苏晓东课题组与合作者揭示AAV与新型受体(AAVR2)结合的分子机制2025.07.15
- 合成植物基因组2025.07.09
- 伊成器课题组与合作者建立RNA"暗码",升级生命语言2025.07.04
- 魏文胜团队系统揭秘人类基因组中“沉默突变”的功能性“低语”2025.06.26
- 肖俊宇团队与张永辉团队合作揭示嗜乳脂蛋白激活γδ T细胞的“分子钳”机制2025.06.12
- 昌增益课题组揭示蛋白质内源性(顺式)去组装元件调控细菌细胞分裂环(Z环)的动态形成2025.06.09
- 陆剑课题组揭示uORF在动物进化与发育中发挥“翻译减震器”调控作用的新机制2025.06.09
- 张蔚课题组与合作者揭示兰花螳螂程序性体色转变的分子机制及生态学意义2025.05.30
- 2025年“全国科技活动周”和“全国科技工作者日”活动2025.05.29
- 李川昀团队与合作者开发细胞通讯分析工具STCase,揭示肿瘤微环境中空间特异性通讯事件2025.05.29
- 伊成器课题组系统阐释假尿嘧啶修饰的功能与治疗应用新范式2025.05.27
- 瞿礼嘉/钟声团队应邀撰写被子植物雌-雄相互作用保证双受精成功综述2025.05.26
- 陆剑课题组与合作者共同揭示uORFs通过精细调节CLOCK蛋白的翻译参与果蝇昼夜节律及睡眠行为的调控机制2025.05.16
- 伊成器团队发展痕量样品m6A修饰定量测序方法2025.05.08
- 白洋团队联合多位顶尖科学家系统解析根际微生物组调控水稻分蘖的功能与机制2025.04.24
- 瞿礼嘉/钟声课题组发现植物传粉过程中“未雨绸缪”的“两步授粉”备份新机制,为作物逆境下的育性优化提供新思路2025.04.15
- 曾虎课题组应邀撰写综述:空间组学技术的研究进展2025.04.06
- 张迪课题组受邀综述蛋白质L-乳酰化的研究进展2025.04.04
- 苏晓东课题组揭示短序列锚定元件AE在DNA与蛋白质结合中的重要作用2025.03.31
- 魏文胜团队实现人类肿瘤免疫调控网络的单碱基精度解析2025.03.21
- 白洋团队构建全球首个作物根际"细菌+病毒"基因组数据库2025.03.13
- 季雄团队揭示RNA聚合酶亚基RPB7偶联磷酸酶CTDP1稳定Pol II并介导转录再起始2025.03.05
- 何爱彬团队利用全景单细胞组蛋白修饰实现胚胎发育谱系追踪2025.03.04
- 赵进东课题组揭示蓝细菌藻胆体与光系统II结合的新分子机制2025.02.17
- 高歌课题组提出面向大规模异质性空间转录组学切片的表征与解析新方法2025.02.12
- 周岳课题组揭示拟南芥雄性生殖细胞发育过程中染色质三维结构的动态变化过程及其重要作用2025.02.12
- 魏文胜团队发布新一代线粒体碱基编辑器助力建立疾病动物模型2025.01.23
- 贺新强课题组揭示木质部管状分子发育的microRNA调控网络2025.01.19
- 周岳课题组在Genome Biology发文揭示了拟南芥中启动子空间调控模式和喷泉结构形成机制2025.01.02
- 高歌课题组提出人类转录调控元件建模与相关非编码变异功能解析方法2025.01.02
- 魏文胜团队利用碱基编辑器筛选绘制DNA损伤应答功能元件图谱2024.12.16
- 秦跟基课题组揭示弱光下种子萌发调控新机制2024.12.05
- 刘启昆课题组开发了全新的植物细胞谱系追踪工具2024.11.26
- 周岳课题组揭示植物首个三维基因组结构蛋白及其调控机制2024.11.22
- 周岳课题组揭示植物特有的PWWP结构域蛋白调控基因表达的分子机制2024.11.22
- 国家重点实验室陈雪梅教授获得2024年度“求是杰出科学家奖”2024.11.08
- 秦跟基课题组应邀撰写品牌综述“Tansley insight”总结TCP转录因子在细胞器、细胞和器官命运决定中的重要功能2024.10.28
- 郑晓峰课组揭示USP1-ATF4-CD98hc调控ENKTL淋巴瘤患者耐药的新机制2024.09.30
- 肖俊宇课题组揭示IgM–CD5L复合物的分子机制2024.09.30
- 陆剑课题组揭示密码子使用偏好性对翻译调控的影响2024.09.30
- 魏文胜团队实现蛋白质组中丝氨酸、苏氨酸和酪氨酸位点的功能解析2024.09.24
- 王继纵/邓兴旺课题组合作解析植物光敏色素phyB光信号转导的机制2024.09.24
- 刘君/杨雪瑞课题组合作揭示m6A-cenRNA调控癌细胞着丝粒稳态的机制2024.09.23
- 伊成器教授荣获2024年“科学探索奖”2024.08.29
- 王伟课题组报道蛋白酶体调控SG稳态抵御高温胁迫的新机制2024.08.22
- 肖俊宇团队阐明IgE 高亲和力受体FcεRI 复合物的组装机制2024.08.22
- 朱玉贤院士团队发布首个棉花基因组完整图谱,阐述棉族独特折叠胚胎形成的分子与演化机制2024.08.16
- 李晴课题组报道了滞后链核小体组装和冈崎片段成熟的协同机制2024.08.13
- 魏文胜团队报道非脱氨酶依赖的嘧啶碱基编辑器TBE2024.08.03
- 李晴研究组与合作者报道真核DNA复制体介导的亲本组蛋白表观遗传信息继承新机制2024.08.02
- 张迪课题组与合作者共同报道区分蛋白质乳酰化修饰同分异构体的新方法2024.07.22
- 国际遗传工程和生物技术中心(ICGEB)总干事Lawrence Banks教授一行访问陆剑课题组2024.06.26
- 郭强课题组与合作者揭示Synaptophysin调控突触小泡生成与功能的机制2024.06.06
- 2024年全国科技周开放活动2024.05.28
- 李磊课题组解析miR408平衡植物生长和抗旱的分子机制2024.05.16
- 李晟课题组与合作者研究揭示华北地区华北豹栖息地及其景观连通性现状2024.05.06
- 陆剑课题组揭示黑腹果蝇演化历史和环境适应机制2024.04.19
- 李川昀课题组在WIRES RNA发表从头起源新基因起源特征的综述2024.04.16
- 秦跟基课题通过构建拟南芥十二重突变体揭示雌蕊顶端命运决定的分子机制2024.04.08
- 李川昀课题组与合作者揭示结构变异编码人脑特异发育的新机制2024.04.07
- 肖俊宇课题组阐明磷酸化酶激酶PhK的组装与激活机制2024.04.01
- 陆剑课题组研发SIRSVIDE模型解析病毒进化动态2024.03.28
- 陈雪梅课题组鉴定了一个新的非典型帽子修饰RNA(NAD-capped RNA)脱帽酶,揭示了NAD+帽子修饰参与基因表达调控的新机制2024.03.18
- 祝贺瞿礼嘉教授成果入选 2023 年度“中国生命科学十大进展”2024.03.08
- 李晴、高宁及合作者揭示亲本组蛋白在DNA复制叉回收的关键分子机制2024.03.07
- 伊成器课题组开发升级版RNA编辑技术RESTART v32024.03.06
- 魏文胜课题组揭示肿瘤逃逸非HLA-I类分子依赖多效型T细胞杀伤的新机制2024.02.21
- 秦跟基课题组与合作者揭示水稻花药适时开裂的分子机制2024.02.21
- 陆剑课题组发表综述探讨新冠病毒刺突蛋白的功能演化2024.02.20
- 李磊课题组与合作者揭示巨胞饮的转录调控机制2024.02.19
- 焦雨铃课题组与合作者完成首个多细胞植物染色体的部分设计与合成2024.01.27
- 伊成器和合作者报道m1A修饰酶在调控造血干细胞衰老过程中的新机制2024.01.18
- 陆剑课题组与合作者共同揭示猴痘病毒蛋白质序列和密码子使用的分子演化规律2023.12.15
- 陆剑课题组与合作者发表综述总结动物microRNA调控的趋同和趋异演化2023.11.24
- 魏文胜团队实现人类蛋白质组中赖氨酸位点的功能解码2023.11.23
- 张蔚课题组受邀撰写综述揭示蝶翅花纹的演化创新模式2023.11.22
- 郭强课题组和杨竞课题组合作阐释粒细胞(granulocytes)细胞核分叶的全新分子机制2023.11.21
- 王忆平课题组在创建稳定高效联合固氮系统方面取得了突破性进展2023.11.20
- 高歌课题组提出跨平台、多模态空间组学比对与整合方法2023.11.13
- LEAPER 2.0在非人灵长类动物和人源化小鼠中实现了高效精准的长时RNA编辑2023.10.25
- 李川昀、刘颖团队建立单碱基分辨率鉴定DNA 6mA修饰的新方法,揭示真核生物6mA促进转录的新机制2023.10.23
- 又一教科书级的重大突破!瞿礼嘉/钟声课题组揭示植物通过有性生殖实现远缘杂交的新机制2023.10.08
- 王忆平研究团队与合作者成功创制2.0版多聚蛋白型固氮酶系统,为实现真核系统自主固氮迈进坚实的一步2023.09.18
- 秦跟基课题组揭示高温下植物种子前身胚珠命运的保护机制2023.09.15
- 焦雨铃课题组与合作者发现蛋白相分离调控植物茎分生组织活性2023.09.12
- 罗述金团队古DNA研究揭示中国是虎演化史上基因大熔炉2023.09.01
- 王伟课题组及合作者报道酚酸类化感物质通过促进相变抑制翻译从而调控物种间竞争的新机制2023.08.29
- 国家重点研发计划“病原变异及其跨物种传播的回溯和演进方法体系构建”项目推进会暨专家研讨会在北京大学成功召开2023.08.18
- 王继纵课题组与邓兴旺课题组合作揭示植物远红光受体phyA高度光敏感性的分子机制2023.07.28
- 赵进东、高宁、翁羽翔课题组合作揭示了CpcL藻胆体能量传递机制2023.07.10
- 郑晓峰课题组揭示乙酰转移酶ESCO2通过稳定Cohesin复合物促进NHEJ修复的作用和机制2023.07.10
- 伊成器课题组综述mRNA上非m6A修饰的调控与功能2023.07.04
- 郑晓峰课题组揭示SUMO化修饰通过调控液-液相分离来影响NHEJ修复效率和肿瘤细胞耐药的分子机制2023.07.03
- 郭强课题组开发适用于组织样品原位结构研究的方法2023.06.16
- 张蔚课题组综述以山地蝶类为体系开展生物多样性研究的进展2023.06.12
- 陆剑课题组与合作者揭示新冠病毒密码子演化规律并提出mRNA疫苗优化策略2023.06.05
- 张蔚课题组和合作者开发基于深度学习的基因渐渗推断方法2023.06.01
- 高歌课题组提出基因丢失鉴定新方法2023.05.29