高歌团队开发长非编码RNA全面注释平台AnnoLnc2
长非编码RNA(Long noncoding RNAs,lncRNA)是一类新型调控分子,近期研究发现其在从胚胎发育到肿瘤发生等多种生理病理过程中发挥核心调控作用(1–5)。因此,随着越来越多的长非编码RNA被鉴定(6, 7),一批计算工具应运而生,为生物学家预测lncRNA的GO功能和调控网络(8)、亚细胞定位(9)(10)、乃至lncRNA-RNA(11)、lncRNA-蛋白(12)相互作用等提供了重要的工具。然而,这些工具仅支持从单一角度对长非编码RNA进行注释,难以涵盖lncRNA的功能全谱。
2016年,北京大学高歌课题组开发了长非编码RNA在线注释平台AnnoLnc(13),基于700多套高通量数据和先进的计算流程实现了对任意人类长非编码RNA从序列结构到进化模式的全面注释。作为国际首个长非编码RNA在线注释平台,AnnoLnc自2016年11月正式上线以来已成为相关领域的主流工具,支撑了来自全球5万余用户提交的近7千万条序列分析,并获邀为SpringNatureMethods in Molecular Biology系列丛书撰写专题介绍章节。
日前,高歌课题组在此基础上全面更新升级了AnnoLnc平台。新版本AnnoLnc2整合了十个注释模块(图1),注释内容涵盖了序列和结构、表达和调控、功能和相互作用、以及演化和遗传关联,为研究长非编码RNA的功能及其作用机制提供了高效、全面的分析平台,并为后续的生物学研究提供了重要的线索。例如,演化模块的注释结果可以揭示长非编码RNA是否具有保守的功能(14);亚细胞定位模块的注释结果可以揭示它们在何处发挥功能(15);功能富集模块的注释结果可以揭示它们发挥怎样的功能(16);miRNA调控和蛋白相互作用模块的注释结果可以揭示潜在的功能机制(17, 18)等。

图1. AnnoLnc2框架
AnnoLnc2网站操作便捷。用户仅需上传或者输入待分析的序列,选择相应物种,即可进行一键式分析(图2A)。每条序列的注释结果均有一个对应的网页界面,各模块的注释结果以交互式的图表的形式展示,以便用户检索感兴趣的条目。用户可批量下载所有的注释结果(图2B)以用于后续研究。与AnnoLnc1相比,AnnoLnc2首次对小鼠长非编码RNA提供了全面支持。

图2. AnnoLnc2网页界面。用户可通过一个三步骤的操作运行AnnoLnc2(A),并查看详细的注释结果,以及批量下载所有的注释结果(B)。
为了满足批量分析的需求,AnnoLnc2还为用户提供了可进行大规模线下分析的单机版本(下载链接:http://annolnc.gao-lab.org/download.php)。该单机版不仅包含了在线版本的全部功能,还支持自定义模块和自定义注释数据,用户可以基于自产数据(如RNA-seq数据)指定感兴趣的模块进行批量分析。
相比于AnnoLnc,AnnoLnc2整合了更多的注释资源。其中,表达模块可支持对目标序列在96个人类RNA-seq样本(涵盖26个组织,39个癌细胞系和2个正常细胞系)或69个小鼠RNA-seq样本(涵盖28个组织和7个细胞系)中的表达进行实时计算;转录调控模块整合了来自1339个人类转录因子和738个小鼠转录因子的结合位点;蛋白相互作用模块整合了来自188个人类RNA结合蛋白和62个小鼠RNA结合蛋白的结合位点。此外,AnnoLnc2还整合了一个新的注释模块-亚细胞定位,该模块可报告长非编码RNA的核质定位,以及已知的定位信号在目标序列中的分布。详细的数据介绍可参见http://annolnc.gao-lab.org/help.php#link-update。
该研究于2020年5月14日以AnnoLnc2: the one-stop portal to systematically annotate novel lncRNAs for human and mouse为题在线发表于Nucleic Acids Research。PTN项目博士生柯岚、杨德昌为共同第一作者,北京大学生物医学前沿创新中心(BIOPIC)/北京未来基因诊断高精尖创新中心(ICG)、生物信息中心(CBI)暨蛋白质与植物基因研究国家重点实验室高歌研究员为通讯作者,王宇、丁阳等合作者在平台构建和文章写作方面作出贡献。该研究得到国家重点研发计划,ICG和蛋白质与植物基因研究国家重点实验室的支持和资助。
AnnoLnc2网址:http://annolnc.gao-lab.org/
原文链接:https://doi.org/10.1093/nar/gkaa368
参考文献
1. Batista,P.J. and Chang,H.Y. (2013) Long noncoding RNAs: Cellular address codes in development and disease.Cell,152, 1298–1307.
2. Wapinski,O. and Chang,H.Y. (2011) Long noncoding RNAs and human disease.Trends Cell Biol.,21, 354–361.
3. Faghihi,M.A., Modarresi,F., Khalil,A.M., Wood,D.E., Sahagan,B.G., Morgan,T.E., Finch,C.E., St. Laurent,G., Kenny,P.J. and Wahlestedt,C. (2008) Expression of a noncoding RNA is elevated in Alzheimer’s disease and drives rapid feed-forward regulation of β-secretase.Nat. Med.,14, 723–730.
4. Mourtada-Maarabouni,M., Pickard,M.R., Hedge,V.L., Farzaneh,F. and Williams,G.T. (2009) GAS5, a non-protein-coding RNA, controls apoptosis and is downregulated in breast cancer.Oncogene,28, 195–208.
5. Gupta,R.A., Shah,N., Wang,K.C., Kim,J., Horlings,H.M., Wong,D.J., Tsai,M.-C., Hung,T., Argani,P., Rinn,J.L.,et al.(2010) Long non-coding RNA HOTAIR reprograms chromatin state to promote cancer metastasis.Nature,464, 1071–1076.
6. Frankish,A., Diekhans,M., Ferreira,A.M., Johnson,R., Jungreis,I., Loveland,J., Mudge,J.M., Sisu,C., Wright,J., Armstrong,J.,et al.(2019) GENCODE reference annotation for the human and mouse genomes.Nucleic Acids Res.,47, D766–D773.
7. Jiang,S., Cheng,S.-J., Ren,L.-C., Wang,Q., Kang,Y.-J., Ding,Y., Hou,M., Yang,X.-X., Lin,Y., Liang,N.,et al.(2019) An expanded landscape of human long noncoding RNA.Nucleic Acids Res.,47, 7842–7856.
8. Zhou,J., Huang,Y., Ding,Y., Yuan,J., Wang,H. and Sun,H. (2018) lncFunTK: a toolkit for functional annotation of long noncoding RNAs.Bioinformatics,34, 3415–3416.
9. Cao,Z., Pan,X., Yang,Y., Huang,Y. and Shen,H.-B. (2018) The lncLocator: a subcellular localization predictor for long non-coding RNAs based on a stacked ensemble classifier.Bioinformatics,34, 2185–2194.
10. Su,Z.-D., Huang,Y., Zhang,Z.-Y., Zhao,Y.-W., Wang,D., Chen,W., Chou,K.-C. and Lin,H. (2018) iLoc-lncRNA: predict the subcellular location of lncRNAs by incorporating octamer composition into general PseKNC.Bioinformatics,34, 4196–4204.
11. Li,J., Ma,W., Zeng,P., Wang,J., Geng,B., Yang,J. and Cui,Q. (2015) LncTar: a tool for predicting the RNA targets of long noncoding RNAs.Brief. Bioinform.,16, 806–12.
12. Zhang,W., Yue,X., Tang,G., Wu,W., Huang,F. and Zhang,X. (2018) SFPEL-LPI: Sequence-based feature projection ensemble learning for predicting LncRNA-protein interactions.PLOS Comput. Biol.,14, e1006616.
13. Hou,M., Tang,X., Tian,F., Shi,F., Liu,F. and Gao,G. (2016) AnnoLnc: a web server for systematically annotating novel human lncRNAs.BMC Genomics,17, 931.
14. Ponjavic,J., Ponting,C.P. and Lunter,G. (2007) Functionality or transcriptional noise? Evidence for selection within long noncoding RNAs.Genome Res.,17, 556–65.
15. Zhang,K., Shi,Z.M., Chang,Y.N., Hu,Z.M., Qi,H.X. and Hong,W. (2014) The ways of action of long non-coding RNAs in cytoplasm and nucleus.Gene,547, 1–9.
16. Guttman,M., Amit,I., Garber,M., French,C., Lin,M.F., Feldser,D., Huarte,M., Zuk,O., Carey,B.W., Cassady,J.P.,et al.(2009) Chromatin signature reveals over a thousand highly conserved large non-coding RNAs in mammals.Nature,458, 223–7.
17. Yoon,J.-H., Abdelmohsen,K. and Gorospe,M. (2014) Functional interactions among microRNAs and long noncoding RNAs.Semin. Cell Dev. Biol.,34, 9–14.
18. Castello,A., Fischer,B., Eichelbaum,K., Horos,R., Beckmann,B.M., Strein,C., Davey,N.E., Humphreys,D.T., Preiss,T., Steinmetz,L.M.,et al.(2012) Insights into RNA biology from an atlas of mammalian mRNA-binding proteins.Cell,149, 1393–406.
- 陆剑课题组揭示果蝇上游开放读码框的演化规律与补偿机制2026.03.27
- 魏文胜课题组受邀综述:利用碱基与引导编辑器实现疾病相关变异的大规模解码2026.03.23
- 焦雨铃研究组构建禾本科花序发育数学模型,指导小麦高产基因挖掘2026.03.16
- 何爱彬团队与合作者开发新一代表观液体活检平台实现疾病组织器官精准溯源2026.03.05
- 陈雪梅教授课题组揭示新型RNA帽子修饰的跨物种分布与动态调控2026.03.05
- 肖俊宇团队与赵明辉、谭颖团队合作揭示补体系统C3转化酶组装及识别底物C3的分子机制2026.02.21
- 钟声课题组鉴定到拟南芥隔膜处“阻止多花粉管穿出”受体复合物的新组分2026.02.11
- 钟声研究员与瞿礼嘉院士合作揭示被子植物两次受精事件对受精补偿效率的关键作用2026.02.11
- 陈雪梅研究组揭示RdDM通路在作物免疫调控中的新功能,为大豆抗病改良提供了潜在的新思路、新靶点2026.02.10
- 秦跟基课题组揭示调控种子大小的新机制2026.02.10
- 罗述金课题组古DNA研究揭示:日本晚更新世并无虎,而为洞狮2026.01.27
- 张蔚课题组与合作者揭秘蜘蛛纺器起源2026.01.15
- 伊成器研究组报道AIM平台,突破“单点编辑”限制,实现RNA多位点、多功能精准操控2026.01.07
- 田望课题组发现植物抗逆“全能选手”,为提高植物“钙营养”和复合逆境抗性提供新概念2026.01.06
- 张蔚课题组与合作者揭示红珠凤蝶马兜铃酸抗性机制2026.01.05
- 刘君团队开发FOCAS平台实现m6A修饰位点的全转录组功能解析2026.01.05
- 肖俊宇研究组揭示FcRL5受体识别 IgG的分子机制2026.01.02
- 王伟课题组报道应激颗粒实现胞内氧化还原异质性的新功能:细胞抗氧化的“智能调控枢纽”2025.12.22
- 李晟课题组与合作者揭示保护地缓解人类对兽类行为干扰的关键作用2025.12.15
- 姚蒙研究组系统评估无脊椎动物宏条形码引物,助力eDNA生物多样性研究2025.12.12
- 朱丹萌课题组与合作者揭示PICKLE调控染色质状态与基因转录的分子机理2025.12.09
- 季雄团队提出FeaSion策略揭示RNA聚合酶磷酸化的特征调控与功能2025.12.01
- 罗述金课题组古DNA研究揭示:豹猫与人共栖3500年直至汉末,家猫经丝绸之路唐代方始传入2025.11.28
- 白洋研究员入选第三期 “新基石研究员项目”资助名单2025.11.26
- 实验室主任瞿礼嘉教授2025年新当选中国科学院院士2025.11.25
- 汪阳明团队与西湖大学卢培龙团队利用人工智能辅助蛋白质设计实现精准线粒体DNA碱基编辑2025.11.18
- 肖俊宇和高宁团队联合发表多聚抗体设计策略2025.11.07
- 赵进东课题组应邀撰写藻胆体的结构和能量传递机制长文综述2025.10.28
- 郑晓峰课题组揭示代谢酶ALDOA入核激活NF-κB信号通路驱动胰腺癌进展2025.10.23
- 陆剑课题组揭示果蝇饥饿耐受的遗传架构和性别差异2025.09.29
- 遇赫课题组揭示中国家猪的起源传播与人群互动过程2025.09.26
- 季雄团队揭示INO80/SWR复合物通过BRD2和染色质景观调控Pol II转录起始2025.09.22
- 刘启昆课题组与合作者在Current Opinion in Plant Biology发文总结植物再生领域表观遗传调控的研究进展2025.09.18
- 钟上威课题组受邀发表植物光信号传导Tansley长文综述2025.09.16
- 姚蒙课题组研发新型空气eDNA采集器高效检测动植物多样性2025.09.11
- 焦雨铃研究组克隆了小麦粒重新基因,服务高产育种2025.09.02
- 魏文胜团队与合作者联合开发新型通用型CAR-T 疗法治疗血液系统恶性肿瘤2025.08.22
- 魏文胜团队开发RNA环化新方法2025.08.12
- 汪阳明团队创新双组学技术MAPIT-seq:在单细胞水平同时绘制RNA结合蛋白作用图谱与基因表达图谱的新利器2025.08.11
- 周岳课题组揭示拟南芥PRC1介导的H2Aub loop的形成机制及功能2025.08.11
- 贺新强课题组与周岳课题组合作揭示PRC2调控维管组织模式建立机制2025.08.11
- 苏晓东课题组揭示清道夫受体CD163识别底物的分子机制2025.07.23
- 陈雪梅课题组系统阐释植物miRNA成熟与功能调控机制2025.07.23
- 苏晓东课题组与合作者揭示AAV与新型受体(AAVR2)结合的分子机制2025.07.15
- 合成植物基因组2025.07.09
- 伊成器课题组与合作者建立RNA"暗码",升级生命语言2025.07.04
- 魏文胜团队系统揭秘人类基因组中“沉默突变”的功能性“低语”2025.06.26
- 肖俊宇团队与张永辉团队合作揭示嗜乳脂蛋白激活γδ T细胞的“分子钳”机制2025.06.12
- 昌增益课题组揭示蛋白质内源性(顺式)去组装元件调控细菌细胞分裂环(Z环)的动态形成2025.06.09
- 陆剑课题组揭示uORF在动物进化与发育中发挥“翻译减震器”调控作用的新机制2025.06.09
- 张蔚课题组与合作者揭示兰花螳螂程序性体色转变的分子机制及生态学意义2025.05.30
- 2025年“全国科技活动周”和“全国科技工作者日”活动2025.05.29
- 李川昀团队与合作者开发细胞通讯分析工具STCase,揭示肿瘤微环境中空间特异性通讯事件2025.05.29
- 伊成器课题组系统阐释假尿嘧啶修饰的功能与治疗应用新范式2025.05.27
- 瞿礼嘉/钟声团队应邀撰写被子植物雌-雄相互作用保证双受精成功综述2025.05.26
- 陆剑课题组与合作者共同揭示uORFs通过精细调节CLOCK蛋白的翻译参与果蝇昼夜节律及睡眠行为的调控机制2025.05.16
- 伊成器团队发展痕量样品m6A修饰定量测序方法2025.05.08
- 白洋团队联合多位顶尖科学家系统解析根际微生物组调控水稻分蘖的功能与机制2025.04.24
- 瞿礼嘉/钟声课题组发现植物传粉过程中“未雨绸缪”的“两步授粉”备份新机制,为作物逆境下的育性优化提供新思路2025.04.15
- 曾虎课题组应邀撰写综述:空间组学技术的研究进展2025.04.06
- 张迪课题组受邀综述蛋白质L-乳酰化的研究进展2025.04.04
- 苏晓东课题组揭示短序列锚定元件AE在DNA与蛋白质结合中的重要作用2025.03.31
- 魏文胜团队实现人类肿瘤免疫调控网络的单碱基精度解析2025.03.21
- 白洋团队构建全球首个作物根际"细菌+病毒"基因组数据库2025.03.13
- 季雄团队揭示RNA聚合酶亚基RPB7偶联磷酸酶CTDP1稳定Pol II并介导转录再起始2025.03.05
- 何爱彬团队利用全景单细胞组蛋白修饰实现胚胎发育谱系追踪2025.03.04
- 赵进东课题组揭示蓝细菌藻胆体与光系统II结合的新分子机制2025.02.17
- 高歌课题组提出面向大规模异质性空间转录组学切片的表征与解析新方法2025.02.12
- 周岳课题组揭示拟南芥雄性生殖细胞发育过程中染色质三维结构的动态变化过程及其重要作用2025.02.12
- 魏文胜团队发布新一代线粒体碱基编辑器助力建立疾病动物模型2025.01.23
- 贺新强课题组揭示木质部管状分子发育的microRNA调控网络2025.01.19
- 周岳课题组在Genome Biology发文揭示了拟南芥中启动子空间调控模式和喷泉结构形成机制2025.01.02
- 高歌课题组提出人类转录调控元件建模与相关非编码变异功能解析方法2025.01.02
- 魏文胜团队利用碱基编辑器筛选绘制DNA损伤应答功能元件图谱2024.12.16
- 秦跟基课题组揭示弱光下种子萌发调控新机制2024.12.05
- 刘启昆课题组开发了全新的植物细胞谱系追踪工具2024.11.26
- 周岳课题组揭示植物首个三维基因组结构蛋白及其调控机制2024.11.22
- 周岳课题组揭示植物特有的PWWP结构域蛋白调控基因表达的分子机制2024.11.22
- 国家重点实验室陈雪梅教授获得2024年度“求是杰出科学家奖”2024.11.08
- 秦跟基课题组应邀撰写品牌综述“Tansley insight”总结TCP转录因子在细胞器、细胞和器官命运决定中的重要功能2024.10.28
- 郑晓峰课组揭示USP1-ATF4-CD98hc调控ENKTL淋巴瘤患者耐药的新机制2024.09.30
- 肖俊宇课题组揭示IgM–CD5L复合物的分子机制2024.09.30
- 陆剑课题组揭示密码子使用偏好性对翻译调控的影响2024.09.30
- 魏文胜团队实现蛋白质组中丝氨酸、苏氨酸和酪氨酸位点的功能解析2024.09.24
- 王继纵/邓兴旺课题组合作解析植物光敏色素phyB光信号转导的机制2024.09.24
- 刘君/杨雪瑞课题组合作揭示m6A-cenRNA调控癌细胞着丝粒稳态的机制2024.09.23
- 伊成器教授荣获2024年“科学探索奖”2024.08.29
- 王伟课题组报道蛋白酶体调控SG稳态抵御高温胁迫的新机制2024.08.22
- 肖俊宇团队阐明IgE 高亲和力受体FcεRI 复合物的组装机制2024.08.22
- 朱玉贤院士团队发布首个棉花基因组完整图谱,阐述棉族独特折叠胚胎形成的分子与演化机制2024.08.16
- 李晴课题组报道了滞后链核小体组装和冈崎片段成熟的协同机制2024.08.13
- 魏文胜团队报道非脱氨酶依赖的嘧啶碱基编辑器TBE2024.08.03
- 李晴研究组与合作者报道真核DNA复制体介导的亲本组蛋白表观遗传信息继承新机制2024.08.02
- 张迪课题组与合作者共同报道区分蛋白质乳酰化修饰同分异构体的新方法2024.07.22
- 国际遗传工程和生物技术中心(ICGEB)总干事Lawrence Banks教授一行访问陆剑课题组2024.06.26
- 郭强课题组与合作者揭示Synaptophysin调控突触小泡生成与功能的机制2024.06.06
- 2024年全国科技周开放活动2024.05.28
- 李磊课题组解析miR408平衡植物生长和抗旱的分子机制2024.05.16
- 李晟课题组与合作者研究揭示华北地区华北豹栖息地及其景观连通性现状2024.05.06
- 陆剑课题组揭示黑腹果蝇演化历史和环境适应机制2024.04.19
