NONCODE:综合性的lncRNA数据库

欢迎关注”生信修炼手册”!

NONCODE数据库是一个综合的非编码RNA数据库,该数据库中包含了除tRNA和rRNA之外的其他类型的非编码RNA信息,其中绝大部分是lncRNA,网址如下

http://www.noncode.org/index.php

目前最新版本为v5, 共包含了17个物种的非编码RNA, 物种和对应的lncRNA数量汇总如下

该数据库通过两个途径收集和整理非编码RNA信息,第一种是通过pubmed进行文献检索,以ncrna, non-coding等关键词检索,然后从文章中提取非编码RNA;第二种是通过已有的数据库,比如RefSeq, GENCODE, lncRNAdb等。

将收集到的所有非编码RNA以gtfbed格式进行记录,通过compare合并相同转录本,去冗余,对去冗余只有的转录本和基因赋予NONCODE的ID; 然后利用CNCI预测其蛋白编码潜能,只保留CNCI预测结果为non-coding的转录本。

以上可以得到非编码RNA的基本信息,除此之外,还提供了在不同组织或者细胞系中的表达谱,功能预测,在不同物种间的保守性, 相关疾病等注释信息,人类的非编码RNA表达谱从Human BodyMap2.0 项目和GSE30554两个项目中得到;小鼠的表达谱数据从ERP000591得到,lncRNA的功能预测结果通过lnc-GFP这个软件预测得到。

通过Browse DB, 可以查看数据库中每个非编码RNA的信息,示意如下

NONCODE数据库的转录本ID以NON开头,后面三个字母代表物种,比如human对应HSA, 接下来的T代表转录本,后面的数字编号用于区分不同转录本; 对于每个转录本,给出了染色体位置,外显子个数,长度,CNCI score等信息。

点击每个转录本ID, 可以查看详细信息,除了序列等基本信息外,还包括以下两种信息

1. 表达谱

2. 二级结构

通过Function菜单,可以检索得到lncRNA对应的Go注释, 结果示意如下

lncRNA对应的GO注释是通过ncFANS这个在线网站得到的。

通过Disease菜单,可以检索到得到lncRNA相关的疾病和突变信息,示意如下

官网还提供了iLncRNA工具,用于预测lncRNA, 示意如下

只需要上传转录本对应的GTF文件或者BED文件就可以了。

对于所有物种的lncRNA, 提供了fastabed两种格式供下载,对于常见的human, mouse, rat, 还提供了gtf格式的文件。

·end·

—如果喜欢,快分享给你的朋友们吧—


扫描关注微信号,更多精彩内容等着你!

猜你喜欢

转载自blog.csdn.net/weixin_34128237/article/details/86791102
今日推荐