NCBI中SRA数据库简介

NCBI中SRA数据库简介

SRA数据库简介

SRA 数据库, 为Sequence Read Archive 的缩写。主要存储高通量测序的数据,来自四个测序平台,分别为: Roche_LS454,Illumina,ABI_SOLID和HELICOS。

SRA 数据库的组织架构 

首先是项目编号,通常以PRJ开头,会记录该项目的一些背景信息,包括,研究的目的及意义,项目启动日期,作者单位信息等等,项目下面可以包含以下子内容: 

(1)研究内容(study)。 在 SRA 数据库中, 研究课题的检索号(accession number)以前缀 DRP, ERP 或S R P 开头。  

(2)样本信息(sample)。 样本的检索号以前缀 DRS, ERS 或 SRS开头。 样本信息可以包括物种信息、 菌株(品系)信息、 家系信息、 表型数据、 临床数据, 组织类型等。 

(3)实验信息(experiment)。实验的检索号以前缀DRX, ERX 或 SRX 开头。 

(4) 数据信息,包括序列及其质量信息等, 在 SRA 数据库中以run 为单元存储。 run 的检索号以前缀 DRR, ERR 或SRR 开头。  

SRA 数据库进入方法:在NCBI主页找到SRA就可以直接搜索了: National Center for Biotechnology Information    

attachments-2018-11-vgUtZMAz5beadf3a3fee7.jpg

更多SRA数据下载: 从NCBI当中SRA数据库中下载高通量测序数据 - 组学大讲堂问答社区 

高通量fastq测序数据查看: 超大的文本文件如fasta,fastq文件在windows中如何打开 - 组学大讲堂问答社区 

Guess you like

Origin blog.csdn.net/u010608296/article/details/121327112