SRA到fastq格式的批量转换 - 代码天地

SRA到fastq格式的批量转换

其他 2021-12-14 15:19:36 阅读次数: 0

生物信息分析人员一般会接触到从NCBI等网站下载的SRA数据，之前也介绍了下载SRA数据的几种方式。下面，我就简单介绍一下如何将下载的sra格式数据转换成为常用的fastq等格式。

1、fastq-dump命令

sratoolkit的下载，该部分详见上一篇文章（SRA数据库及linux本地下载）

单端测序：

fastq-dump SRR14306907.sra -O ./ （结果生成：SRR14306907.fastq）
fastq-dump --fasta SRR14306907.sra -O ./ （结果生成：SRR14306907.fasta）

双端测序：

fastq-dump SRR14306907.sra --split-3 -O ./ （结果生成：SRR14306907_1.fastq，SRR14306907_2.fastq）
fastq-dump SRR14306907.sra --split-3 --gzip -O ./ （结果生成：SRR14306907_1.fastq.gz， SRR14306907_2.fastq.gz）

2、pfastq-dump

1）下载pfastq-dump

git clone https://github.com/inutano/pfastq-dump
cd pfastq-dump/bin/
chmod a+x pfastq-dump

复制到自己的文件夹

cp pfastq-dump /home/xuyang/SRAToolkit/sratoolkit.2.10.9-ubuntu64/bin

2）转换格式

单端测序：

pfastq-dump SRR14306907.sra -O . -t 10

循环

for id in *sra; do pfastq-dump --threads 10 ./$id --gzip; done

双端测序：

 pfastq-dump SRR14306907.sra --split-3 --gzip -O ./ -t 10

循环

for id in *sra; do pfastq-dump --threads 8 ./$id --split-3 --gzip; done

或

for i in `tail -n+1 sra_new.ids|cut -f1`;do
pfastq-dump ${i}.sra --split-3 --gzip -O ./ -t 10
done

其中sra_new.ids为所有srafile的ID号，t为线程数

3.批量转换

for循环函数

for i in `tail -n+1 sra_new.ids|cut -f1`;do
pfastq-dump ${i}.sra --split-3 --gzip -O ./ -t 10
done

其中sra_new.ids是sra文件的列表

ref:inutano/pfastq-dump: parallel-fastq-dump implementation in bash script (github.com)

NGS小技能（2）：如何进行SRA到fastq格式的快速转换 - 简书 (jianshu.com)

猜你喜欢

转载自blog.csdn.net/qq_42458954/article/details/120018000

SRA到fastq格式的批量转换

sra转fastq格式

如何使用fastq-dump转换SRA格式

sra 数据转成 fastq并改名

FASTQ格式

NGS【1.1.1】fastq格式

fastq 转换为 fasta

图像批量格式转换

二代测序文件fastq转换为fasta格式

【生信】Fastq与Fasta格式

生物信息数据格式：fastq格式

生物信息006-Illumina质量体系Phred33 与 phred 64转换及fastq文件格式

对pgm格式图片的批量格式转换（pgm）

Spark直接读入fastq格式的数据

fastq、fasta、sam数据格式

批量转换xml文件的编码格式（GB2312到UTF-8）

shell创建文本，重命名文件，批量转换编码格式，重定向到markdown

Linux下从NCBI批量下载SRA数据的sra和aspera方法

使用pandoc批量转换文件格式

CSF文件批量转换为AVI格式

批量转换文件编码格式

Python实现批量图片格式转换

python3 批量编码格式转换

文档格式批量转换(doc,txt,pdf等)

matlab 批量转换图片类型格式

CAD文件如何批量转换PDF格式？

WPS表格数据格式批量转换

word文档批量转换为html格式

CAD图纸如何批量转换JPG格式？

pdf如何做到批量格式转换？

今日推荐

技术解析 GPT-4o：即时语音交互的突破与 GenAI 发展策略

开源大模型与闭源大模型

微信小程序授权登录获取用户的openid

亿级流量系统架构设计与实战

人工智能时代的程序设计教学与课程设计

纽交所技术问题致伯克希尔 (BRK.A) 显示跌近 100%

探索 api.maynor1024.live：一站式 AI 服务平台

AI一键去衣技术：窥见深度学习在图像处理领域的革命(最后有彩蛋)

艾体宝案例 | 使用Redis和Spring Ai构建rag应用程序

Apple M1 vs 高通8Gen2 vs Apple A12Z各方面比较

【升职加薪必备架构图】Springboot学习路线汇总_springboot四层架构流程图

与Apollo共创生态：Apollo7周年大会自动驾驶生态利剑出鞘

周排行

面试爱奇艺，竟然挂在第5轮……

scala方法和函数的区别

NYIST--2018大一新生第一次周赛题解

java如何通过client客戶端http实现get/ post请求传递json参数到restful 服务接口

RabbitMQ 队列类型

2018-2019-1 20165311 20165329 20165334 实验一开发环境的熟悉

iOS打包工具配置相应的文件路径一键打包到指定位置

【每日一题】替换空格

【转载】FPGA配置方式

旅行青蛙

每日归档

更多

2024-06-03(52)

2024-06-02(4)

2024-06-01(60)

2024-05-31(47)

2024-05-30(4)

2024-05-29(65)

2024-05-28(2)

2024-05-27(56)

2024-05-26(6)

2024-05-25(68)