reads count文件转化为fasta格式文件(redundant reads) - 代码天地

reads count文件转化为fasta格式文件(redundant reads)

其他 2018-11-21 10:44:40 阅读次数: 0

从NCBI下载的测序数据很多是去过接头的，并且整理成readscount格式，即每行第一列为reads，第二列为reads数，而我们需要把它整理成fasta格式，并且每个read都整理为一条序列

原始文件：

cat GSM3124755_WTB_PARE.csv | head

GATCTTTCGAACTTTCCCAAC,1
ACTCTCTGCACTAAACAAAA,1
TTTTGTCATTGATTTTTGTA,4
GCAATCGAAATTCTCTGACG,1
GTAGTGACGAAAGCTGGCTCC,1
ATTACAGCTTCTGATGTCTT,4
CATCTTGGTCATGTCTTTGA,1
CATACAATATGGAGATGAAG,1
CCGACTTTGAGGGAGTTCGT,1
TACATTGGTGTTGGTACTGT,1

python脚本

fw = open('GSM3124755_WTB_PARE.fas', 'w')
s = 0
with open('GSM3124755_WTB_PARE.csv', 'r') as fr:
    for line in fr.readlines():
        s += 1
        count = str(line.strip().split(',')[1])
        seq = str(line.strip().split(',')[0])
        for i in range(int(count)):
            fw.write('>' + str(s) + '_' + str(i + 1)  + '\n' + seq + '\n')
fw.close()

输出结果：
cat cat GSM3124755_WTB_PARE.fas | head

>1_1
GATCTTTCGAACTTTCCCAAC
>2_1
ACTCTCTGCACTAAACAAAA
>3_1
TTTTGTCATTGATTTTTGTA
>3_2
TTTTGTCATTGATTTTTGTA
>3_3
TTTTGTCATTGATTTTTGTA
>3_4
TTTTGTCATTGATTTTTGTA
>4_1
GCAATCGAAATTCTCTGACG
>5_1
GTAGTGACGAAAGCTGGCTCC
>6_1
ATTACAGCTTCTGATGTCTT
>6_2
ATTACAGCTTCTGATGTCTT
>6_3
ATTACAGCTTCTGATGTCTT
>6_4
ATTACAGCTTCTGATGTCTT
>7_1
CATCTTGGTCATGTCTTTGA
>8_1
CATACAATATGGAGATGAAG
>9_1
CCGACTTTGAGGGAGTTCGT
>10_1
TACATTGGTGTTGGTACTGT

猜你喜欢

转载自blog.csdn.net/weixin_40099163/article/details/83902531

reads count文件转化为fasta格式文件(redundant reads)

reads count文件转化为fasta格式文件(uniq reads)

intronic reads and unspliced reads differences spliced reads

读取Unique reads

RNAseq测序reads定位

samtools获取uniq reads

seqtk批量抽取reads

统计bed文件下的reads数目和GC含量

【bioinfo】根据sam文件中的MD标签判断reads比对情况

Human life almost reads like a poem

Mysql Scalability(4)Amoeba - Separate Reads and Writes

Mysql Scalability(3)Amoeba - Proxy - Reads and Writes

【转录组入门】06：reads计数

small RNA seq筛选reads长度

直接路径读 - direct path reads

how Lordec maps the long reads to DeBruijn Graph

详解HDFS Short Circuit Local Reads

HDFS Short-Circuit Local Reads

CoLoRMap: Correcting Long Reads by Mapping short reads CoLoRMap:通过映射短读来纠正长读

mysql 导入sql文件，出现ERROR 1418 (HY000): This function has none of DETERMINISTIC, NO SQL, or READS SQL报错

[Err] 1418 - This function has none of DETERMINISTIC, NO SQL, or READS SQL DATA

40、inner mate distance for paired reads in a bam file

HBase查询优化之Short-Circuit Local Reads

如何划窗统计测序数据的reads数（depth）

ngs中reads mapping-pku的生信课程

Hadoop 中的Short-circuit local reads是什么？

reads在染色体上分布作图（转载）

Oracle11g 中的Direct path reads 特性详解

assembly|reads to contig|contig to scaffold|coverage|depth| tandem repeats

mysql 创建函数This function has none of DETERMINISTIC, NO SQL, or READS

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)