基因课 15天入门生物信息(2021年) 第三天 Linux基础命令(3)

15天入门生物信息(2021年)15天入门生物信息(2021年)_哔哩哔哩_bilibili

atha.fasta的前10行  打印出来

head -n 10 atha.fasta

atha.fasta的前10行  放到一个文件里面    重定向

 head -n 10 atha.fasta>head10.fasta

查看里面的内容   10行  10个字符(一个单词)698字符

wc head10.fasta

cat head10.fasta

cat head10.fasta|wc -l

cat head10.fasta|wc 

 

 

 后10行  覆盖原来的          (一个>号)

tail -n 10 atha.fasta>head10.fasta          

wc head10.fasta

cat head10.fasta

  后10行  追加原来的   两倍重复        (两个个>>号)   20行

提取 atha.gff 的 400- ک 500行,打印输出到subset.gff

(一)head -n 500 atha.gff> temp.gff


tail -n 101 temp.gff>subset.gff

rm temp.gff

 (二)管道 |     不要中间 (水桶)

head -n 500 atha.gff | tail -n 101 temp.gff>subset.gff

查看፡ atha.fasta 有多少条序列

less -S atha.fasta              内容

grep ">" atha.fasta      所有包含>的行   筛选出来

 grep ">" atha.fasta   |wc                          统计 wc命令

grep -c ">" atha.fasta                                  grep命令

检查大豆中的基因 是否有重复,若果有,把重复的拿出来

ls -l *fasta                     所有的fasta文件

ls -l  -h *fasta   

 

grep ">" gmax.fasta|less         拿到  交给less,打开  这个命令的输出

 

 grep ">" gmax.fasta|sort   |uniq |wc              去重复

grep ">" gmax.fasta|wc                                 没有去重复  

おすすめ

転載: blog.csdn.net/u010608296/article/details/121445120