IDL| Data Split Read

1. Code

pro str_count
  str=dialog_pickfile()
  openr,lun,str,/get_lun
  while(~eof(lun)) do begin
    readf,lun,str
    str_remove_spacing=strcompress(str,/remove_all)
    print,'导入的数据为:',str_remove_spacing
    str_remove_other=STRPOS(str_remove_spacing,'.')+1
    b=strlen(str_remove_spacing)
    all_num=b-str_remove_other
    print,'字符总个数为:',all_num
    str_split=strsplit(str,' ',/extract)
    ;计算a的数据
    str_arr_a=fix(strpos(str_split,'a'))
    w=where(str_arr_a eq 0,count)
    a=count
    print,'a的个数为:',a,'a的百分比为:',double(a)/all_num*100
    ;计算g的数据
    str_arr_g=fix(strpos(str_split,'g'))
    w=where(str_arr_g eq 0,count)
    g=count
    print,'g的个数为:',g,'g的百分比为:',double(g)/all_num*100
    ;计算c的数据
    str_arr_c=fix(strpos(str_split,'c'))
    w=where(str_arr_c eq 0,count)
    c=count
    print,'c的个数为:',c,'c的百分比为:',double(c)/all_num*100
    ;计算t的数据
    str_arr_t=fix(strpos(str_split,'t'))
    w=where(str_arr_t eq 0,count)
    t=count
    print,'t的个数为:',t,'t的百分比为:',double(t)/all_num*100
  endwhile 
  free_lun,lun
end

2. Results

IDL> str_count
% Compiled module: STR_COUNT.
导入的数据为:1.aggcacggaaaaacgggaataacggaggaggacttggcacggcattacacggaggacgaggtaaaggaggcttgtctacggccggaagtgaagggggatatgaccgcttgg
字符总个数为:         111
a的个数为:          33a的百分比为:       29.729730
g的个数为:          44g的百分比为:       39.639640
c的个数为:          19c的百分比为:       17.117117
t的个数为:          15t的百分比为:       13.513514
导入的数据为:2.cggaggacaaacgggatggcggtattggaggtggcggactgttcggggaattattcggtttaaacgggacaaggaaggcggctggaacaaccggacggtggcagcaaagga
字符总个数为:         111
a的个数为:          30a的百分比为:       27.027027
g的个数为:          46g的百分比为:       41.441441
c的个数为:          18c的百分比为:       16.216216
t的个数为:          17t的百分比为:       15.315315
导入的数据为:3.gggacggatacggattctggccacggacggaaaggaggacacggcggacatacacggcggcaacggacggaacggaggaaggagggcggcaatcggtacggaggcggcgga
字符总个数为:         111
a的个数为:          30a的百分比为:       27.027027
g的个数为:          50g的百分比为:       45.045045
c的个数为:          24c的百分比为:       21.621622
t的个数为:           7t的百分比为:       6.3063063
导入的数据为:4.atggataacggaaacaaaccagacaaacttcggtagaaatacagaagcttagatgcatatgttttttaaataaaatttgtattattatggtatcataaaaaaaggttgcga
字符总个数为:         111
a的个数为:          47a的百分比为:       42.342342
g的个数为:          20g的百分比为:       18.018018
c的个数为:          12c的百分比为:       10.810811
t的个数为:          32t的百分比为:       28.828829
导入的数据为:5.cggctggcggacaacggactggcggattccaaaaacggaggaggcggacggaggctacaccaccgtttcggcggaaaggcggagggctggcaggaggctcattacggggag
字符总个数为:         111
a的个数为:          26a的百分比为:       23.423423
g的个数为:          47g的百分比为:       42.342342
c的个数为:          26c的百分比为:       23.423423
t的个数为:          12t的百分比为:       10.810811
导入的数据为:6.atggaaaattttcggaaaggcggcaggcaggaggcaaaggcggaaaggaaggaaacggcggatatttcggaagtggatattaggagggcggaataaaggaacggcggcaca
字符总个数为:         111
a的个数为:          39a的百分比为:       35.135135
g的个数为:          44g的百分比为:       39.639640
c的个数为:          14c的百分比为:       12.612613
t的个数为:          14t的百分比为:       12.612613
导入的数据为:7.atgggattattgaatggcggaggaagatccggaataaaatatggcggaaagaacttgttttcggaaatggaaaaaggactaggaatcggcggcaggaaggatatggaggcg
字符总个数为:         111
a的个数为:          39a的百分比为:       35.135135
g的个数为:          40g的百分比为:       36.036036
c的个数为:          11c的百分比为:       9.9099099
t的个数为:          21t的百分比为:       18.918919
导入的数据为:8.atggccgatcggcttaggctggaaggaacaaataggcggaattaaggaaggcgttctcgcttttcgacaaggaggcggaccataggaggcggattaggaacggttatgagg
字符总个数为:         111
a的个数为:          31a的百分比为:       27.927928
g的个数为:          41g的百分比为:       36.936937
c的个数为:          18c的百分比为:       16.216216
t的个数为:          21t的百分比为:       18.918919
导入的数据为:9.atggcggaaaaaggaaatgtttggcatcggcgggctccggcaactggaggttcggccatggaggcgaaaatcgtgggcggcggcagcgctggccggagtttgaggagcgcg
字符总个数为:         111
a的个数为:          23a的百分比为:       20.720721
g的个数为:          48g的百分比为:       43.243243
c的个数为:          23c的百分比为:       20.720721
t的个数为:          17t的百分比为:       15.315315
导入的数据为:10.tggccgcggaggggcccgtcgggcgcggatttctacaagggcttcctgttaaggaggtggcatccaggcgtcgcacgctcggcgcggcaggaggcacgcgggaaaaaacg
字符总个数为:         110
a的个数为:          20a的百分比为:       18.181818
g的个数为:          45g的百分比为:       40.909091
c的个数为:          30c的百分比为:       27.272727
t的个数为:          15t的百分比为:       13.636364
导入的数据为:11.gttagatttaacgttttttatggaatttatggaattataaatttaaaaatttatattttttaggtaagtaatccaacgtttttattactttttaaaattaaatatttatt
字符总个数为:         110
a的个数为:          39a的百分比为:       35.454545
g的个数为:          11g的百分比为:       10.000000
c的个数为:           5c的百分比为:       4.5454545
t的个数为:          55t的百分比为:       50.000000
导入的数据为:12.gtttaattactttatcatttaatttaggttttaattttaaatttaatttaggtaagatgaatttggttttttttaaggtagttatttaattatcgttaaggaaagttaaa
字符总个数为:         110
a的个数为:          36a的百分比为:       32.727273
g的个数为:          16g的百分比为:       14.545455
c的个数为:           3c的百分比为:       2.7272727
t的个数为:          55t的百分比为:       50.000000
导入的数据为:13.gtattacaggcagaccttatttaggttattattattatttggattttttttttttttttttttaagttaaccgaattattttctttaaagacgttacttaatgtcaatgc
字符总个数为:         110
a的个数为:          28a的百分比为:       25.454545
g的个数为:          14g的百分比为:       12.727273
c的个数为:          11c的百分比为:       10.000000
t的个数为:          57t的百分比为:       51.818182
导入的数据为:14.gttagtcttttttagattaaattattagattatgcagtttttttacataagaaaatttttttttcggagttcatattctaatctgtctttattaaatcttagagatatta
字符总个数为:         110
a的个数为:          33a的百分比为:       30.000000
g的个数为:          13g的百分比为:       11.818182
c的个数为:           9c的百分比为:       8.1818182
t的个数为:          55t的百分比为:       50.000000
导入的数据为:15.gtattatatttttttatttttattattttagaatataatttgaggtatgtgtttaaaaaaaatttttttttttttttttttttttttttttttaaaatttataaatttaa
字符总个数为:         110
a的个数为:          32a的百分比为:       29.090909
g的个数为:           7g的百分比为:       6.3636364
c的个数为:           0c的百分比为:      0.00000000
t的个数为:          71t的百分比为:       64.545455
导入的数据为:16.gttatttttaaatttaattttaattttaaaatacaaaatttttactttctaaaattggtctctggatcgataatgtaaacttattgaatctatagaattacattattgat
字符总个数为:         110
a的个数为:          40a的百分比为:       36.363636
g的个数为:          10g的百分比为:       9.0909091
c的个数为:           9c的百分比为:       8.1818182
t的个数为:          51t的百分比为:       46.363636
导入的数据为:17.gtatgtctatttcacggaagaatgcaccactatatgatttgaaattatctatggctaaaaaccctcagtaaaatcaatccctaaacccttaaaaaacggcggcctatccc
字符总个数为:         110
a的个数为:          39a的百分比为:       35.454545
g的个数为:          15g的百分比为:       13.636364
c的个数为:          27c的百分比为:       24.545455
t的个数为:          29t的百分比为:       26.363636
导入的数据为:18.gttaattatttattccttacgggcaattaattatttattacggttttatttacaattttttttttttgtcctatagagaaattacttacaaaacgttattttacatactt
字符总个数为:         110
a的个数为:          32a的百分比为:       29.090909
g的个数为:          10g的百分比为:       9.0909091
c的个数为:          13c的百分比为:       11.818182
t的个数为:          55t的百分比为:       50.000000
导入的数据为:19.gttacattatttattattatccgttatcgataattttttacctcttttttcgctgagtttttattcttactttttttcttctttatataggatctcatttaatatcttaa
字符总个数为:         110
a的个数为:          24a的百分比为:       21.818182
g的个数为:           8g的百分比为:       7.2727273
c的个数为:          16c的百分比为:       14.545455
t的个数为:          62t的百分比为:       56.363636
导入的数据为:20.gtatttaactctctttactttttttttcactctctacattttcatcttctaaaactgtttgatttaaacttttgtttctttaaggattttttttacttatcctctgttat
字符总个数为:         110
a的个数为:          22a的百分比为:       20.000000
g的个数为:           7g的百分比为:       6.3636364
c的个数为:          19c的百分比为:       17.272727
t的个数为:          62t的百分比为:       56.363636
导入的数据为:21.tttagctcagtccagctagctagtttacaatttcgacaccagtttcgcaccatcttaaatttcgatccgtaccgtaatttagcttagatttggatttaaaggatttagattga
字符总个数为:         113
a的个数为:          31a的百分比为:       27.433628
g的个数为:          19g的百分比为:       16.814159
c的个数为:          22c的百分比为:       19.469027
t的个数为:          41t的百分比为:       36.283186
导入的数据为:22.tttagtacagtagctcagtccaagaacgatgtttaccgtaacgtacgtaccgtacgctaccgttaccggattccggaaagccgattaaggaccgatcgaaaggg
字符总个数为:         104
a的个数为:          30a的百分比为:       28.846154
g的个数为:          26g的百分比为:       25.000000
c的个数为:          25c的百分比为:       24.038462
t的个数为:          23t的百分比为:       22.115385
导入的数据为:23.cgggcggatttaggccgacggggacccgggattcgggacccgaggaaattcccggattaaggtttagcttcccgggatttagggcccggatggctgggaccc
字符总个数为:         102
a的个数为:          18a的百分比为:       17.647059
g的个数为:          39g的百分比为:       38.235294
c的个数为:          26c的百分比为:       25.490196
t的个数为:          19t的百分比为:       18.627451
导入的数据为:24.tttagctagctactttagctatttttagtagctagccagcctttaaggctagctttagctagcattgttctttattgggacccaagttcgacttttacgatttagttttgaccgt
字符总个数为:         115
a的个数为:          24a的百分比为:       20.869565
g的个数为:          22g的百分比为:       19.130435
c的个数为:          22c的百分比为:       19.130435
t的个数为:          47t的百分比为:       40.869565
导入的数据为:25.gaccaaaggtgggctttagggacccgatgctttagtcgcagctggaccagttccccagggtattaggcaaaagctgacgggcaattgcaatttaggcttaggcca
字符总个数为:         105
a的个数为:          26a的百分比为:       24.761905
g的个数为:          32g的百分比为:       30.476190
c的个数为:          24c的百分比为:       22.857143
t的个数为:          23t的百分比为:       21.904762
导入的数据为:26.gatttactttagcatttttagctgacgttagcaagcattagctttagccaatttcgcatttgccagtttcgcagctcagttttaacgcgggatctttagcttcaagctttttac
字符总个数为:         114
a的个数为:          25a的百分比为:       21.929825
g的个数为:          21g的百分比为:       18.421053
c的个数为:          24c的百分比为:       21.052632
t的个数为:          44t的百分比为:       38.596491
导入的数据为:27.ggattcggatttacccggggattggcggaacgggacctttaggtcgggacccattaggagtaaatgccaaaggacgctggtttagccagtccgttaaggcttag
字符总个数为:         104
a的个数为:          24a的百分比为:       23.076923
g的个数为:          35g的百分比为:       33.653846
c的个数为:          21c的百分比为:       20.192308
t的个数为:          24t的百分比为:       23.076923
导入的数据为:28.tccttagatttcagttactatatttgacttacagtctttgagatttcccttacgattttgacttaaaatttagacgttagggcttatcagttatggattaatttagcttattttcga
字符总个数为:         117
a的个数为:          30a的百分比为:       25.641026
g的个数为:          18g的百分比为:       15.384615
c的个数为:          17c的百分比为:       14.529915
t的个数为:          52t的百分比为:       44.444444
导入的数据为:29.ggccaattccggtaggaaggtgatggcccgggggttcccgggaggatttaggctgacgggccggccatttcggtttagggagggccgggacgcgttagggc
字符总个数为:         101
a的个数为:          15a的百分比为:       14.851485
g的个数为:          45g的百分比为:       44.554455
c的个数为:          22c的百分比为:       21.782178
t的个数为:          19t的百分比为:       18.811881
导入的数据为:30.cgctaagcagctcaagctcagtcagtcacgtttgccaagtcagtaatttgccaaagttaaccgttagctgacgctgaacgctaaacagtattagctgatgactcgta
字符总个数为:         107
a的个数为:          31a的百分比为:       28.971963
g的个数为:          23g的百分比为:       21.495327
c的个数为:          26c的百分比为:       24.299065
t的个数为:          27t的百分比为:       25.233645
导入的数据为:31.ttaaggacttaggctttagcagttactttagtttagttccaagctacgtttacgggaccagatgctagctagcaatttattatccgtattaggcttaccgtaggtttagcgt
字符总个数为:         112
a的个数为:          27a的百分比为:       24.107143
g的个数为:          25g的百分比为:       22.321429
c的个数为:          20c的百分比为:       17.857143
t的个数为:          40t的百分比为:       35.714286
导入的数据为:32.gctaccgggcagtctttaacgtagctaccgtttagtttgggcccagccttgcggtgtttcggattaaattcgttgtcagtcgctcttgggtttagtcattcccaaaagg
字符总个数为:         109
a的个数为:          19a的百分比为:       17.431193
g的个数为:          29g的百分比为:       26.605505
c的个数为:          25c的百分比为:       22.935780
t的个数为:          36t的百分比为:       33.027523
导入的数据为:33.cagttagctgaatcgtttagccatttgacgtaaacatgattttacgtacgtaaattttagccctgacgtttagctaggaatttatgctgacgtagcgatcgactttagcac
字符总个数为:         111
a的个数为:          30a的百分比为:       27.027027
g的个数为:          23g的百分比为:       20.720721
c的个数为:          21c的百分比为:       18.918919
t的个数为:          37t的百分比为:       33.333333
导入的数据为:34.cggttagggcaaaggttggatttcgacccagggggaaagcccgggacccgaacccagggctttagcgtaggctgacgctaggcttaggttggaacccggaaa
字符总个数为:         102
a的个数为:          24a的百分比为:       23.529412
g的个数为:          37g的百分比为:       36.274510
c的个数为:          24c的百分比为:       23.529412
t的个数为:          17t的百分比为:       16.666667
导入的数据为:35.gcggaagggcgtaggtttgggatgcttagccgtaggctagctttcgacacgatcgattcgcaccacaggataaaagttaagggaccggtaagtcgcggtagcc
字符总个数为:         103
a的个数为:          25a的百分比为:       24.271845
g的个数为:          35g的百分比为:       33.980583
c的个数为:          22c的百分比为:       21.359223
t的个数为:          21t的百分比为:       20.388350
导入的数据为:36.ctagctacgaacgctttaggcgcccccgggagtagtcgttaccgttagtatagcagtcgcagtcgcaattcgcaaaagtccccagctttagccccagagtcgacg
字符总个数为:         105
a的个数为:          24a的百分比为:       22.857143
g的个数为:          27g的百分比为:       25.714286
c的个数为:          32c的百分比为:       30.476190
t的个数为:          22t的百分比为:       20.952381
导入的数据为:37.gggatgctgacgctggttagctttaggcttagcgtagctttagggccccagtctgcaggaaatgcccaaaggaggcccaccgggtagatgccasagtgcaccgt
字符总个数为:         104
a的个数为:          22a的百分比为:       21.153846
g的个数为:          34g的百分比为:       32.692308
c的个数为:          26c的百分比为:       25.000000
t的个数为:          21t的百分比为:       20.192308
导入的数据为:38.aacttttagggcatttccagttttacgggttattttcccagttaaactttgcaccattttacgtgttacgatttacgtataatttgaccttattttggacactttagtttgggttac
字符总个数为:         117
a的个数为:          26a的百分比为:       22.222222
g的个数为:          20g的百分比为:       17.094017
c的个数为:          20c的百分比为:       17.094017
t的个数为:          51t的百分比为:       43.589744
导入的数据为:39.ttagggccaagtcccgaggcaaggaattctgatccaagtccaatcacgtacagtccaagtcaccgtttgcagctaccgtttaccgtacgttgcaagtcaaatccat
字符总个数为:         106
a的个数为:          29a的百分比为:       27.358491
g的个数为:          22g的百分比为:       20.754717
c的个数为:          30c的百分比为:       28.301887
t的个数为:          25t的百分比为:       23.584906
导入的数据为:40.ccattagggtttatttacctgtttattttttcccgagaccttaggtttaccgtactttttaacggtttacctttgaaatttttggactagcttaccctggatttaacggccagttt
字符总个数为:         116
a的个数为:          23a的百分比为:       19.827586
g的个数为:          20g的百分比为:       17.241379
c的个数为:          23c的百分比为:       19.827586
t的个数为:          50t的百分比为:       43.103448

Guess you like

Origin blog.csdn.net/chengzilhc/article/details/104806474