split切割文件命令详解

1. split介绍

split命令可以将一个大文件分割成很多个小文件,有时需要将文件分割成更小的片段,比如为提高可读性,生成日志等。

2. split参数

-a, --suffix-length=N   use suffixes of length N (default 2)   #输出文件后缀长度,默认为:2
-b, --bytes=SIZE   put SIZE bytes per output file       #按照文件大小分割文件,单位:字节
一个字节 = 8位二进制数(1byte == 8bit)

ASCII码:一个英文字母(不分大小写)占一个字节的空间,一个中文汉字占两个字节的空间
UTF-8编码:一个英文字符等于一个字节,一个中文(含繁体,及中文标点)等于三个字节
Unicode编码:一个英文(含标点)等于两个字节,一个中文(含繁体,及中文标点)等于两个字节

-d, --numeric-suffixes  use numeric suffixes instead of alphabetic  #添加数字后缀(因为默认添加的是字母后缀,所有要想加数字需要自己添加)
-l, --lines=NUMBER      put NUMBER lines per output file   #按照行数分割文件,默认1000行一个文件
--verbose  print a diagnostic just before each output file is opened  #打印运行状态信息
--help     display this help and exit          查看说明文档
--version  output version information and exit 查看版本信息

3. split实战

3.2 默认切割

默认情况下,split 命令使用非常简单的命名方案。文件块将被命名为 xaa、xab、xac 等,并且,大概地,如果你将足够大的文件分割,你甚至可能会得到名为 xza 和 xzz 的块。
除非你要求,否则该命令将无任何反馈地运行。

$ split bigfile

3.2 --verbose 创建文件块时看到反馈

$ split –-verbose bigfile
creating file 'xaa'
creating file 'xab'
creating file 'xac'

3.3 原始文件分割并命名为 bigfile.aa、bigfile.ab

$ split –-verbose bigfile bigfile.
creating file 'bigfile.aa'
creating file 'bigfile.ab'
creating file 'bigfile.ac'

请注意,上述命令中显示的前缀的末尾会添加一个点。否则,文件将是 bigfileaa 之类的名称,而不是 bigfile.aa。
请注意,split 命令不会删除你的原始文件,只是创建了文件块。

3.4 -b 指定文件块的大小

$ split -b100M bigfile

文件大小可以是 KB、MB,GB,最大可以是 YB!只需使 K、M、G、T、P、E、Z 和 Y 这些合适的字母。

3.5 -l选项根据文件的行数来分割文件

每个文件将有 1000 行

$ split --verbose -l1000 logfile log.
creating file 'log.aa'
creating file 'log.ab'
creating file 'log.ac'
creating file 'log.ad'
creating file 'log.ae'
creating file 'log.af'
creating file 'log.ag'
creating file 'log.ah'
creating file 'log.ai'
creating file 'log.aj'

3.6 cat合并与原文件无差别

$ split --verbose -b50K zip zip.
creating file 'zip.aa'
creating file 'zip.ab'
creating file 'zip.ac'
creating file 'zip.ad'
creating file 'zip.ae'
$ cat zip.a? > zip.new
$ diff zip zip.new
$                    <== 无输出 = 无差别

3.7 -d用数字后缀,同时可以使用-a length来指定后缀的长度:

$ split -b 10k date.file -d -a 3
$ ls
date.file  x000  x001  x002  x003  x004  x005  x006  x007  x008  x009

为分割后的文件指定文件名的前缀:

$ split -b 10k date.file -d -a 3 split_file
$ ls
date.file  split_file000  split_file001  split_file002  split_file003  split_file004  split_file005  split_file006  split_file007  split_file008  split_file009
原创文章 223 获赞 57 访问量 12万+

猜你喜欢

转载自blog.csdn.net/xixihahalelehehe/article/details/105743583