十一、sed 文本处理工具
· Stream EDitor, 行编辑器
sed是一种流编辑器,它一次处理一行内容。处理时,把当前处理的行存储在
临时缓冲区中,称为“模式空间”(pattern space),接着用sed命令处理缓
冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。然后读入下行,执行
下一个循环。如果没有使诸如‘D’的特殊命令,那会在两个循环之间清空模
式空间,但不会清空保留空间。这样不断重复,直到文件末尾。文件内容并没
有改变,除非你使用重定向存储输出。
· 功能:主要用来自动编辑一个或多个文件,简化对文件的反复操作,编写转换程序等
· 用法:sed [option]... 'script' inputfile...
· 常用选项
· -n:不输出模式空间内容到屏幕,即不自动打印
· -e: 多点编辑
· -f:/PATH/SCRIPT_FILE: 从指定文件中读取编辑脚本
· -r: 支持使用扩展正则表达式
· -i.bak: 备份文件并原处编辑
· script:地址命令
· 地址定界
· 不给地址:对全文进行处理
· 单地址
· #: 指定的行,$:最后一行
· /pattern/:被此处模式所能够匹配到的每一行
· 地址范围
· #,#
· #,+#
· /pat1/,/pat2/
· #,/pat1/
· ~:步进
· 1~2 奇数行
· 2~2 偶数行
· 编辑命令
· d: 删除模式空间匹配的行,并立即启用下一轮循环
· p:打印当前模式空间内容,追加到默认输出之后
· a [\]text:在指定行后面追加文本
· 支持使用\n实现多行追加
· i [\]text:在行前面插入文本
· c [\]text:替换行为单行或多行文本
· w /path/somefile: 保存模式匹配的行至指定文件
· r /path/somefile:读取指定文件的文本至模式空间中匹配到的行后
· =: 为模式空间中的行打印行号
· !:模式空间中匹配行取反处理
· s///:查找替换,支持使用其它分隔符,s@@@,s###
· 替换标记
· g: 行内全局替换
· p: 显示替换成功的行
· w /PATH/TO/SOMEFILE:将替换成功的行保存至文件中
· 高级编辑命令
· P:打印模式空间开端至\n内容,并追加到默认输出之前
· h: 把模式空间中的内容覆盖至保持空间中
· H:把模式空间中的内容追加至保持空间中
· g: 从保持空间取出数据覆盖至模式空间
· G:从保持空间取出内容追加至模式空间
· x: 把模式空间中的内容与保持空间中的内容进行互换
· n: 读取匹配到的行的下一行覆盖至模式空间
· N:读取匹配到的行的下一行追加至模式空间
· d: 删除模式空间中的行
· D:如果模式空间包含换行符,则删除直到第一个换行符的模式空间中的文本,并不会读取新的输入行,而使用合成的模式空间重新启动循环。如果模式空间不包含换行符,则会像发出d命令那样启动正常的新循环