Vim 中读写特殊字符

在跨平台工作中由于不同编辑器处理换行和空白字符风格不一致, 常常在Vim下会看到一些特殊字符。这些特殊字符的含义可通过 digraph-table 查询, 也可根据 digraph-table 或Unicode/ASCII编码手动输入这些特殊字符。

查看特殊字符

Vim中可见特殊字符会直接显示,不可见特殊字符会显示为该字符在命令行的输入方式, 例如 \r 显示为 ^M 。通过 :help digraph-table 可看到所有Vim中可输入的特殊字符, 该文档的第一页如下:

char  digraph  hex   dec   official name
^@      NU     0x00   0    NULL   (NUL)
^A      SH     0x01   1    START OF HEADING (SOH)
^B      SX     0x02   2    START OF TEXT (STX)
^C      EX     0x03   3    END OF TEXT (ETX)
^D      ET     0x04   4    END OF TRANSMISSION (EOT)
^E      EQ     0x05   5    ENQUIRY (ENQ)
^F      AK     0x06   6    ACKNOWLEDGE (ACK)
^G      BL     0x07   7    BELL (BEL)
^H      BS     0x08   8    BACKSPACE (BS)
^I      HT     0x09   9    CHARACTER TABULATION (HT)
^@      LF     0x0a   10   LINE FEED (LF)
^K      VT     0x0b   11   LINE TABULATION (VT)
^L      FF     0x0c   12   FORM FEED (FF)
^M      CR     0x0d   13   CARRIAGE RETURN (CR)

第一列为特殊字符,第二列为digraph(见下文),第三列为十六进制表示, 第四列为十进制表示,第五列为该字符的官方名称。

显示当前文件的二进制编码可输入 :%!xxd ,该命令会替换文件内容!恢复: :%!xdd -r

通过digraph输入

Vim中显然没有什么特殊字符选择工具,但提供了两种输入特殊字符的方式:

  • 通过两个字符来输入一个特殊字符(digraph)。
  • 直接通过编码值(ASCII或Unicode)输入。

其中digraph是一种类似双拼的方法,连续输入两个字符来表示一个特殊字符。 需要先按下前导键 <Ctrl-K> ,例如在编辑模式下输入:

<Ctrl-K>Rg

将会出现 ® 字符,其中 "Rg" 是该字符的digraph(双拼)。 所有的digraph可以通过 :help digraph-table 查询。

通过字符编码输入

除了digraph,还可直接通过字符编码来输入它,该字符不需要在Vim的digraph-table中。 这种方式也是在插入模式下进行的,需要先按下前导键 <Ctrl-V> (Windows下 <Ctrl-Q> )。 有下列5种方式:

  • 十进制值ASCII: ^Vnnn (000 <= nnn <= 255)
  • 八进制值: ^VOnnn 或 ^Vonnn (000 <= nnn <= 377)
  • 十六进制值: ^VXnn or ^Vxnn (00 <= nn <= FF)
  • 十六进制BMP Unicode: ^Vunnnn (0000 <= nnnn <= FFFF)
  • 十六进制任何Unicode: ^VUnnnnnnnn (00000000 <= nnnnnnnn <= 7FFFFFFF)

上述操作都是在Unicode字符编码设置下进行的。例如:

<Ctrl-V>065

将会输出 A 字符, 65 是它的ASCII编码,而Unicode兼容ASCII。

换行的搜索/替换/输入

如果你还不了解Vim的搜索和替换,请移步 在 Vim 中优雅地查找和替换

换行在Vim中的行为很特殊也不够一致,需要单独讨论一下。首先区分一下 \r\n

  • 前者是回车(Carriage Return),在Vim中可通过 <c-k>CR 输入,显示为 ^M
  • 后者是换行(New Line),在Vim中通过 <CR> (回车)键输入,显示为回车并换行;

所以对于Windows风格换行( \r\n )在Vim中会在每行结尾显示 ^M

替换

使用 :s 命令替换为换行时,应当使用 \r (相当于回车键)而不是 \n 。 例如将所有逗号替换为换行:

:%s/,/\r/g

如果使用 \n 则目标会被替换为空字符 NULL (显示为 ^@ )。

搜索

在搜索模式( / )搜索换行时仍然应当使用 \n 字符,因为Vim的换行(Unix风格)确实是 \n 而不是 \r\n 。例如:

/foo\nbar

可以匹配到所有的:

foo
bar

参考阅读

猜你喜欢

转载自blog.csdn.net/chenster/article/details/53307707