golang 八进制 utf-8 编码转中文

当调试程序,打印出变量的值时,有可能输出的是八进制 utf-8 编码(尤其是 protobuf 变量)
例如:\346\200\241\346\200\241\346\200
这样的字符串如果作为字面量,go可以自动转化,
但如果是从文件或string中读取,就不行了。
可以使用正则表达式简单处理下
如下代码示例:

package main

import (
    "fmt"
    "regexp"
    "strconv"
)

// 转换8进制utf-8字符串到中文
// eg: `\346\200\241` -> 怡
func convertOctonaryUtf8(in string) string {
    s := []byte(in)
    reg := regexp.MustCompile(`\\[0-7]{3}`)

    out := reg.ReplaceAllFunc(s,
        func(b []byte) []byte {
            i, _ := strconv.ParseInt(string(b[1:]), 8, 0)
            return []byte{byte(i)}
        })
    return string(out)
}

func main() {
    s1 := "\346\200\241" // 字面量
    s2 := `\346\200\241` // 原始字符串

    fmt.Println("s1 =", s1)
    fmt.Println("s2 =", s2)

    // 转化 s2
    s3 := convertOctonaryUtf8(s2)
    fmt.Println("s3 =", s3)
}

运行结果:
示例运行结果

猜你喜欢

转载自blog.csdn.net/chinaeran/article/details/80751534
今日推荐