解決簡体と再び遭遇Golangのゴミ問題、

前回の記事では、Webページをクロール、文字がそれらをマッチさせたいです。文字化けしているので、しかし、英語のバイパス問題を一致させます。

理由は簡単です:ページがUTF8指定しなかった場合、デフォルトではGBKでなければなりません

解決策は単純です:導入

「golang.org/x/text/encoding/simplifiedchinese」

例えば、元のコードであります

RESP、ERR:= この.cleint.Get(URL)
本体、ERR: = ioutil.ReadAll(resp.Body)

この時、体は読み取りの歪みです。

ただ、読者を追加

RESP、ERR:= この.cleint.Get(URL)
リーダー: = 。simplifiedchinese.GB18030.NewDecoder()リーダー(resp.Body)
本体、ERR: = ioutil.ReadAll(リーダー)

このとき、漢字で本体が正しく復号されます。検索したり、定期的に一致することができます。



おすすめ

転載: www.cnblogs.com/pu369/p/12228659.html