前回の記事では、Webページをクロール、文字がそれらをマッチさせたいです。文字化けしているので、しかし、英語のバイパス問題を一致させます。
理由は簡単です:ページがUTF8指定しなかった場合、デフォルトではGBKでなければなりません
解決策は単純です:導入
「golang.org/x/text/encoding/simplifiedchinese」
例えば、元のコードであります
RESP、ERR:= この.cleint.Get(URL) 本体、ERR: = ioutil.ReadAll(resp.Body)
この時、体は読み取りの歪みです。
ただ、読者を追加
RESP、ERR:= この.cleint.Get(URL) リーダー: = 。simplifiedchinese.GB18030.NewDecoder()リーダー(resp.Body) 本体、ERR: = ioutil.ReadAll(リーダー)
このとき、漢字で本体が正しく復号されます。検索したり、定期的に一致することができます。