PHPのcurlを使用してリモートhtmlテキストを取得すると、中国語の文字化けが発生しました。多くのBaiduチュートリアルでは、次のコード行を使用しています。
$str = mb_convert_encoding($str, 'utf-8','GB2312');
ただし、この行には欠点があります。GB2312ではなくutf-8エンコーディングが返される場合、通常のはずの元のコンテンツが文字化けするため、次のように改善する必要があります。
//转换字符编码
$str = mb_convert_encoding($str, 'utf-8','UTF-8,GBK,GB2312,BIG5');