node.js superagent中文乱码问题

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/tdjqqq/article/details/80566924

    最近在做数据爬虫小DEMO,但目标网页为gb2312编码,windows10下superagent请求会出现乱码,试了一轮,均没成功,最后用以下方法成功的。

app.js

const superagent = require( 'superagent')
const cheerio = require( 'cheerio')
const iconv = require( 'iconv-lite');
var charset = require( "superagent-charset");
charset( superagent); //设置字符

const reptileUrl = 'http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2016/index.html'

superagent. get( reptileUrl). charset( 'gbk'). end( function ( err, res) {
// 抛错拦截
if ( err) {
return err;
}
// 等待 code


let $ = cheerio. load( res. text, { decodeEntities: false });

let citys = $( '.provincetr td a')

let provinces = [];

var t = $( citys[ 0]). html();

    console. log( t)

});

猜你喜欢

转载自blog.csdn.net/tdjqqq/article/details/80566924