node爬虫使用cheerio解析html()出现乱码问题

自己手动写了一个node爬虫,在使用cheerio解析页面时,通过cheerio的html()获取页面内容,但通过控制台打印出来,却出现“乱码”问题了。

需要注意的是,这里的“乱码”并不是真的乱码,这是HTML实体编码。

解决办法是:在load方法中,加入{decodeEntities:false}即可,

let $ = cheerio.load(html,{decodeEntities:false})

参考地址:https://www.jianshu.com/p/60ae70a1fb88

猜你喜欢

转载自www.cnblogs.com/Mrrabbit/p/12748084.html