解决下载经过GZip压缩后的网页乱码问题 - 代码天地

解决下载经过GZip压缩后的网页乱码问题

其他 2019-01-13 02:21:23 阅读次数: 0

目前很多网站默认采用GZip压缩，如果不进行解压缩，下载后生成的html页面打开后会出现中文乱码

乱码前：

            string url = "http://quote.eastmoney.com/stocklist.html";
            using (var client = new HttpClient())
            {
                client.BaseAddress = new Uri(url);
                var response = client.GetAsync(url).Result;

                var content = response.Content.ReadAsStringAsync().Result;
                File.WriteAllText(@"C:\stock.html", content, Encoding.Default);

            }

乱码效果：

解决代码：

            string url = "http://quote.eastmoney.com/stocklist.html";
            using (var client = new HttpClient())
            {
                client.BaseAddress = new Uri(url);

                //关键代码1：设置请求头采用GZip和deflate两种压缩算法
                client.DefaultRequestHeaders.Add("Accept-Encoding", "gzip, deflate");
                var response = client.GetAsync(url).Result;

                var fileStream = response.Content.ReadAsStreamAsync().Result;

                //关键代码2：对文件流采用GZip算法解压
                GZipStream gzip = new GZipStream(fileStream, CompressionMode.Decompress);

                using (StreamReader reader = new StreamReader(gzip, Encoding.GetEncoding("gb2312")))//中文编码处理
                {
                    File.WriteAllText(@"C:\stock.html", reader.ReadToEnd(), Encoding.Default);
                }
            }

解决后效果：

乱码有的时候不能单单靠转File.WriteAllText(@"C:\stock.html", reader.ReadToEnd(), Encoding.GetEncoding("gb2312"));方式解决，具体情况具体分析，思维多发散发散。

猜你喜欢

转载自www.cnblogs.com/wgx0428/p/10261714.html

解决下载经过GZip压缩后的网页乱码问题

网页gzip压缩检测

Java中HTTP请求返回乱码 - GZIP压缩问题

学习爬虫过程中解决下载网页乱码的问题

Tomcat 开启GZIP压缩网页

如何读取gzip压缩网页

解决ubuntu压缩乱码问题

解决网页抓取乱码问题

python---get/post请求下载指定URL返回的网页内容，出现gzip乱码处理。设置Accept-Encoding为gzip,deflate，返回的网页是乱码

网页乱码之网页压缩

解决经过babel转换后的代码，中文转成unicode问题

使用GZIP压缩网页内容（一）

nginx开启gzip网页资源压缩

网页压缩--gzip和deflate的区别

Nginx开启gzip网页传输压缩配置

下载并解决中文乱码问题

解决文件下载的的乱码问题

nginx开启gzip压缩后导致apk包下载不能正常安装

Vue2 导出Excel + 解决乱码问题 —— axios （下载后台传过来的流文件（excel）后乱码问题）

Javadoc Generation 解决生成网页乱码问题

IDEA环境解决网页中文乱码的问题

解决Chrome网页编码显示乱码的问题

解决爬虫网页内容乱码问题

关于tomcat的gzip压缩后的测试

解决开启Gzip压缩后某些浏览器访问不正常

网站SEO之网页压缩nginx gzip压缩

代码上传下载后中文乱码问题解决

问题解决：下载的网页打开后自动跳转到首页

Spring解决提交表单后乱码问题

项目优化之关于gzip压缩的问题

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)