Python与PyCharm的中文显示问题 - 代码天地

Python与PyCharm的中文显示问题

其他 2018-12-05 10:21:01 阅读次数: 0

最近在编写Python爬虫，用的Python2.7中文在IDE里的显示非常蛋疼，

我用的IDE是PyCharm 2018.1...

爬取的数据经常无法显示出中文，(估计一大部分是print语句的锅..) 想特意总结一下:

1. 每个.py文件开头加

# -*- coding:utf-8 -*-

这样就可以在.py文件中出现中文了, 例如中文注释，注意这个声明和print内容以及文件输出没有任何关系

2. 爬下来的JSON 解析后一直print成类似'\xe8\xbc\xaa\xe3'的unicode码

试了很多方法都没用，特别奇怪的时候我发掘可能是解析的时候添加了转义字符.... 比如'\xe8'是按照'\\xe8'存的...
所以用string_escape试了一下, 果然可以顺利输出了..解决了一大问题

print(str(painterMap).decode('string_escape'))

3. PyCharm设定

为了让pycharm输出显示正确中文，File-> Settings -> File encoding -> utf-8
这里我的project encoding 设置为system default (GBK)貌似也可以的..

4. 中文乱码

遇到乱码的情况95%是编码问题.. 用decode()/encode()解决...要具体爬取下来数据的编码具体分析

    str1 = u'你好啊'  # unicode Chinese Chars
    str2 = str1.encode('gb2312')  # encode str1 with gbk coding
    str3 = str1.encode('utf-8')  # encode str1 with utf-8 coding
    str4 = str2.decode('gb2312')  # decode str1 with gbk coding
    print(str1)
    print(str2)
    print(str3)
    print(str4)

5. 中文路径

在输入中文路径获取文件的时候会告诉我文件不存在...

例如: D:\python\年终总结.docx

需要对路径进行unicode加密成： (r'xxx' 表示强制不转义)

path = unicode(r'D:\python\年终总结.docx', 'utf8')

或者直接用u'XXX':

file = open(u'D:\\python\\年终总结.docx', 'rb')

---------------------
作者：PerryXu_BIT
来源：CSDN
原文：https://blog.csdn.net/perry_x/article/details/80274714

猜你喜欢

转载自blog.csdn.net/sinat_34166518/article/details/84399548

Python与PyCharm的中文显示问题

python matplotlib 中文显示问题

Pycharm中文显示异常

pycharm无法显示中文

如何解决PyCharm部分中文不显示的问题

解决pycharm中用matplotlib画图不显示中文的问题

pycharm如何改为中文显示？

python 画图中文显示问题

mac上Python matplotlib中文显示问题

在python中临时解决显示中文的问题

Python matplotlib绘图无法显示中文的问题

Pycharm(Python)下imshow函数显示问题的解决方法

解决Pycharm输入中文时输入框不显示的问题

Pycharm 中的中文乱码问题

【Python】【Pycharm】【Dataframe】关于pycharm有时显示不出Dataframe View的问题

pycharm的console显示乱码和中文的配置

pycharm开发python时出现控制台显示中文乱码

python生成html文件在pycharm中正常显示，在浏览器中打开中文乱码

Python——Pycharm安装、激活、中文、

Pycharm不能显示作图的问题

中文年份显示问题

matplotlib 中文显示的问题

ireport显示中文问题

VsCode中文显示问题

matplotlib中文显示的问题

QT显示中文问题

Python 解决matplotlib绘图显示中文乱码或错误问题

如何解决Python中的Anaconda中文不能显示问题

Python 中，matplotlib绘图无法显示中文的问题

python 解决抓取网页中的中文显示乱码问题

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)