今日は小さな、中国を読み取るためにエンコード問題のtxtファイルを解決するための良好な基準値を持っているのpython3を共有するすべての人のために、我々は手助けをしたいです。Xiaobianはフォロー一緒に、是非、ご覧
問題の説明を
PythonのでWordcloudを作成しようと、問題がコーディングされています。
一部が変更に変更にティエンティエン後に輝くインターネットのブログには、結果がになっていると言う「UnicodeDecodeError: 『UTF-8』コーデックはできませんデコードバイト...」 エラー。
フィドル日ああ、TXT(ここで私の心は表現のために多くの教訓を保持しています)。最後に、単にファイル、あるいはエラーを読むために最も簡単に書きます。txtファイルは、最終的には、Windowsのシステムにコピーしたコードを、見つけるために場所を確認することが判明txtファイルのエンコーディングを、見るためにMacの新しいテキストファイルではなく、現時点で読まれているのでだからは、符号化問題TXTとはみなされませんASCIIではなく、私の好きなUTF-8、Macが、あなたは、ああの多くは、あなたに私の信頼を裏切りました![イプシロン](┬┬﹏┬┬)3
ソリューション
TXTファイルの符号化フォーマットは、UTF-8に変更することができます
さらに、第3のパラメータエンコード=「UTF8」(NOバー)を追加するために、ファイルを開くとき。
with open('./test3.txt','r',encoding='utf8') as fin:
for line in fin.readlines():
line = line.strip('\n')
最初に成功したディスプレイのソースワード雲の下に取り付けられている(オンライン他人を参照してください、非常に詳細でノート)
import jieba
import jieba.analyse
from matplotlib import pyplot as plt
from scipy.misc import imread
from wordcloud import WordCloud,STOPWORDS,ImageColorGenerator
# 1.读取数据
with open("./test.txt","r",encoding="utf8") as f:
text = f.read()
# 2.基于 TextRank 算法的关键词抽取,top50
keywords = jieba.analyse.textrank(text, topK=50, withWeight=False, allowPOS=('ns', 'n', 'vn', 'v'))
file = ",".join(keywords)
# 指定中文字体,不然中文显示框框
font = r'./HYQiHei-25J.ttf'
print(file)
# 指定背景图,随意
image = imread('cake.jpg')
wc = WordCloud(
font_path=font,
background_color='white',#背景色
mask=image,#背景图
stopwords=STOPWORDS,#设置停用词
max_words=100,#设置最大文字数
max_font_size=100,#设置最大字体
width=800,
height=1000,
)
#生成词云
image_colors = ImageColorGenerator(image)
wc.generate(file)
# 使用matplotlib,显示词云图
plt.imshow(wc) #显示词云图
plt.axis('off') #关闭坐标轴
plt.show()
# 保存图片
wc.to_file('news.png')
私たちは、高齢者が学習しているかを確認するためにサイトを学ぶのpythonをお勧めします!基本的なPythonスクリプト、爬虫類、ジャンゴ、データマイニング、プログラミング技術から、だけでなく、戦闘にゼロベースのpython小さなパートナーを学ぶすべての愛に与えられたデータ項目を、並べ替え!Pythonのベテランの日は上の私たちが参加]をクリックし、学び、細部に注意を払うする必要があるための方法のいくつかを共有するために、技術のタイミングを説明する必要があるのpython学習者収集
、共有への皆のための小さなシリーズをコード化された中国のtxtファイルを読み込み、こののpython3の問題上全体の内容は、私たちは、私は、スクリプトの家を支援願っています、あなたの参照を与えることを願っています