Оглавление
2. Причина и решение проблемы 1
4. Причины и пути решения проблемы 2
1. Описание проблемы 1
Используя большие данные для анализа текста, после обработки текста я надеюсь интуитивно нарисовать данные в графическом облаке, чтобы увидеть эффект сегментации слов, но все облако слов полно искаженных прямоугольников:
На данный момент код для рисования облака слов следующий:
# 绘制消极词云
negative_wordcloud_text = " ".join(negative_words)
#设置词云信息
negative_wordcloud = WordCloud(width=1200, height=800, background_color='white').generate(negative_wordcloud_text)
plt.figure(figsize=(12, 8))
plt.imshow(negative_wordcloud, interpolation="bilinear")
plt.axis("off")
plt.title("消极评论关键词")
plt.show()
2. Причина и решение проблемы 1
Wordcloud по умолчанию не поддерживает отображение китайских иероглифов, и китайские иероглифы будут отображаться в виде прямоугольников. Вы можете попробовать изменить параметры шрифта WordCloud, чтобы китайские иероглифы отображались нормально.
Пример кода:
# 绘制消极词云
negative_wordcloud_text = " ".join(negative_words)
#--------------------------------------------此处修改------------------------
#设置词云信息
negative_wordcloud = WordCloud(font_path ="C:/Windows/Fonts/msyh.ttc",width=1200, height=800, background_color='white').generate(negative_wordcloud_text)
plt.figure(figsize=(12, 8))
plt.imshow(negative_wordcloud, interpolation="bilinear")
plt.axis("off")
plt.title("消极评论关键词")
plt.show()
3. Описание вопроса 2
После изменения облако слов отображается нормально, но заголовок в поле искажается.
4. Причины и пути решения проблемы 2
Как указано выше, wordcloud по умолчанию не поддерживает отображение китайских иероглифов, и китайские иероглифы будут отображаться в виде прямоугольников. Но заголовок нужно задать дополнительно.
Отображение кода :
# 绘制消极词云
negative_wordcloud_text = " ".join(negative_words)
#--------------------------------------------此处修改------------------------
#设置词云信息
negative_wordcloud = WordCloud(font_path ="C:/Windows/Fonts/msyh.ttc",width=1200, height=800, background_color='white').generate(negative_wordcloud_text)
plt.figure(figsize=(12, 8))
plt.imshow(negative_wordcloud, interpolation="bilinear")
plt.axis("off")
# -----------------------------此处修改------------------------------------------
# 设置中文字体
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.title("消极评论关键词")
plt.show()
Измененное облако слов отображается нормально: