pandas之字符串离散化 - 代码天地

pandas之字符串离散化

其他 2020-04-17 00:55:18 阅读次数: 0

# coding=utf-8
from matplotlib import  pyplot as plt
import pandas as pd
import numpy as np

# 数据地址
file_path = "./IMDB-Movie-Data.csv"

# 获取数据 ['', '', '']结构
df = pd.read_csv(file_path)

# 分割数据 [[],[],[]]结构
genre = df["Genre"].str.split(",").tolist()


# 1.合并数组
genre_list = list(set([i for j in genre for i in j]))

# 2.创建模型
zero_df = pd.DataFrame(np.zeros((df.shape[0], len(genre_list))), columns=genre_list)

# 3.赋值
for i in range(df.shape[0]):
    zero_df.loc[i, genre[i]] = 1

# 4.统计每一列的数据
genre_count = zero_df.sum(axis=0)

# 5.排序 默认是从小到大
genre_count = genre_count.sort_values()

# 6.设置图片尺寸与精度
plt.figure(figsize=(20, 8), dpi=80)

# 7.设置条形图
plt.bar(range(len(genre_count.index)), genre_count.values)

# 8.设置x轴数据
plt.xticks(range(len(genre_count.index)), genre_count.index)

# 9.设置网格
plt.grid(alpha=0.2)

# 展示图形
plt.show()

数据:

远方不足近在咫尺

发布了129 篇原创文章 · 获赞 11 · 访问量 4万+

私信关注

猜你喜欢

转载自blog.csdn.net/Batac_Lee/article/details/103297655

pandas之字符串离散化

莫队练习之离散化：P3709 大爷的字符串题

pandas 之字符串处理

06-统计方法和字符串离散化

python中字符串离散化的例子

pandas学习之字符串对象化方法，正则表达式

python数据分析及可视化（七）pandas数据清洗，显性问题（异常、缺失、重复），隐形问题（离散、面元、字符串）

pandas 字符串操作

pandas的字符串的分割之str.split()

Pandas的字符串的分割之str.cat()

【洛谷3709】大爷的字符串题（离散化+莫队）

使用Python对英雄联盟英雄数据进行聚类等分析 (字符串离散化)

Pandas：数据的离散化

pandas - 数据离散化

数据类型之字符串字符串格式化及字符串的一些方法

Pandas 字符串操作函数

Pandas | 11 字符串函数

Pandas中字符串处理

php对字符串的操作4之字符串的格式化函数

【Python自动化Excel】Python与pandas字符串操作

64_Pandas进行字符串和数字的相互转换和格式化

Python之字符串格式化

python之字符串格式化(format)

Python之字符串格式化（巧用妙用）

python之字符串格式化输出

Golang之字符串格式化

python字符串格式化之format

（十二）Python学习之字符串格式化

python字符串之format格式化函数

python之格式化字符串（ format ）

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)