Data analysis missing values - Code World

Data analysis missing values

Language 2019-06-14 14:39:38 views: null

#缺失值
data.isnull()   //将数据转换成值为True或Null
(data.isnull()).sum()   //返回每一列缺失值的个数
data.dropna(subset = ['yuanjia'], inplace=True)   //直接在源数据中删除列为 yuanjia的缺失值


#重复值
data.duplicated().sum()
data.drop_duplicates(inplace=True)

len(data)

#类型不统一
(data['shoujia'].str.contains('万')).sum()
data['shoujia'].map(lambda x:float(x.replace('万','')))

#排序
data.sort_values('licheng')
data.sort_values('licheng', ascending = False)

#统计数据中在以bins做区间时的数据的个数，如在 0-15 数据有30412个
bins = [0,15,20,25,30,35,40,45,60,75,90,100,1000,2000,6000]
pd.cut(data.Value,bins).value_counts()

#分组
//以didian来分组，并返回shoujia的平均值
data.groupby(['didian'])['shoujia'].mean()
//以didian和pinpai进行分组，返回的是相应pinpai的个数
data.groupby(['didian','pinpai'])['pinpai'].count()

Guess you like

Origin blog.csdn.net/disasters/article/details/91954142

Data analysis missing values

Data Analysis - MISSING VALUES

[Data analysis] an important part - how missing values

Data processing - MISSING VALUES

Study notes (02): Python hall Data: data analysis and data visualization - operation, and missing values

[Data Mining] data preprocessing - MISSING VALUES

pandas Data Analysis - Processing fill in missing data

Study notes (33): Python actual data cleaning - missing values

python data cleaning implement (abnormal value processing missing values)

Preprocessing-data cleaning (missing values, redundancy, outliers)

Pandas implements data row filtering for specified columns containing missing values

Preparing for mathematical modeling 2 - MATLAB imports data and handles missing values

Python data analysis combat: missing value processing

"The Missing She" Douban Short Review Data Analysis

[Python] pandas discards missing data values and pandas filters values for specific dates

Pandas fill in missing values

Handle missing values

Fill in missing values with the mean

plot Plot with missing values

Missing values in Python

[python] data mining analysis and cleaning - summary of missing value processing methods

A summary of the dropna() function and fillna() function used in Python to deal with null values (missing values) in data, and understand the usage of these two functions through examples.

sklearn fill the missing values (summary)

Padding vector [R] missing values

Different methods of deleting missing values

Fill missing values in pandas dataframe

Machine Learning - Handling Missing Values

Fill missing values in pandas dataframe

Pandas uses the dropna function to delete all data rows that contain missing values in the dataframe data (default dropna deletes data rows, and rows that contain at least one missing value are deleted)

Actual Combat Thirty-Three: "The Missing Her" Film Critic Analysis Data Analysis Actual Combat

Recommended

Face Wall Intelligence releases the Eurux-8x22B open source large model - it can be called the "science champion"

Kaiyuan Daily | Google supports Hongmeng to take over; open source Rabbit R1; Android phones supported by Docker; Microsoft’s anxiety and ambition; Haier Electric shuts down the open platform

Ranking

Jianzhi offer interview questions 68-II. The nearest common ancestor of a binary tree (recursive)

jQuery Mobile development 1-UI components

Summary of Kotlin function knowledge

[ZZ] The Naked Truth About Anisotropic Filtering

Diagnosis: record a recovery of abnormal CRASH storage caused the database to be unable to be opened normally

Redis introduction and Linux installation Redis

Experiment 2 Introduction to switches

glances open source command-line system monitoring tools introduced

Use of selector

vue3 handwriting a carousel picture

Daily

More

2024-05-06(6)

2024-05-05(0)

2024-05-04(18)

2024-05-03(8)

2024-05-02(0)

2024-05-01(4)

2024-04-30(36)

2024-04-29(5)

2024-04-28(12)

2024-04-27(29)