pandas-随机采样

在这里插入图片描述

#!/usr/bin/env python
# coding: utf-8

# # 第一课 数据分析工具Pandas高阶
# ## 第二节 随机采样

# In[1]:


import pandas as pd
import numpy as np


# * 读取文件

# In[2]:


raw_df = pd.read_csv('./datasets/2016_happiness.csv')


# In[3]:


raw_df.shape


# In[4]:


# 过滤前5行数据
proc_df = raw_df.iloc[:5, :]


# In[5]:


proc_df


# * 随机采样

# In[8]:


proc_df.sample()


# * 指定采样个数

# In[10]:


proc_df.sample(n=2)


# * 指定采样比例

# In[12]:


proc_df.sample(frac=0.2)


# * 重复采样

# In[13]:


# 当采样个数大于样本个数时,如果replace为False,会报错
proc_df.sample(n=6)


# In[15]:


# 设置replace为True
proc_df.sample(n=6, replace=True)


# * 使用随机种子

# In[26]:


proc_df.sample(random_state=1)


# * 在列方向随机采样

# In[28]:


proc_df.sample(axis=1)


# In[ ]:





猜你喜欢

转载自blog.csdn.net/lildn/article/details/114681288