#!/usr/bin/env python
# coding: utf-8
# # 第一课 数据分析工具Pandas高阶
# ## 第二节 随机采样
# In[1]:
import pandas as pd
import numpy as np
# * 读取文件
# In[2]:
raw_df = pd.read_csv('./datasets/2016_happiness.csv')
# In[3]:
raw_df.shape
# In[4]:
# 过滤前5行数据
proc_df = raw_df.iloc[:5, :]
# In[5]:
proc_df
# * 随机采样
# In[8]:
proc_df.sample()
# * 指定采样个数
# In[10]:
proc_df.sample(n=2)
# * 指定采样比例
# In[12]:
proc_df.sample(frac=0.2)
# * 重复采样
# In[13]:
# 当采样个数大于样本个数时,如果replace为False,会报错
proc_df.sample(n=6)
# In[15]:
# 设置replace为True
proc_df.sample(n=6, replace=True)
# * 使用随机种子
# In[26]:
proc_df.sample(random_state=1)
# * 在列方向随机采样
# In[28]:
proc_df.sample(axis=1)
# In[ ]:
pandas-随机采样
猜你喜欢
转载自blog.csdn.net/lildn/article/details/114681288
今日推荐
周排行