pandas 语法

1. df样本乱序

df = df.sample(frac=1)

2. 将某列内容展开

例如,csv文件如下

label	tags
传统节日	清明节,春节,中秋节,国庆节
国家	美国,中国,日本

希望获取如下的df文件

label	tags
传统节日	清明节
传统节日	春节
传统节日	中秋节
传统节日	国庆节
df_new = df.drop('tags', axis=1).join(df_tags['tags'].str.split(',', expand=True).stack().reset_index(level=1, drop=True).rename('tags'))

3. 字符串转日期

若df中该列的格式不是日期的标准格式:%Y-%m-%d %H:%M:%S,需要进行格式转换

def format_time(s):
	"""
    若原始数据格式为:2020年3月4号 17:48:43
    :param s: 
    :return: 
    """
	return datetime.datetime.strptime(tender_time,'%Y年%m月%d号 %H:%M:%S')


df['publish_time'] = df['publish_time'].apply(lambda x: format_time(x))
df['publish_time'] = pd.to_datetime(df['publish_time'])
df['year'] = df['publish_time'].dt.year
df['month'] = df['publish_time'].dt.month

猜你喜欢

转载自blog.csdn.net/shlhhy/article/details/107616736