python如何优雅的将pandas的df类目由驼峰式改为下滑线式

本文用到的数据,可以加QQ跟群主获取:
群名称:PYTHONERS-数据
群 号:663468799
学习python和数据分析推荐地方: www.lynda.com
获取lynda官网会员的方式:get_lynda_com()


如何优雅的将驼峰式改为下划线式命名。

总所周知,当时用pandas 的df.read_csv()方法后,读取的dataframe列名很多时候有可能是使用驼峰式命名的,而python的使用习惯是下划线式命名, 那么如何通过一个函数简单优雅的将df.columns转化为小写的下划线式命名呢?
以下是代码,直接拷贝使用

import re 
def clean_columns(name):
    name = name.strip()
    s1 = re.sub('(.)([A-Z][a-z]+)', r'\1_\2', name)
    return re.sub('([a-z0-9])([A-Z])', r'\1_\2', s1).lower()
df.columns = [clean_columns(name) for name in df.columns]

拿走不谢。喜欢学习数据分析和pandas的同学可以看看 dataquest, 直达电梯: dataquest.io

猜你喜欢

转载自blog.csdn.net/birdflyinhigh/article/details/84393525