pandas之筛选字符串字段。 Series.str.contains()

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/soulwyb/article/details/88048072
new_df_object = old_df_object[old_df_object.name.str.contains(r'.*?中国.*')]

这条语句会筛出old_df_object中name字段中的每一条是否包含中国字样的bool类型的Series。有则true,无则false。

然后将此Series对象传给old_df_object[]中。DataFrame对象会根据传进来的Series中每一行的布尔值来决定是否要筛出数据。最后将所有为True的行组成1个新的DataFrame对象赋值给new_df_object

参考数据:

DataFrame官方文档

http://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.html#pandas.DataFrame

Series.str.contains官方文档

http://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.str.contains.html#pandas.Series.str.contains

DataFrame对象选取数据判断条件:

https://www.jianshu.com/p/127587a80491

这里顺便记下: 当使用df的to_excel()函数报ValueError: No engine for filetype: '错误时。这表明文件名后缀不对。应该称.xls

猜你喜欢

转载自blog.csdn.net/soulwyb/article/details/88048072
今日推荐