【Python提取Excel表格中符合条件的数据】

使用Python提取Excel表格中符合条件的数据

在数据处理和分析的过程中,我们经常需要从Excel表格中提取特定条件下的数据。Python的pandas库为我们提供了方便的方法来进行数据查询和过滤。

表格内容如下:

序号 x y
1 1.5 2.8
2 3.2 4.7
3 2.1 3.6
4 4.3 1.9
5 4.1 3.2

我们的目标是从上述表格中提取x和y列中大于2.5且小于5的数据。

query方法提取数据

首先,我们将使用query方法来提取符合条件的数据。query方法允许我们使用类似SQL的语法进行数据查询。

import pandas as pd

# 读取Excel表格
df = pd.read_excel('data.xlsx')  # 将'data.xlsx'替换为你的文件路径

# 使用query方法进行查询
query_string = '2.5 < x < 5 and 2.5 < y < 5'
filtered_data = df.query(query_string)

# 打印提取的数据
print(filtered_data)

运行以上代码,输出结果如下:

   序号    x    y
1   2    3.2   4.7
4   5    4.1   3.2

用布尔索引提取数据

除了使用query方法,我们还可以使用布尔索引来实现相同的数据提取功能。布尔索引允许我们根据条件创建布尔数组,然后通过这个布尔数组来对DataFrame进行索引。

import pandas as pd

# 读取Excel表格
df = pd.read_excel('data.xlsx')  # 将'data.xlsx'替换为你的文件路径

# 提取满足条件的数据
filtered_data = df[(df['x'] > 2.5) & (df['x'] < 5) & (df['y'] > 2.5) & (df['y'] < 5)]

# 打印提取的数据
print(filtered_data)

运行以上代码,输出结果如下:

   序号    x    y
1   2    3.2   4.7
4   5    4.1   3.2

猜你喜欢

转载自blog.csdn.net/qq_66726657/article/details/131926735