错误记录:ValueError: Usecols do not match columns, columns expected but not found

读取波士顿房价数据提示:

ValueError: Usecols do not match columns, columns expected but not found: ['RM', 'AGE', 'CRIM', 'INDUS', 'ZN', 'CHAS', 'NOX', 'DIS']

代码如下:

df = pd.read_csv(
    # 该参数为数据在电脑中的路径,可以不填写
    filepath_or_buffer='boston_house_prices.csv',
    # 该参数代表数据的分隔符,csv文件默认是逗号。其他常见的是'\t'
    sep=',',
    # 该参数代表跳过数据文件的的第1行不读入
    skiprows=1,
    # nrows,只读取前n行数据,若不指定,读入全部的数据
    # nrows=5,
    # 将指定列的数据识别为日期格式。若不指定,时间数据将会以字符串形式读入。一开始先不用。
    # parse_dates=['CRIM'],
    # 将指定列设置为index。若不指定,index默认为0, 1, 2, 3, 4...
    # index_col=['CRIM'],
    # 读取指定的这几列数据,其他数据不读取。若不指定,读入全部列
    usecols = ['CRIM', 'ZN', 'INDUS', 'CHAS', 'NOX', 'RM', 'AGE', 'DIS'],
    # usecols = ['CRIM'],
    # # 当某行数据有问题时,报错。设定为False时即不报错,直接跳过该行。当数据比较脏乱的时候用这个。
    # error_bad_lines=False,
    # # 将数据中的null识别为空值
    # na_values='NULL',
)
print(df)

错误原因,首先检查字段名称是否有误,确认无误。

这个问题发的原因是:

skiprows=1和usecols =[]不能同时使用,第一行是列名称,跳过之后就找不到了,就报错。

猜你喜欢

转载自blog.csdn.net/soderayer/article/details/129593101
今日推荐