牛客网专项练习Pytnon分析库(十)

1.Python Pandas处理缺失值,以下哪个选项是对缺失值NaN进行删除操作(C)。

A.isnull

B.notnull

C.dropna

D.fillna

解析:

       A选项,Isnull()返回表明哪些值是缺失值的布尔值;

       B选项,notnull()返回表明哪些值不是缺失值的布尔值;

       C选项,dropna()对data进行处理,在默认情况下会删除所有包含NA值的行;

       D选项,fillna()补全data数据中的缺失值;

       故正确答案选择C。


2.以下对pandas库中的to_numberic(arg,errors,downcast)函数的参数解释错误的选项(D)。

A.errors=’raise’将非数字字符串转换为数字,数据中如果存在非数字字符串则会返回出错误,时间类型转换为int。

B.errors=’ignore’只对数字字符串进行转换,其他类型一律不转换。

C.errors='coerce'将数字字符串和bool类型转换为数字,其他均转换为NaN。

D.downcast =’signed’所有值都将转换为浮点型。

解析:

       errors存在三个参数{'ignore','raise','coerce'},默认情况下为'raise'。如果为“ raise”,则无效的解析将引发异常;如果为“强制”,则无效的解析将设置为NaN;如果为“ ignore”,则无效的解析将返回输入。downcast =’signed’所有值都将转换为整型。


3.存在一组DataFrame类型数据data数据输出结果如表格所示:

index A B C
0 1 4 7
1 2 5 8
2 3 6 9

那么以下可以获得DataFrame数据中‘5’的选项是哪个(B)。

A.data.iloc[1,’B’]

B.data.iloc[1,1]

C.data.loc(1,’B’)

D.data.loc[1,1]

解析:

       在panda包中处理DataFrame类型数据时候,iloc按照索引值来定位数据元素,loc是按照标签值来定位元素,所以在这个题目当中应该选择B。


4.使用可视化扩展库matplotlib中的pyplot模块中的legend()函数设置图像标题时,下面哪个参数用来设置文本的字体(B)。

A.loc

B.prop

C.fontsize

D.frameon

解析:

       A选项,loc参数设置图列位置;

       B选项,prop设置字体参数;

       C选项,fontsize参数设置图例字体大小;

       D选项,frameon控制是否应在图例周围绘制框架;

       因此选择B选项。  


5.以下为DataFrame类型数据df

Name Goodlabel
0

Xiaoming

001
1 Liming 003
2 Daming 005
3 Zhongming 006
4 Liming 011
5 Lining 002

选项中哪种操作不能够实现将列名’Goodlabel’换为’label’(D)。

A.df.columns=['Name','label']

B.df=pd.read_excel("C:/.../工作簿1.xlsx",columns=['Name','label'])

C.df.rename(columns={'Goodlabel':’label’})

D.df.rename(columns={'Goodlabel':’label’},inplace=True)

解析:

       A.直接通过暴力手段修改df的列名称; 

       B.在pandas读取excle数据列表的时候,直接在读取时更改列名;

       C.和D.选项是一样的方法,使用rename函数修改指定列的列名,但是后面需要使用inplace参数,并设置为True,因此选择D选项。

猜你喜欢

转载自blog.csdn.net/u013157570/article/details/129100754