牛客网专项练习Pytnon分析库（六）

1.以下哪个不是数据缺失的类型（D）。

A.随机丢失

B.完全随机丢失

C.非随机丢失

D.故意丢失

解析：

数据缺失的类型包括：随机丢失、完全随机丢失和非随机丢失；随机丢失意味着数据丢失的概率与丢失的数据本身无关，而仅与部分已观测到的数据有关。完全随机丢失指的是数据的缺失依赖于不完全变量自身。非随机丢失数据指的是数据的缺失依赖于不完全变量自身。

2.以下选项中哪个可以输出DataFrame类型数据中data的行索引（B）。

A.data.columns()

B.data.index()

C.data.head()

D.data.info()

解析：

A.中的columns()方法是用来提取DataFrame类型数据中的列索引；

B.中的index()方法是用来提取DataFrame类型数据中的行索引；

C.head()方法显示data前n行数据；

D.info()函数用于给出样本数据的相关信息概览，包括行数，列数，列索引，列非空值个数，列类型，内存占用；

故正确答案选B。

3.在ndarray类型的数组中，以下哪项不是用于切割数组的函数（D）。

A.split()

B.array_split()

C.hsplit()

D.groupby()

解析：

ABC选项都属于ndarray类型数组的切割操作。

A项split()可以实现水平切割或者垂直切割，split必须要均等分；

B项array_split()可以实现水平切割或者垂直切割（强制切割），指定切割后的数目实现近似均匀切割；

C项hsplit()可以沿横轴(纵向)拆分原array，可以实现均匀切割或者指定位置切割；

D项groupby() 是用于pandas库中对DataFrame数据进行数据的分组以及分组后地组内运算；

故正确答案选D。

4.Matplotlib 使用plt.subplots(m,n)函数绘制多图的时候，下列说法不正确的是（C）。

A.plt.subplots()函数返回的是图形对象和所有的axes对象

B.ax.flatten()函数可以将m*n的子图展平成1*nm的axes组

C.subplot()函数和subplots() 函数相比，只创建了一个figure图形对象

D.axes对象使用set_title()函数为子图添加标题

解析：

选项A，plt.subplots(m,n)函数的返回值是一个元组，包括一个图形对象(fig)和所有的axes对象,其中axes 对象数量为m*n，因此A描述正确；

选项B，在用plt.subplots(m,n)画多个子图时，ax=ax.flatten()操作将ax由n*m的Axes组展平成1*nm的Axes组，因此B项描述正确；

选项C，subplots() 函数和 subplot() 函数使用方法类似。其不同之处在于，subplots() 既创建了一个包含子图区域的画布，又创建了一个 figure 图形对象，而 subplot()只是创建一个包含子图区域的画布。因此C项描述不正确；

选项D，ax.set_title()是给ax子图设置标题，当子图存在多个的时候，可以通过ax设置不同的标题；

故正确答案选C。

5.NumPy 库中提供了多种排序函数，下列哪种排序函数能够返回排序后的元素索引数组（B）。

A.numpy.sort()

B.numpy.argsort()

C.numpy.where()

D.numpy.nonzero()

解析：

A选项，numpy.sort()对输入数组执行排序，并返回一个排序好的数组副本；

B选项，numpy.argsort()对输入数组的元素值进行排序，并返回排序后的元素索引数组；

C选项，numpy.where() 的返回值是满足了给定条件的元素索引值；

D选项，numpy.nonzero()该函数从数组中查找非零元素的索引位置；

故正确答案选B。

牛客网专项练习Pytnon分析库（六）

猜你喜欢