Niuke.com 特別演習 Pytnon 解析ライブラリ (10)

1.Python Pandas は欠損値を処理します。欠損値 NaN (C) を削除するには次のオプションがあります。

A.はヌルです

B.notnull

C. ドロップナ

D.フィルナ

解析:

       オプションの Isnull() は、どの値が欠損値であるかを示すブール値を返します。

       B オプションの notnull() は、どの値が欠損値ではないかを示すブール値を返します。

       C オプションの Dropna() はデータを処理し、デフォルトでは NA 値を含むすべての行が削除されます。

       D オプションの fillna() は、データ data 内の欠損値を補完します。

       したがって、正解は選択肢Cです。


2. 以下では、pandas ライブラリの to_numberic(arg,errors,downcast) 関数のパラメーターの間違ったオプション (D) について説明します。

A.errors='raise' は数値以外の文字列を数値に変換します。データに数値以外の文字列が含まれる場合はエラーが返され、時刻型は int に変換されます。

B.errors='ignore' は数値文字列のみを変換し、他の型は変換しません。

C.errors='coerce' は、数値文字列と bool 型を数値に変換し、その他は NaN に変換します。

D.downcast = 'signed' すべての値は float に変換されます。

解析:

       エラーには 3 つのパラメータ {'ignore'、'raise'、'coerce'} が存在します。デフォルトは 'raise' です。「raise」の場合、無効な解析は例外を発生させます。「force」の場合、無効な解析は NaN を設定します。「ignore」の場合、無効な解析は入力を返します。downcast = 'signed' すべての値は整数に変換されます。


3. 表に示すように、DataFrame タイプのデータ出力結果のセットがあります。

索引 B C
0 1 4 7
1 2 5 8
2 3 6 9

次に、次のように DataFrame データの「5」を取得できるオプション (B) はどれですか。

A.data.iloc[1,'B']

B.data.iloc[1,1]

C.data.loc(1,'B')

D.日付.場所[1,1]

解析:

       panda パッケージで DataFrame タイプのデータを処理する場合、iloc はインデックス値に従ってデータ要素を配置し、loc はラベル値に従って要素を配置するため、このトピックでは B を選択する必要があります。


4. ビジュアル拡張ライブラリ matplotlib の pyplot モジュールの legend() 関数を使用して画像のタイトルを設定する場合、テキストのフォント (B) を設定するために次のパラメータのどれが使用されます。

場所

B.プロップ

C.フォントサイズ

D.フレイモン

解析:

       オプションの loc パラメータは、グラフ列の位置を設定します。

       B オプション、prop はフォントパラメータを設定します。

       C オプションの fontsize パラメータは、凡例のフォント サイズを設定します。

       D オプションの Frameon は、凡例の周囲にフレームを描画するかどうかを制御します。

       したがって、オプション B を選択します。  


5. 以下は DataFrame 型のデータ df です

名前 グッドレーベル
0

小明

001
1 リミング 003
2 多くの 005
3 中明 006
4 リミング 011
5 粘膜 002

オプションのどの操作で列名「Goodlabel」を「label」に変更できませんか (D)。

A.df.columns=['名前','ラベル']

B.df=pd.read_excel("C:/.../Workbook1.xlsx",columns=['名前','ラベル'])

C.df.rename(columns={'Goodlabel':'label'})

D.df.rename(columns={'Goodlabel':'label'},inplace=True)

解析:

       A. df の列名を暴力的な手段で直接変更します。 

       B. pandas が Excel データリストを読み取るとき、読み取り時に列名を直接変更します。

       C.とD.のオプションは同じ方法で、rename関数を使用して指定した列の列名を変更しますが、後でinplaceパラメータを使用してTrueに設定する必要があるため、D.オプションを選択します。

おすすめ

転載: blog.csdn.net/u013157570/article/details/129100754