Niuke.com 特別演習 Pytnon 解析ライブラリ (3)

1. 主成分分析 (D) の役割ではないものは次のうちどれですか。

A. 研究対象のデータ空間の次元を削減します。

B. 主成分分析による回帰モデルの構築

C. 主成分分析によるリグレッサーのスクリーニング

D. 入力データに対して線形変換および非線形変換を実行できる

解析:

       主成分分析法の主な機能: 調査対象のデータ空間の次元を削減する; 主成分分析を使用して回帰モデルを構築する; 主成分分析を使用して回帰変数をスクリーニングする; 多次元データのグラフ表示; 結論因子負荷aijの値が得られる, X変数間の特定の関係を明らかにする; 選択肢D: 主成分分析は線形変換しかできないため、項目Dは誤りです。


2. リスト listname 内の要素を削除します。要素の値に応じて削除操作を実行するメソッドまたは関数 (C) はどれですか。

A.del リスト名[]

B.listname.pop()

C.listname.remove()

D.リスト名.clear()

解析:

       オプション A とオプション B はどちらも、リスト内のインデックス値に従って要素を削除する操作です。

       D オプションは、リスト内のすべての要素を削除する操作です。

       C オプションは、リスト内の要素値に従って要素を削除するため、C オプションを選択します。


3. 以下は DataFrame 型のデータ df です。

名前

グッドレーベル

0

小明

001

1

リミング

003
2

多くの

005
3

中明

006
4

リミング

011
5

粘膜

002

[名前] 列に名前「Liming」を含む行 (D) を抽出できないオプションはどれですか。

A.df[df['名前']=='リミング']

B.df[df['名前'].str.contains('リミング')]

C.df[df['名前'].str.contains('Lim*')]

D.df[df['name'].str.startswith('Li')]

解析:

       A. 完全一致演算子を使用します。最初に「==」を使用して True である pandas.Series を取得し、次に True である行を抽出します。

       B. 部分一致演算子: str.contains() には特定の文字列が含まれ、ブール データを返し、True である行を抽出します。

       C. B と同じ方法ですが、検索方法が正規表現検索に変換されます。

       D.str.startswith() は、特定の文字列で始まる pandas.Series を取得できます。

       したがって、正解は選択肢 D です。


4. 次のオプションのうち、データの欠損値を処理する方法ではないものはどれですか (C)。

A.df.drop()

B.df.fillna()

C.np.empty()

D.sklearn.impute.SimpleImputer()

解析:

       オプション A、pandas ライブラリの Dropna() 関数を使用して、DataFrame データ内の欠損値を持つサンプルをドロップします。

       オプション B、pandas ライブラリの fillna() 関数を使用して欠損値を埋めます。

       C オプションの np.empty() 関数は初期化されていない配列を作成しますが、これは欠損値を処理する方法ではありません。

       D オプション。sklearn パッケージの impute の SimpleImputer() を使用します。

       欠損値を埋める機能があるため、選択が間違っている場合は、オプション C を選択する必要があります。


5. 次のオプションのうち、データ標準化の方法ではないものはどれですか (B)。

AZスコア方式

B. PCA法

C. 最小-最大正規化

D. 最大化法

解析:

       一般的に使用される標準化方法には、範囲標準化方法 (最小-最大方法)、Z スコア標準化方法、線形比例標準化方法: 最大化方法、最小値方法、対数関数標準化方法および逆正接関数標準化方法、PCA 方法としても知られています。主成分分析手法としての は、データの次元削減手法であり、標準化された手法ではありません。

おすすめ

転載: blog.csdn.net/u013157570/article/details/129100053