1. 主成分分析 (D) の役割ではないものは次のうちどれですか。
A. 研究対象のデータ空間の次元を削減します。
B. 主成分分析による回帰モデルの構築
C. 主成分分析によるリグレッサーのスクリーニング
D. 入力データに対して線形変換および非線形変換を実行できる
解析:
主成分分析法の主な機能: 調査対象のデータ空間の次元を削減する; 主成分分析を使用して回帰モデルを構築する; 主成分分析を使用して回帰変数をスクリーニングする; 多次元データのグラフ表示; 結論因子負荷aijの値が得られる, X変数間の特定の関係を明らかにする; 選択肢D: 主成分分析は線形変換しかできないため、項目Dは誤りです。
2. リスト listname 内の要素を削除します。要素の値に応じて削除操作を実行するメソッドまたは関数 (C) はどれですか。
A.del リスト名[]
B.listname.pop()
C.listname.remove()
D.リスト名.clear()
解析:
オプション A とオプション B はどちらも、リスト内のインデックス値に従って要素を削除する操作です。
D オプションは、リスト内のすべての要素を削除する操作です。
C オプションは、リスト内の要素値に従って要素を削除するため、C オプションを選択します。
3. 以下は DataFrame 型のデータ df です。
名前 |
グッドレーベル |
|
0 | 小明 |
001 |
1 | リミング |
003 |
2 | 多くの |
005 |
3 | 中明 |
006 |
4 | リミング |
011 |
5 | 粘膜 |
002 |
[名前] 列に名前「Liming」を含む行 (D) を抽出できないオプションはどれですか。
A.df[df['名前']=='リミング']
B.df[df['名前'].str.contains('リミング')]
C.df[df['名前'].str.contains('Lim*')]
D.df[df['name'].str.startswith('Li')]
解析:
A. 完全一致演算子を使用します。最初に「==」を使用して True である pandas.Series を取得し、次に True である行を抽出します。
B. 部分一致演算子: str.contains() には特定の文字列が含まれ、ブール データを返し、True である行を抽出します。
C. B と同じ方法ですが、検索方法が正規表現検索に変換されます。
D.str.startswith() は、特定の文字列で始まる pandas.Series を取得できます。
したがって、正解は選択肢 D です。
4. 次のオプションのうち、データの欠損値を処理する方法ではないものはどれですか (C)。
A.df.drop()
B.df.fillna()
C.np.empty()
D.sklearn.impute.SimpleImputer()
解析:
オプション A、pandas ライブラリの Dropna() 関数を使用して、DataFrame データ内の欠損値を持つサンプルをドロップします。
オプション B、pandas ライブラリの fillna() 関数を使用して欠損値を埋めます。
C オプションの np.empty() 関数は初期化されていない配列を作成しますが、これは欠損値を処理する方法ではありません。
D オプション。sklearn パッケージの impute の SimpleImputer() を使用します。
欠損値を埋める機能があるため、選択が間違っている場合は、オプション C を選択する必要があります。
5. 次のオプションのうち、データ標準化の方法ではないものはどれですか (B)。
AZスコア方式
B. PCA法
C. 最小-最大正規化
D. 最大化法
解析:
一般的に使用される標準化方法には、範囲標準化方法 (最小-最大方法)、Z スコア標準化方法、線形比例標準化方法: 最大化方法、最小値方法、対数関数標準化方法および逆正接関数標準化方法、PCA 方法としても知られています。主成分分析手法としての は、データの次元削減手法であり、標準化された手法ではありません。