1. 2 つの配列 a と b の共通項目を抽出するには、numpy ライブラリの関数 (A) を使用できます。
A.np.intersect1d(a,b)
B.np.setdiff1d(a,b)
C.np.where(a == b)
D.np.lexsort((a,b))
解析:
オプション np.intersect1d は、配列 a と配列 b の間の共通項目を取得するために使用されます。
B オプションの np.setdiff1d(a,b) は、b 配列に存在する項目を a 配列から削除するために使用されます。
C オプションの np.where(a == b) メソッドは、配列 a と配列 b 要素の一致する位置を取得するために使用されます。
D オプションは、キー シーケンスによって配列を並べ替える並べ替えアルゴリズムであり、並べ替えられたインデックス配列を返します。
したがって、正解は選択肢Aとなります。
2. Matplotlib を使用して Python で折れ線グラフを描画します。次のオプションで、プロット線の種類、線の色、点の形状はどれか、青い星点線 (D) になります。
A.'b×:'
B.「何――」
く、く、
D.'b*-.'
解析:
ABCD の 4 つの文字列では、最初のバイトは色を表し、2 バイト目は点の形状を表し、3 バイト目は線の形状を表します。色表現 'b': ブルー、'c': シアン、'k': ブラック、ドット形状表現 '×': × マーク、'o': 丸、's': 四角、'*': 星、形状行の「:」: 点線、「--」: 点線、「-」: 実線、「-.」: 点線を意味するため、この質問では選択肢 D を選択してください。
3. DataFrame データ df (B) の列内の各文字列の出現数をカウントする方法。
A.df[].unique()
B.df[].value_counts()
C.df[].nunique()
D.df[].count()
解析:
A. unique(): NumPy 配列 ndarray 内の固有の要素値のリストを返します。
B.value_counts(): 一意の要素の値とその出現数を返します。
C.nunique() は、一意の要素の数を整数 int の形式で返します。
D.count() メソッドは、空でない文字列の数をカウントするために使用されます。
したがって、正解は選択肢Bとなります。
4. 次のステートメントにより、下図 (B) の DataFrame テーブルを作成できます。
A.
import pandas as pd
import numpy as np
data =
{'Coffee': 'Latte', 'Flat White', 'Mocha', 'Americano', 'Cappuccino'},
{'Price': 29, 32, 36, 22, 36}
df = pd.DataFrame(data)
B.
import pandas as pd
import numpy as np
data = {
'Coffee': ['Latte', 'Flat White', 'Mocha', 'Americano', 'Cappuccino'],
'Price': [29, 32, 36, 22, 36]}
df = pd.DataFrame(data)
C.
import pandas as pd
import numpy as np
data = [['Latte', 29], ['Flat White', 32], ['Mocha', 36], ['Americano', 22], [ 'Cappuccino', 36]]
df = pd.DataFrame(data)
D.
import pandas as pd
import numpy as np
data = {
{'Coffee': 'Latte', 'Price': 29}, {'Coffee': 'Flat White', 'Price': 32}, {'Coffee': 'Mocha', 'Price': 36}, {'Coffee': 'Americano', 'Price': 22}, {'Coffee': 'Cappuccino', 'Price': 36}}
df = pd.DataFrame(data)
解析:
pandas で DataFrame を作成する方法は数多くありますが、一般的に使用されるのは次の 3 つです。
1 つ目: リストを使用して作成します。具体的な構文は、
data = [[最初の行の最初の列の値、最初の行の 2 番目の列の値]、[2 行目の最初の列の値、2 番目の列の値2 行目]] df = pd
. DataFrame(data, columns=['column name', 'column name'])
ここで、括弧内のサブ括弧はデータの各行を表し、それを DataFrame 関数に入れます。ただし、DataFrame の列名を設定するには columns パラメーターを使用することを忘れないでください。そうしないと、デフォルトで 0 から始まる番号が列名として使用されます。
したがって、列名を設定しないオプション C は除外できます。
2 番目のタイプ: 辞書 dict を使用して作成します。
data = [{key1: value1}, {key2: value2}, {key3: value3}]
df = pd.DataFrame(data)
ここで、key は DataFrame の列名、value はそれぞれに対応する列の値です。行。
したがって、最も外側の括弧は中括弧 {} ではなく括弧 [] であるため、オプション D も除外できます。
3 番目のタイプ: ndarray で作成されます。
data = {'columns_1':[values1], 'columns_2':[values2]}
df = pd.DataFrame(data)
ここで、columns_1 は各列の列名、values1 は各列に対応する値またはデータです。
したがって、オプション A は除外できます。列名の後の対応する列値には角かっこ [] がありません。B のみが正しいです。
5. 欠損値への対処方法(D)は次のどれですか。
①情報が欠損しているサンプルを削除する ②欠損部分を補間する ③値が欠落しているサンプルは処理しない
A.①②
B.①③
C.②③
D.①②③
解析:
欠損値の処理方法には、サンプルの削除、補完、処理せずに保持するなどがあります。