Niuke.com 特別演習 Pytnon 解析ライブラリ (1)

1. 2 つの配列 a と b の共通項目を抽出するには、numpy ライブラリの関数 (A) を使用できます。

A.np.intersect1d(a,b)

B.np.setdiff1d(a,b)

C.np.where(a == b)

D.np.lexsort((a,b))

解析: 

       オプション np.intersect1d は、配列 a と配列 b の間の共通項目を取得するために使用されます。

       B オプションの np.setdiff1d(a,b) は、b 配列に存在する項目を a 配列から削除するために使用されます。

       C オプションの np.where(a == b) メソッドは、配列 a と配列 b 要素の一致する位置を取得するために使用されます。

       D オプションは、キー シーケンスによって配列を並べ替える並べ替えアルゴリズムであり、並べ替えられたインデックス配列を返します。

       したがって、正解は選択肢Aとなります。


2. Matplotlib を使用して Python で折れ線グラフを描画します。次のオプションで、プロット線の種類、線の色、点の形状はどれか、青い星点線 (D) になります。

A.'b×:'

B.「何――」

く、く、

D.'b*-.'

解析:

       ABCD の 4 つの文字列では、最初のバイトは色を表し、2 バイト目は点の形状を表し、3 バイト目は線の形状を表します。色表現 'b': ブルー、'c': シアン、'k': ブラック、ドット形状表現 '×': × マーク、'o': 丸、's': 四角、'*': 星、形状行の「:」: 点線、「--」: 点線、「-」: 実線、「-.」: 点線を意味するため、この質問では選択肢 D を選択してください。


3. DataFrame データ df (B) の列内の各文字列の出現数をカウントする方法。

A.df[].unique()

B.df[].value_counts()

C.df[].nunique()

D.df[].count()

解析:

       A. unique(): NumPy 配列 ndarray 内の固有の要素値のリストを返します。

       B.value_counts(): 一意の要素の値とその出現数を返します。

       C.nunique() は、一意の要素の数を整数 int の形式で返します。

       D.count() メソッドは、空でない文字列の数をカウントするために使用されます。

       したがって、正解は選択肢Bとなります。


4. 次のステートメントにより、下図 (B) の DataFrame テーブルを作成できます。

A.

import pandas as pd
import numpy as np

data = 
{'Coffee': 'Latte', 'Flat White', 'Mocha', 'Americano', 'Cappuccino'},
{'Price': 29, 32, 36, 22, 36}
df = pd.DataFrame(data)

B.

import pandas as pd
import numpy as np

data = {
'Coffee': ['Latte', 'Flat White', 'Mocha', 'Americano', 'Cappuccino'],
'Price': [29, 32, 36, 22, 36]}
df = pd.DataFrame(data)

C.

import pandas as pd
import numpy as np

data = [['Latte', 29], ['Flat White', 32], ['Mocha', 36], ['Americano', 22], [ 'Cappuccino', 36]]
df = pd.DataFrame(data)

D.

import pandas as pd
import numpy as np

data = {
   
   {'Coffee': 'Latte', 'Price': 29}, {'Coffee': 'Flat White', 'Price': 32}, {'Coffee': 'Mocha', 'Price': 36}, {'Coffee': 'Americano', 'Price': 22}, {'Coffee': 'Cappuccino', 'Price': 36}}
df = pd.DataFrame(data)

解析:

       pandas で DataFrame を作成する方法は数多くありますが、一般的に使用されるのは次の 3 つです。

       1 つ目: リストを使用して作成します。具体的な構文は、
       data = [[最初の行の最初の列の値、最初の行の 2 番目の列の値]、[2 行目の最初の列の値、2 番目の列の値2 行目]] df = pd
       . DataFrame(data, columns=['column name', 'column name'])
       ここで、括弧内のサブ括弧はデータの各行を表し、それを DataFrame 関数に入れます。ただし、DataFrame の列名を設定するには columns パラメーターを使用することを忘れないでください。そうしないと、デフォルトで 0 から始まる番号が列名として使用されます。
       したがって、列名を設定しないオプション C は除外できます。

       2 番目のタイプ: 辞書 dict を使用して作成します。
       data = [{key1: value1}, {key2: value2}, {key3: value3}] 
       df = pd.DataFrame(data)
       ここで、key は DataFrame の列名、value はそれぞれに対応する列の値です。行。
       したがって、最も外側の括弧は中括弧 {} ではなく括弧 [] であるため、オプション D も除外できます。

       3 番目のタイプ: ndarray で作成されます。
       data = {'columns_1':[values1], 'columns_2':[values2]} 
       df = pd.DataFrame(data)
       ここで、columns_1 は各列の列名、values1 は各列に対応する値またはデータです。

       したがって、オプション A は除外できます。列名の後の対応する列値には角かっこ [] がありません。B のみが正しいです。


5. 欠損値への対処方法(D)は次のどれですか。

①情報が欠損しているサンプルを削除する ②欠損部分を補間する ③値が欠落しているサンプルは処理しない

A.①②

B.①③

C.②③

D.①②③

解析:

       欠損値の処理方法には、サンプルの削除、補完、処理せずに保持するなどがあります。

おすすめ

転載: blog.csdn.net/u013157570/article/details/129097267