1. 次のコードの円グラフは (D) です。
A.plt.boxplot()
B.plt.plot()
C.plt.bar()
D.plt.pie()
解析:
A.boxplot() は箱ひげ図を描画するために使用されます。
B.plot() は折れ線グラフを描画します。
C.bar() はヒストグラムを描画します。
D.pie() は円グラフを描画します。
したがって、正解は D です。
2. 欠損値を引き起こす要因は何ですか (D)。
① 情報が一時的に利用できなくなっている ② 人的要因により記録されていない ③ この情報を取得するコストが高すぎる
④一部のオブジェクトの 1 つまたは一部の属性が利用できない ⑤システムは高いリアルタイム性を必要とする
A.①②③
B.①③④
C.③④⑤
D.①②③④⑤
解析:
値が欠落する理由:
情報は一時的に利用できなくなりました。たとえば、特定の製品の収入にはヒステリシス効果があります。
データが記録されない、人為的要因により省略または消失する。これがデータ欠落の主な理由である。
データ収集機器、記憶媒体、伝送媒体の故障によるデータの損失。
この情報を入手するコストは高すぎます。
未婚者の配偶者の名前、子供の固定収入の状況など、一部のオブジェクトの 1 つ以上の属性は利用できません。
システムのリアルタイム性要求は高く、情報を取得する前に迅速な判断や決定を行うことが求められます。
3.plt.title("右下", y=0, loc='right') このうち、locは何を表しているのか(C)。
A. タイトルの文字色
B. タイトルサイズ
C. タイトルの位置
D. フォントのプロパティ
解析:
plt.title() 関数には位置を制御する 2 つのパラメータがあり、1 つは y で、もう 1 つは loc パラメータです。y パラメータはサブマップ内のタイトルの垂直距離を制御します。単位はサブマップの高さのパーセンテージで、1.0 はサブマップの上部、0 はサブマップの下部です。loc パラメータは、left、center、right の値の範囲を制御し、デフォルト値は middle です。fontdict パラメータのタイプは、テキストの色やテキスト サイズなどの情報を含む、テキストのフォント プロパティを制御する辞書です。 。
4. 2 つの変数間の線形相関の程度、相関係数 r(A) が強くなります。
A の絶対値が 1 に近づくほど
B の絶対値が 0 に近づくほど
C が 1 に近い
Dが0に近づくほど
解析:
線形に関連する 2 つの変数間の相関係数 r は、r の絶対値が 1 に近づくほど、2 つの変数間の線形相関が強くなります。r が 1 の場合は完全に相関があることを意味し、r=0 の場合は完全に無相関であることを意味し、r が正の場合は 2 つの変数に正の相関があることを意味し、r が負の場合は 2 つの変数が正の相関があることを意味します。 2 つの変数は負の相関があるため、正解は A になります。
5. 以下は DataFrame タイプのデータ df です。
名前 |
グッドレーベル |
|
0 | 小明 |
001 |
1 | リミング |
003 |
2 | 多くの |
005 |
3 | 中明 |
006 |
4 | リミング |
011 |
5 | 粘膜 |
002 |
オプションのどの操作で列名「Goodlabel」を「label」に変更できませんか (D)。
A.df.columns=['名前','ラベル']
B.df=pd.read_excel("C:/.../Workbook1.xlsx",columns=['名前','ラベル'])
C.df.rename(columns={'Goodlabel':'label'})
D.df.rename(columns={'Goodlabel':'label'},inplace=True)
解析:
A. df の列名を暴力的な手段で直接変更します。
B. pandas が Excel データリストを読み取るとき、読み取り時に列名を直接変更します。
C.とD.のオプションは同じ方法で、rename関数を使用して指定した列の列名を変更しますが、後者はinplaceパラメータを使用してTrueに設定する必要があるため、D.オプションを選択します。