データ分析における変数の解釈

1. 数値変数

数値変数(計量変数)とは、物事のデジタル的な特性を表す名前であり、その値は数値データです。たとえば、「製品の生産量」、「商品の売上」、「部品のサイズ」、「年齢」、および「時間」はすべて数値変数であり、これらの変数は異なる値を取ることができます。数値変数は、その値の違いに応じて離散変数連続変数に分類できます一般にコンピュータで認識できる文字はASCIIコードに相当し、ASCIIコードは数値データです。ASCII コードの値が変更されると、対応する文字も変更されます。したがって、非数値データは本質的には数値データです。人々の思考習慣に近づき、プログラムの作成を容易にするために、高級コンピュータ言語はデータ型を分割します。数値データには、整数、単精度、倍精度が含まれます数値以外のデータ型は、文字型、ブール型、文字列型です。

1.1 離散変数の離散特徴

離散変数とは、値が特定の順序 (通常は整数ビット) で 1 つずつリストできる変数を指します。
離散変数の確率分布には、二項分布とポアソン分布がよく使用されます。確率分布には他にも、2 点分布、幾何分布、超幾何分布などがあります。

1.2 連続変数

一定の区間内で任意の値をとり得る変数を連続変数といい、その値は連続であり、隣接する2つの値は無限に分割することができ、つまり無限個の値をとり得る。
連続変数の確率分布には、指数分布、一様分布、正規分布などがよく使われます。

例:

離散変数:

1. 書籍内の印刷エラーの数。

2. ニューデリーの交通事故件数。

3. 個人的な兄弟の数。

連続変数:

1. 人の身長

2. 人の年齢

3. 会社が得た利益。

おすすめ

転載: blog.csdn.net/guoguozgw/article/details/129259538