机器学习|总体与样本|5mins入门|概统学习笔记(十八)

总体和样本

  • 总体:研究对象(可以是物体的某个属性,或某种数量指标)的全体,总体中每个成员称为个体

    由于每个个体的出现是随机的,所以相应的数量指标的出现也带有随机性。从而可以把这种数量指标看作一个随机变量,因此随机变量的分布就是该数量指标在总体中的分布。

    总体的性质,就是这些指标值的集体的性质。这样,总体就可以用一个随机变量及其概率分布来描述。因此理论上,可以将总体与概率分布等同起来。

    鉴于此,常用随机变量的记号或用其分布函数来表示总体。比如说总体X或总体 F ( X ) F(X)

  • 抽样:为判断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息的抽取过程。

    样本:所抽取的部分个体

    样本容量:样本中所包含的个体数目

    样本值:一旦取定一组样本,得到的是n个具体的数 ( X 1 , X 2 , . . . , X n ) (X_1,X_2,...,X_n) ,称为样本的一次观察值

  • 抽样方法:”简单随机抽样“

    特点:

    1. 代表性: X 1 , X 2 , . . . , X n X_1,X_2,...,X_n 中每一个与所考察的总体有相同的分布

    2. 独立性: X 1 , X 2 , . . . , X n X_1,X_2,...,X_n 是相互独立的随机变量

  • 简单随机样本:由简单随机抽样得到的样本

    它可以用与总体独立同分布的n个相互独立的随机变量 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n 表示

    若总体的分布函数为 F ( x ) F(x) ,则其简单随机样本的联合分布函数为$

发布了37 篇原创文章 · 获赞 0 · 访问量 799

猜你喜欢

转载自blog.csdn.net/SanyHo/article/details/105208775