我谈概率论与数理统计的知识体系
学习概率统计二十多年后,在廖老师的指导下,终于明白各章之间的关系。本来就是一条线两个分支,脉络很清晰。
分支一:从随机现象到样本空间到随机事件再到概率。
从随机事件到随机变量:为了进行定量的数学处理,必须把随机现象的结果数量化,这就是引入随机变量的原因。
分支二:从随机现象到样本空间到随机变量的取值到分布,再到采样到随机样本,根据样本统计推断,估计分布。
概率论与数理统计的教材中缺少采样的部分,就使这条线断了。
随机变量
随机变量的取值是随机变量定义在样本空间上的实值函数。
随机变量既是变量也是函数。
从变量的角度来看,随机变量是指在随机试验或者随机过程中可能取不同数值的一种变量,它的数值受随机因素影响,无法事先确切预知。
从函数的角度来看,随机变量是定义在样本空间(随机试验所有可能结果组成的集合)上的一个实值函数。它将随机试验的所有可能结果(样本点)映射到实数集合上,每一个样本点对应一个实数值。随机变量的本质是对不确定事件结果的一种量化表示,使得原本非数值化的随机现象可以用数学语言来描述。
随机变量结合了变量的不确定性属性与函数的映射特性,它通过函数的方式将随机事件的结果量化,并通过概率论的语言来描述这些结果出现的可能性分布。
随机变量的分布
有了随机变量,然后就可以谈分布了。
定义 定义在样本空间Ω上的实值函数 X = X ( ω ) X=X(ω) X=X(ω)称为随机变量,常用大写字母X, Y, Z等表示随机变量,其取值用小写字母x, y, z等表示。假如一个随机变量仅可能取有限个或可列个值,则称其为离散随机变量。假如一个随机变量的可能取值充满数轴上的一个区间(a, b),则称其为连续随机变量,其中a可以是 − ∞ -\infty −∞,b可以是 + ∞ +\infty +∞。
连续型随机变量用概率密度函数描述分布,离散型随机变量用分布律描述分布。
以后当我们提到一个随机变量
X
X
X的“概率分布”时,指的是它的分布函数;或者,当
X
X
X是连续型随机变量时,指的是它的概率密度;当
X
X
X是离散型随机变量时,指的是它的分布律。
总之,分布描述随机变量取值的概率。
采样与随机样本
有了分布谈采样(抽样),就有了样本。
定义 设 X X X是具有分布函数 F F F的随机变量,若 X 1 , X 2 , ⋯ , X n X_1, X_2, \cdots, X_n X1,X2,⋯,Xn是具有同一分布函数 F F F的、相互独立的随机变量,则称 X 1 , X 2 , ⋯ , X n X_1, X_2,\cdots, X_n X1,X2,⋯,Xn为从分布函数 F F F(或总体 F F F、或总体 X X X)得到的容量为 n n n的简单随机样本,简称样本,它们的观察值 x 1 , x 2 , ⋯ , x n x_1, x_2,\cdots, x_n x1,x2,⋯,xn称为样本值,又称为 X X X的 n n n个独立的观察值。
统计推断
之后就是统计推断。
样本是进行统计推断的依据。在统计学中,我们通常无法对整个总体进行测量或观察,因此需要从总体中抽取一部分个体组成样本。通过对样本的分析,我们可以对总体的特征进行估计和推断。
统计推断的基本问题可以分为两大类,一类是估计问题,另一类是假设检验问题。
Comments
概率论与数理统计理论性比较强,很抽象,但是这是一个很实用的学科,相比高等代数和数学分析来说与我们更加接近。
然而这门课老师竟然讲成了一门抽象的理论课。凡是只讲怎么代入公式计算,没有解释,没有剖析,不讲整个知识体系以及逻辑关系,那样的概率老师都应该回家卖红薯。
原文地址:https://blog.csdn.net/u013600306/article/details/143314151
免责声明:本站文章内容转载自网络资源,如侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!