自学内容网 自学内容网

概率 多维随机变量与分布

一、二维

1、二维随机变量及其分布

        假设E是随机试验,Ω是样本空间,X、Y是Ω的两个变量;(X,Y)就叫做二维随机变量或二维随机向量。X、Y来自同一个样本空间。

        联合分布函数 F(x,y)=P(X≤x,Y≤y),即F(x,y)表示求(x,y)左下方的面积。 F(x,y) 不减,例如:y固定,x1<x2,F(x1,y)<F(x2,y);F(x,y)分别关于x和y右连续。

        对于x_1<x_2y_1<y_2 存在 P(x_1< X ≤ x_2y_1 <Y ≤ y_2) = F(x_2,y_2) - F(x_2,y_1)-F(x_1,y_2)+F(x_1,x_2)

P(x_1< X ≤ x_2y_1 <Y ≤ y_2) 如左下图表示,等号右边则是图中四块区域的代表。

2、二维离散型随机变量的联合分布和边缘分布

        边缘分布 是表示在所有可能的一个变量值上,获取另一个变量的概率之和

X的边缘分布:F_X(x) = P(X ≤ x) = F(x,+∞) = P(X≤x,Y<+∞)

Y的边缘分布:F_Y(y) = P(Y ≤ y) = F(+∞,y) = P(X<+∞,Y≤y)

        联合概率质量函数 P(X=x,Y=y) 描述了随机变量 X 和 Y 同时取特定值 x 和y 的概率。所有可能的 x 和 y 值的概率之和等于1。

3、二维连续随机变量的联合密度和边缘密度函数

        F(x,y) = P(X≤x,Y≤y) = \int_{-\infty}^x\int_{-\infty}^y   f(s,t) ds dt  函数就是对所有的x,y进行积分求和。

例如: 已知联合密度函数,求分布函数F(x,y)

解:带入分布函数公式:\int_{-\infty}^x\int_{-\infty}^y   f(s,t) ds dt = \int_{0}^x\int_{0}^y e^{-(x+y)} dx dy = \int_{0}^x e^{-x} dx \int_{0}^ye^{-y} dy =(1-e^{-x})(1-e^{-y})  ;因为联合密度函数定义域为x,y都大于0,所以积分时只需要大于0即可

        边缘密度函数 直接将另一个变量积分部分等价于(x,+\infty),则剩下部分为另一个变量的边缘密度函数。

二、条件分布

1、基础定义

        已知另一个随机变量或事件的条件下,该随机变量的概率分布:F(x|A)=P(X\leq x | A)

例如:概率密度函数如图,求在X>1的条件下f(x)的条件分布函数

解:F(x | X>1) = P(X\leq  x|X>1)=P(X\leq x,X>1)/ P(X>1)

求分子:P(1\leq X\leq  x) = \int _1^x 1/\pi(1+x^2)  dx  = 1/\pi * arctan(x) |_1^x = arctan(x)/\pi - 1/4

求分母:P(X>1) = \int _1^\infty 1/\pi(1+x^2)  = 1/\pi * arctan(x) |_1^\infty = 1/\pi * \pi/2 - 1/\pi * \pi/4 = 1/4

则整个结果为 (arctan(x)/\pi - 1/4)/1/4=arctan(x)/\pi -1

2、离散型随机变量的条件分布

        从分布表来理解

X\Y01
00.10.3
10.30.3

P(Y=y) 是 Y 的边缘概率质量函数,Y 的边缘概率质量函数是对列求和:

Y01
P0.40.6

 那么在Y=1的条件下,假设x=0,X=x的概率为: P(X=0∣Y=1)=03/0.6 =0.5;假设x=1,X=x的概率为 P(X=1∣Y=1)=0.3/0.6=0.5

3、连续型随机变量的条件分布

        Y=y条件下,条件概率密度函数为: f(x∣y)=f(x,y) / f_Y(y);同理X=x条件下:f(y∣x)=f(x,y) / f_X(x)。其中f_Y(y) 、f_X(x) 是边缘函数。

例如:假设 

解:f(x|y) = f(x,y) / f_Y(y) = 1/\pi^2(1+x^2)(1+y^2)  /  1/\pi(1+y^2) =  1/\pi^2(1+x^2)

f(y|x) = f(x,y) / f_X(x) = 1/\pi^2(1+x^2)(1+y^2)  /  1/\pi(1+x^2) =  1/\pi^2(1+y^2)

三、随机变量独立性

        概率密度函数f(x,y)可以表示为各自边缘概率密度函数的乘积:

        离散型 :P(X=x,Y=y)=P(X=x)⋅P(Y=y)

        连续型:f(x,y)=f_X(x)⋅f_Y(y)

四、二维随机变量函数的分布

1、离散型

第一步:列出所有x与y结合的取值点 (例如:z=x+y)

第二步:根据联合概率质量 函数 P(X=x,Y=y) 求z的值分布及其概率

第三步;全部z点相加验证是否等于1

例如:

假设有两个离散型随机变量 XX 和 YY,它们的联合PMF如下表所示:

X \ Y123
10.10.20.0
20.00.30.0
30.10.10.2

 第一步:列出所有z点 (P(1,1) ,P(1,2),P(1,3),P(2,1),P(2,2),P(2,3),P(3,1),P(3,2),P(3,3)

第二步:根据点得到对应概率,并根据(z=x+y)的求得Z点数值

Z2=P(1,1) =  0.1

Z3=P(1,2)+P(2,1) = 0.2+0.0 = 0.2

Z4=P(1,3)+P(2,2)+P(3,1) =0.0+0.3+0.1=0.4

Z5=P(2,3)+P(3,2)=0.0+0.1=0.1

Z6=P(3,3)=0.2

第三步:根据得到所有点概率进行求和验证 Z2+Z3+Z4+Z5+Z6 =0.1+0.2+0.4+0.1+0.2=1

2、连续型

第一步:明确要求需要什么函数(分布函数、概率密度函数)

第二步:根据联合密度函数进行(x,y)积分得到 分布函数,在进行 求导得到z的概率密度函数

F_Z(z)= P(Z ≤ z)=P ( g(X,Y) ≤z ) =\int\int_{g(x,y)}≤z  f(x,y) dx dy ; f_Z (z)=d/dz * F_Z(z)

例如:假设 (X,Y) 的联合概率密度函数为下图, 求Z=X+Y的分布

解:

第一步:求分布函数,根据z=x+y  以及函数信息得到 z在(x,y)的分布 => 直角坐标系 点(1,1)、(1,0)、(0,1)、(0,0),四个点所在的长方形,线条z=x+y 也就是点(2,0)、(0,2)、(0,0)三点的三角形区域,两块面积的区域交集部分就是z在直角坐标系的投影;根据x,y的值获得z的分布区间(0,2),由于z在(0,1)区间是符合x,y的区间随意落地,可以直接使用积分函数求解;z在(1,2)区间内只能在长方形减去右上三角面积的结果

第二步:对(0,1)进行积分 :根据 联合密度函数进行积分布函数  F_Z(z)= P(Z ≤ z)=P ( g(X,Y) ≤z ) =\int\int_{g(x,y)}≤z  f(x,y) dx dy = \int_0^z dx \int_0^{z-x} 2 dy = \int_0^z 2y| _0^{z-x} dx =\int_0^z 2(z-x) dx =2zx - x^2 | _0^{z} = z^2

              对(1,2):由于是得到面积,所以不需要积分为 1-{(2-z)}^2/2 

第三步:汇总结果 形成分布函数 

总结:连续型可直接根据图形面积汇总(x和y的随意分布形状与联合函数区域不一致),若在一致情况下可求面积也可以求积分得到分布函数,再根据分布函数求导得到概率密度函数。


原文地址:https://blog.csdn.net/h0039490/article/details/142861348

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!