跳转至

Chapter 2 随机变量及其概率分布

约 1027 个字 4 张图片 预计阅读时间 5 分钟

符号速览

  • 两点分布:XB(1,p) 或者 X01(p)
  • 二项分布:XB(n,p)
  • 泊松分布:XP(λ)
  • 超几何分布:XH(n,a,N)
  • 帕斯卡分布:XNB(r,p)
  • 均匀分布:XU(a,b)
  • 指数分布:XE(λ)
  • 正态分布:XN(μ,σ2)

随机变量是定义在样本空间S上的实值单值函数。常用大写字母X,Y,Z来表示随机变量,用小写字母x,y,z表示其取值

我们存在既非离散型也非连续型的随机变量,但本课程不涉及。

离散型随机变量

离散型随机变量(discrete random variable):如果随机变量取有限个或可列个值,则此随机变量为离散型随机变量,而若其可能取值为{xi},则称P{X=xk}=pk,k=1,2,...X概率分布律(probability mass function),也可以用列表的方式表达。

因为样本空间S={X=x1,X=x2,...,X=xn...}中各样本点两两不相容,所以:

1=P(S)=i=1+P{X=xi}=i=1+pi

两点分布

如果随机变量X的概率分布律为:

P{X=k}=pk(1p)1k,k=0or1

则称 X 为服从参数为 p 01 分布,也称为两点分布,并记为 XB(1,p) 或者 X01(p)

二项分布

伯努利试验:在 n 次独立重复试验中,每次只有 AA 两种结果,且概率不变,则这一系列试验为伯努利试验。

若随机变量X表示n重伯努利实验中事件A发生的次数,其概率分布律为:

P{X=k}=Cnkpk(1p)nk,k=0,1,2,...,n

则称X为服从参数为(n,p)的二项分布(binomial distribution),并记为XB(n,p)

根据二项式定理,二项分布有如下性质:

k=0nCnkpk(1p)nk=1
  • 如果遇到来自于两点分布的总体的,容量为n的样本的均值X,则有n·X=i=1nXiB(n,p)

泊松分布

如果随机变量X的概率分布律为:

P{X=k}=eλλkk!,k=0,1,2,...

其中λ>0,则称X服从参数为λ的泊松分布(Poisson distribution),记做XP(λ)

n足够大,p充分小(一般要求p<0.1),且np保持适当大小时,参数为(n,p)的二项分布可以用泊松分布近似描述,其中λ=np,即:

Cnkpk(1p)nkeλλkk!(n,p<ε,λ=np)

超几何分布

共有N个元素,其中a个为A类元素,b个为B类元素,从中任取n个元素,XA类元素的个数。

如果随机变量X的概率分布律为:

P{X=k}=CakCbnkCNn,k=l1,l1+1,...,l2

其中l1=max{0,nb}l2=min{n,a}

则称X为服从超几何分布(hypergeometric distribution),并记为XH(n,a,N)


几何分布

事件A发生的概率为p,则X为第一次发生A的时候,经历了多少次试验。

如果随机变量X的概率分布律为:

P{X=k}=p(1p)k1,k=1,2,...

则称X为服从参数为 p 的几何分布(geometric distribution)


帕斯卡分布

事件A发生的概率为p,则X为第r次发生A的时候,经历了多少次试验。

如果随机变量X的概率分布律为:

P{X=k}=Ck1r1pr(1p)kr,k=r,r+1,...

则称X为服从参数为(r,p)的帕斯卡分布(Pascal distribution),也称为负二项分布(negative binomial distribution),并记为XNB(r,p)


分布函数

定义:设X为随机变量,x为任意实数,函数F(x)=P{Xx}为随机变量X概率分布函数,简称为分布函数(distribution function)

则有以下结论:

P{x1<Xx2}=P{Xx2}P{Xx1}=F(x2)F(x1)

X离散型随机变量时,设X的概率分布律为P{X=xi}=pi,i=1,2,...,则X的分布函数为:

F(x)=P{Xx}=xixP{X=xi}

关于F(x)有以下结论:

  1. F(x)单调不减;
  2. 0F(x)1F()=0F(+)=1
  3. F(x)右连续,即F(x+0)=F(x)
  4. 不一定左连续,左极限得到的是P{X<x},而不是P{Xx}
  5. P(a<Xb)=F(b)F(a)

连续型随机变量

密度函数

如果对于随机变量X,其分布函数F(x),若存在一个非负的实函数f(x),使对于任意实数x,有:

F(x)=xf(t)dt

则称X连续型随机变量,并且称f(x)X概率密度函数(probability density function),简称为密度函数

关于f(x)有以下结论:

  1. f(x)0
  2. f(x)dx=1
  3. x1,x2R(x1<x2),P{x1<Xx2}=F(x2)F(x1)=x1x2f(t)dt
  4. f(x)的连续点x处,F(x)=f(x)
  5. P{X=a}=0,即连续型随机变量任取一个定值的概率为零,因此连续型随机变量落在开区间与相应闭区间上的概率相等;

均匀分布

设随机变量X就有密度函数:

f(x)={1ba,x(a,b)0,else

则称X服从区间(a,b)上的均匀分布,并记为XU(a,b)

而得到对应的分布函数为:

F(x)={0,x<axaba,ax<b1,xb

指数分布

若随机变量X具有密度函数:

f(x)={λeλx,x>00x0

也有地方写成这样:

f(x)={1θe1θx,x>00x0

其中λ>0,则称X服从参数为λ的指数分布(exponential distribution),记为XE(λ)

指数分布对应的分布函数为:

F(x)=xf(t)dt={1eλx,x>00x0

指数分布具有无记忆性,即P(X>t0+t|X>t0)=P(X>t)

指数分布的无记忆性

假设 t0>0t>0

P(X>t0+t|X>t0)=P(X>t0+t)P(X>t0)=1F(t0+t)1F(t0)=eλt=P(X>t)
P(X<t0+t|X>t0)=P(t0<X<t0+t)P(X>t0)=F(t0+t)F(t0)1F(t0)=1eλt=P(X<t)
无记忆性的一个例子

假设设备无故障运行的时间 T 服从指数分布。已知设备无故障运行了10个小时,求该设备再无故障至少运行8个小时的概率。

P{T18|T>10}=P{T>18}P{T>10}=e8λ=P{T>8}

注意到,这一条件概率与无条件下无故障运行8小时的概率没有区别。


正态分布

如果随机变量X具有密度函数:

f(x)=12πσe(xμ)22σ2,|x|<+

其中σ>0,|μ|<+为常数,则称X服从参数为(μ,σ)的正态分布(normal distribution / Gauss distribution),或者称X正态变量,记为XN(μ,σ2)

其对应的分布函数为:

F(x)=x12πσe(tμ)22σ2dt

在上面出现的式子中,μ位置参数,决定了分布图像的对称轴位置;σ尺度参数,决定了形状,σ越小,图像越集中。

ND


特别的,当μ=0,σ=1时,如果记这时的正态变量为Z,即ZN(0,1)则它服从标准正态分布(standard normal distribution)。则其密度函数为:

φ(x)=12πex22,|x|<+

则对应的分布函数为:

Φ(x)=x12πet22dt

正态分布标准化

而对于不是标准正态分布的正态分布,我们可以通过线性变换(标准化)来转换为标准正态分布:

XN(μ,σ2) 时:

P(Xb)=b12πσe(xμ)22σ2dx

做变换:xμσ=t

P(Xb)=bμσ12πet22dt=Φ(bμσ)

换言之,当 XN(μ,σ2) 时,XμσN(0,1)

我们有以下结论:

  • XN(μ,σ2),则P{a<X<b}=P{aμσ<Xμσ<bμσ}=Φ(bμσ)Φ(aμσ)
  • 特别的:若XN(μ,σ2),则P{|Xμ|<kσ}=Φ(k)Φ(k)=2Φ(k)1,这说明在对称轴左右,以σ倍数为区间的概率值,与μσ都无关。
  • 3σ法则

随机变量函数的分布

离散型随机变量的函数的分布律很简单,此处不再赘述。

连续型随机变量的函数的分布

Y=g(X)为连续型随机变量时,我们总是可以通过求出Y的分布函数FY(y),然后对FY(y)求导得到Y的密度函数fY(y)

Y=sinX,其中XU(0,π),求fY(y)

解:

FY(y)=P{Yy}=P{sinXy}

Alt text

由上图可知,

P{sinXy}=P{0Xarcsiny}+P{πarcsinyXπ}=arcsinyπ+arcsinyπ=2arcsinyπ

于是,在y(0,1)时,FY(y)=2arcsinyπy(0,1)时,FY(y)=0,则Y的密度函数为:

fY(y)={2π1y2,y(0,1)0,y(0,1)

y=g(x)单调时,我们有如下定理:

如果:

  • X为连续型随机变量,且其密度函数fX(x)
  • 随机变量Y=g(X)
  • 函数y=g(x)为一严格单调(增/减)函数,并且可微;

则记y=g(x)的反函数为x=h(y),得到Y的密度函数为:

fY(y)={fX(h(y))·|h(y)|,yD,0,yD
  • 其中Dy=g(x)的值域。

正态分布的线性变换

有关正态分布的重要结论:

XN(μ,σ2),则Y=aX+bN(aμ+b,a2σ2)

  • 标准化:特别的,若XN(μ,σ2),则XμσN(0,1)
  • 即正态分布的随机变量线性变换后正态性不变;