Skip to content

03 离散型随机变量的均值与方差

这节课研究下对分布列我们有哪些可以研究的数据。

离散型随机变量的均值

我们也称之为数学期望。

假设有一个分布列。

Xx1x2...xn
Pp1p2...pn

它的数学期望都像下面这样来求。

E(X)=x1p1+x2p2+x3p3+...+xnpn

离散型随机变量的方差

用方差来反映离散数据的稳定性。

引出问题

从两名同学中挑出一名代表班级参加射击比赛,根据以往的成绩记录,甲,乙两名同学击中目标靶的环数 XY 的分布列如下所示:

甲:

X678910
P0.090.240.320.280.07

乙:

Y678910
P0.070.220.380.300.03

如何评价这两名同学的射击水平?

通过计算可得,

E(X)=8,E(Y)=8

因为两个均值相等,所以根据均值不能区分这两名同学的射击水平。

评价射击水平,除了要了解击中环数的均值外,还要考虑稳定性,即击中环数的离散程度。

怎样定量刻画离散随机变量取值的离散程度?

我们知道,样本方差可以度量一组样本数据的离散程度,它是通过计算所有数据与样本均值的“偏差平方的平均值”来实现的。一个自然的想法是,随机变量的离散程度能否用可能取值与均值的“偏差平方的平均值”来度量呢?

可以。

假设离散型随机变量 X 的分布列如下所示。

Xx1x2...xn
Pp1p2...pn

考虑 X 所有可能取值 xiE(X) 的偏差的平法 (x1E(X))2,(x2E(X))2,...,(xnE(X))2。因为 X 取每个值的概率不尽相同,所以我们用偏差平方关于取值概率的加权平均,来度量随机变量 X 取值与其均值 E(X) 的偏离程度。我们称

D(X)=(x1E(X))2p1+(x2E(X))2p2+...+(xnE(X))2pn

=i=1n(xiE(x))2pi

为随机变量 X方差(variance),并称 D(X) 为随机变量 X 的标准差,记为 σ(X)

公式及二级结论

D(X)=(x1E(X))2p1+(x2E(X))2p2+...+(xnE(X))2pn

=i=1n(xiE(x))2pi

在方差的计算中,利用下面的结论经常可以使计算简化。

D(X)=i=1n(xiE(X))2pi

=i=1n(xi22E(X)+(E(X))2)pi

=i=1nxi2pi2E(X)i=1nxipi+(E(X))2i=1npi

=i=1nxi2pi2(E(X))2+(E(X))2

=i=1nxi2pi(E(X))2

=E(X2)E2(X)

两点分布

在篮球比赛中,罚球命中 1 次得 1 分,不中得 0 分。如果运动员罚球命中得概率是 0.8,记运动员甲罚球 1 次的得分为 X,画出其分布列。

X10
P0.80.2

像这种分布我们称之为两点分布。p=0.8 我们称之为成功概率。

E(X)=p

D(X)=(1p)2p+(0p)2(1p)

=pp3+p2p3

=p(1p)

二项分布

伯努利试验(Bernoulli trials)

我们把只包含两个可能结果的试验叫做伯努利试验

比如抛一次硬币,只有正面和反面两种结果;

射一次箭,只有射中 10 环和没射中 10 环两种结果。

n 重伯努利试验

将一个伯努利试验独立地重复进行 n 次所组成的随机试验称为 n 重伯努利试验。n 重伯努利试验具有如下特征:

  1. 同一个伯努利试验重复做 n 次
  2. 各次的试验的结果相互独立,不会互相影响

例如抛一枚银币 10 次;

射 10 次箭;

有放回的抽 20 次样。

n 重伯努利试验的不同

在单次的伯努利试验中,我们关注某个事件 A 是否发生(只有两种可能)。而在 n 重伯努利试验中,我们关注事件 A 发生的次数 X。

比如抛一枚银币 10 次,记 X 为正面朝上的次数。

又比如射 20 次箭,记 X 为射中 10 环的次数。

二项分布

一般地,在 n 重伯努利试验中,设每次试验中事件 A 发生的概率为 p(0<p<1),用 X 表示事件 A 发生的次数,则 X 的分布列为

P(X=k)=Cnkpk(1p)nk,k=0,1,2,...,n

如果随机变量 X 的分布列具有上式的形式,则称随机变量 X 服从二项分布,记作 XB(n,p)

由二项式定理,容易得到

k=0nP(X=k)=k=0nCnk(1p)nk=[p+(1p)]n=1

独立重复试验的期望

E(X)=np

=k=0nkCnkpk(1p)nk

=k=1nkn!(nk)!k!pk(1p)nk

=npk=1n(n1)!(nk)!(k1)!pk1(1p)nk

=npk=1n(n1)!(nk)!(k1)!pk1(1p)nk

=npk=1nCn1k1pk1(1p)n(k1)1

k1 看作一个整体,它从零开始增长。

=npk=0nCn1kpk(1p)nk1

根据二项式定理,k=0nCnkpk(1p)nk=[p+(1p)]n=1

=np

独立重复试验的方差

X123
Pp(1p)p(1p)2p

D(X)=np(1p)

超几何分布

一个例子让你弄懂什么是超几何分布。

问题:已知 100 件产品中有 8 件次品,分别采用有放回和不放回的方式随机抽取 4 件,设抽取的 4 件产品中次品数为 X,求随机变量 X 的分布列。

如果采用有放回抽样,则每次抽到次品的概率为 0.08,且各次抽样的结果相互独立,此时 X 服从二项分布,即 XB(4,0.08)

如果采用不放回抽样,那么每次抽取不是同一个试验,而且各次抽取的结果也不独立,不符合 n 重伯努利试验的特征,因此 X 不服从二项分布。

由古典概型的知识,得 X 的分布列为

P(X=k)=C8kC924kC1004,k=0,1,2,3,4

一般地,假设一批产品共有 N 件,其中有 M 件次品。从 N 件产品中随机抽取 n 件(不放回),用 X 表示抽取的 n 件产品中的次品数,则 X 的分布列为

P(X=k)=CMkCNMnkCNn,k=m,m+1,m+2,...,r

其中,n,N,MN,MN,nN,m=max{0,nN+M},r=min{n,M}。如果随机变量 X 的分布列具有上式的形式,那么称随机变量 X 服从超几何分布

期望与方差的二级结论

期望

E(aX+b)=aE(X)+b

方差

D(X+b)=D(X)

D(aX)=a2D(X)

D(aX+b)=a2D(X)

距离 2025 高考还有 -103 天。

Released under the MIT License.