03 离散型随机变量的均值与方差
这节课研究下对分布列我们有哪些可以研究的数据。
离散型随机变量的均值
我们也称之为数学期望。
假设有一个分布列。
| ... | ||||
|---|---|---|---|---|
| ... |
它的数学期望都像下面这样来求。
离散型随机变量的方差
用方差来反映离散数据的稳定性。
引出问题
从两名同学中挑出一名代表班级参加射击比赛,根据以往的成绩记录,甲,乙两名同学击中目标靶的环数
甲:
| X | 6 | 7 | 8 | 9 | 10 |
|---|---|---|---|---|---|
| P | 0.09 | 0.24 | 0.32 | 0.28 | 0.07 |
乙:
| Y | 6 | 7 | 8 | 9 | 10 |
|---|---|---|---|---|---|
| P | 0.07 | 0.22 | 0.38 | 0.30 | 0.03 |
如何评价这两名同学的射击水平?
通过计算可得,
因为两个均值相等,所以根据均值不能区分这两名同学的射击水平。
评价射击水平,除了要了解击中环数的均值外,还要考虑稳定性,即击中环数的离散程度。
怎样定量刻画离散随机变量取值的离散程度?
我们知道,样本方差可以度量一组样本数据的离散程度,它是通过计算所有数据与样本均值的“偏差平方的平均值”来实现的。一个自然的想法是,随机变量的离散程度能否用可能取值与均值的“偏差平方的平均值”来度量呢?
可以。
假设离散型随机变量
| X | ... | |||
|---|---|---|---|---|
| P | ... |
考虑
为随机变量
公式及二级结论
在方差的计算中,利用下面的结论经常可以使计算简化。
两点分布
在篮球比赛中,罚球命中 1 次得 1 分,不中得 0 分。如果运动员罚球命中得概率是 0.8,记运动员甲罚球 1 次的得分为
| X | 1 | 0 |
|---|---|---|
| P | 0.8 | 0.2 |
像这种分布我们称之为两点分布。
二项分布
伯努利试验(Bernoulli trials)
我们把只包含两个可能结果的试验叫做伯努利试验。
比如抛一次硬币,只有正面和反面两种结果;
射一次箭,只有射中 10 环和没射中 10 环两种结果。
n 重伯努利试验
将一个伯努利试验独立地重复进行 n 次所组成的随机试验称为 n 重伯努利试验。n 重伯努利试验具有如下特征:
- 同一个伯努利试验重复做 n 次
- 各次的试验的结果相互独立,不会互相影响
例如抛一枚银币 10 次;
射 10 次箭;
有放回的抽 20 次样。
n 重伯努利试验的不同
在单次的伯努利试验中,我们关注某个事件 A 是否发生(只有两种可能)。而在 n 重伯努利试验中,我们关注事件 A 发生的次数 X。
比如抛一枚银币 10 次,记 X 为正面朝上的次数。
又比如射 20 次箭,记 X 为射中 10 环的次数。
二项分布
一般地,在 n 重伯努利试验中,设每次试验中事件 A 发生的概率为
如果随机变量 X 的分布列具有上式的形式,则称随机变量 X 服从二项分布,记作
由二项式定理,容易得到
独立重复试验的期望
把
根据二项式定理,
独立重复试验的方差
| X | 1 | 2 | 3 |
|---|---|---|---|
| P |

超几何分布
一个例子让你弄懂什么是超几何分布。
问题:已知 100 件产品中有 8 件次品,分别采用有放回和不放回的方式随机抽取 4 件,设抽取的 4 件产品中次品数为 X,求随机变量 X 的分布列。
如果采用有放回抽样,则每次抽到次品的概率为 0.08,且各次抽样的结果相互独立,此时 X 服从二项分布,即
如果采用不放回抽样,那么每次抽取不是同一个试验,而且各次抽取的结果也不独立,不符合 n 重伯努利试验的特征,因此 X 不服从二项分布。
由古典概型的知识,得 X 的分布列为
一般地,假设一批产品共有 N 件,其中有 M 件次品。从 N 件产品中随机抽取 n 件(不放回),用 X 表示抽取的 n 件产品中的次品数,则 X 的分布列为
其中,