(
课件网) 第5章 大数定律与中心极限定理 5.1 大数定律 在第一章中我们已经指出,人们经过长期实践认识到,虽然个别随机事件在某次试验中可能发生也可能不发生,但是在大量重复试验中却呈现明显的规律性,即随着试验次数的增大,一个随机事件发生的频率在某一固定值附近摆动.这就是所谓的频率具有稳定性.同时,人们通过实践发现大量测量值的算术平均值也具有稳定性.而这些稳定性如何从理论上给以证明就是本节介绍的大数定律所要回答的问题. 5.1.1切比雪夫不等式 在引入大数定律之前,我们先证一个重要的不等式———切比雪夫(Chebyshev)不等式. 定理1(切比雪夫不等式) 设随机变量 存在有限方差 ,则对 ,有 (5.1) 证 设 是连续型随机变量,其概率密度为 ,则有 在上述证明中,如果把概率密度换成分布列,把积分符号换成求和符号,即得离散型情形的证明. 切比雪夫不等式也可表示为 (5.2) 切比雪夫不等式给出了在随机变量 的分布未知 的情况下事件 的最小上界估计和 的概率的最大下界估计,例如,在 切比雪夫不等式中,令 分别可得到 【例5.1】设 是掷一颗骰子所出现的点数,若 ,计算 ,并用切比雪夫 不等式给出其上界估计. 解 因为 的分布列为 ,所以 计算得 用切比雪夫不等式估算得 【例5.2】设电站供电网有10000盏电灯,夜晚每一盏灯开灯的概率都是0.7,而假定开、关时间彼此独立,估计夜晚同时开着的灯数在6800与7200之间的概率. 解 设 表示在夜晚同时开着的灯的数目,则 若要准确计算,应该用伯努利公式 要手工计算它的值几乎是不可能的,可借助高级程序语言,通过循环迭代计算完成. 如果用切比雪夫不等式估计 =0.9475 可见,虽然有10000盏灯,但是只要有供应7200盏灯的电力就能够以相当大的概率保证够用. 事实上,切比雪夫不等式的估计只说明概率大于0.9475,当学完5.2节中心极限定理之后,可以轻松地计算这个概率的精确度较高的近似值. 切比雪夫不等式在理论上具有重大意义,但估计的精确度不高. 切比雪夫不等式作为一个理论工具,在大数定律证明中,可使证明非常简洁. 5.1.2 依概率收敛 对于随机变量序列 和随机变量 如果对 ,有 (5.3) 或者等价地有 (5.4) 则称随机变量序列 依概率收敛于 记作当 时, 注 (1)由 的任意性,(5.3)式和(5.4)式中的“ ” 和“ ”可分别改为“ ”和“ ”. (2) 意思是不管事先给定的 多么小,只要 越来越大, 与 的距离小于 的概率都越来 越趋于1,也即 越来越像一个必然事件. (3) 不同于 ,后者的意思是指: 对于任意的试验结果 ,都有 ,此时 我们称随机变量序列 处处收敛于 ,它是比 依概率收敛强得多的另一个概念. 5.1.3切比雪夫(Chebyshev)大数定律 定理2(切比雪夫(Chebyshev)大数定律) 设随机变量序列 满足如下三个条件: (1)相互独立; (2)期望 和方差 都存在; (3)方差一致有界,即存在 , 使得 则对 ,有 (5.5) 或等价地有 (5.6) 即当 时, 注 由 的任意性,(5.5)式和(5.6)式中的“ ” 和“ ”可分别改为“ ”和“ ”. 证 由切比雪夫不等式得,当 时 再由数列收敛的夹逼准则,知(5.5)式成立. 切比雪夫大数定律说明,当 n充分大时,相互独立的 随机变量的算术平均值 密集在它的数学期望 的附近. 【例5.3】设相互独立的随机变量序列 满足 则 满足切比雪夫大数定律. 证 因为 所以方差 显然满足切比雪夫大数定律的条件,证毕. 推论1(独立同分布的切比雪夫大数定律) 设随机变量 相互独立,且具有相同的数学期望和方差: 作前 个随机变量的 算术平均值 ,则对于任意正数 有 (5.7) 或等价地有 (5.8) 5.1.4伯努利(Bernoulli)大数定律 定理3(伯努利(Bernoulli)大数定律)设 是 次独立 重复试验中事件 发生的次数. 是事件 ... ...