(
课件网) 7.5 正态分布 1.通过误差模型,知道服从正态分布的随机变量是连续型. 2.通过具体实例等,了解正态分布的特征. 3.识别参数对密度曲线的影响,并能解决简单的实际问题. 正态曲线与正态分布的历史渊源 早在1734 年,法国数学家棣莫弗(A.DeMoivre,1667~1754)在研究二项概率的近似计算时,已提出了正态密度函数的形式,但当时只是作为一个数学表达式. 直到德国数学家高斯(C.F.Gauss,1777~1855)提出“正态误差"的理论后,正态密度函数才取得“概率分布”的身份.因此,人们也称正态分布为高斯分布. 法国数学家棣莫弗(1667~1754) 德国数学家高斯(1777~1855) 现实中,除了前面已经研究过的离散型随机变量外,还有大量问题中的随机变量不是离散型的,它们的取值往往充满某个区间甚至整个实轴,但取一点的概率为0,我们称这类随机变量为连续型随机变量. 离散型随机变量的概率分布规律用分布列描述: 两点分布、超几何分布、二项分布等 连续型随机变量的概率分布规律用什么来描述? 人的身高、体重、肺活量;电视机的寿命;小麦的株高、穗长、单位面积产量;零件的尺寸;某地每年7月的平均气温、降水量;居民的月均用水量…… 问题 自动流水线包装的食盐,每袋标准质量为400g. 由于各种不可控制的因素,任意抽取一袋食盐,它的质量与标准质量之间或多或少会存在一定的误差(实际质量减去标准质量). 用X表示这种误差,则X是一个连续型随机变量. 检测人员在一次产品检验中,随机抽取了100袋食盐,获得误差X (单位: g) 的观测值如下: -0.6 -1.4 -0.7 3.3 -2.9 -5.2 1.4 0.1 4.4 0.9 -2.6 -3.4 -0.7 -3.2 -1.7 2.9 0.6 1.7 2.9 1.2 0.5 -3.7 2.7 1.1 -3.0 -2.6 -1.9 1.7 2.6 0.4 2.6 -2.0 -0.2 1.8 -0.7 -1.3 -0.5 -1.3 0.2 -2.1 2.4 -1.5 -0.4 3.8 -0.1 1.5 0.3 -1.8 0.0 2.5 3.5 -4.2 -1.0 -0.2 0.1 0.9 1.1 2.2 0.9 -0.6 -4.4 -1.1 3.9 -1.0 -0.6 1.7 0.3 -2.4 -0.1 -1.7 -0.5 -0.8 1.7 1.4 4.4 1.2 -1.8 -3.1 -2.1 -1.6 2.2 0.3 4.8 -0.8 -3.5 -2.7 3.8 1.4 -3.5 -0.9 -2.2 -0.7 -1.3 1.5 -1.5 -2.2 1.0 1.3 1.7 -0.9 (1)如何描述这100个样本误差数据的分布? 根据已学的统计知识,可用频率分布直方图描述这组误差数据的分布。 (1)求极差(即一组数据中最大值与最小值的差) (2)决定组距与组数(将数据分组) (3)将数据分组 画频率分布直方图的一般步骤为: (4)列出频率分布表.(填写频率/组距一栏) (5)画出频率分布直方图. 组距:指每个小组的两个端点的距离, 组数:将数据分组,当数据在100个以内时, 按数据多少常分5-12组. (1)如何描述这100个样本误差数据的分布? 可用频率分布直方图描述这组误差数据的分布,如图所示. 观察图形可知:误差观测值有正有负,并大致对称地分布在X=0的两侧,而且小误差比大误差出现得更频繁. 随着样本数据量越来越大,让分组越来越多,组距越来越小,由频率的稳定性可知,频率分布直方图的轮廓就越来越稳定,接近一条光滑的钟形曲线. 频率分布折线图 光滑的钟形曲线 其中每个小矩形的面积表示误差落在相应区间内的频率, 所有小矩形的面积之和为1. (2)如何构建适当的概率模型刻画误差X的分布? 随着样本数据量越来越大,让分组越来越多,组距越来越小,由频率的稳定性可知,频率分布直方图的轮廓就越来越稳定,接近一条光滑的钟形曲线,如图(3)所示. 频率/组距 X -6 0 -4 -2 0 0.15 0.05 图 (2) 0.10 0.20 4 2 6 根据频率与概率的关系,可用图(3)中的钟形曲线(曲线与水平轴之间的区域的面积为1)来描述袋装食盐质量误差的概率分布. 例如,任意抽取一袋食盐,误差落在[-2, -1]内的概率,可用图中黄色阴影部分的面积表示. P ... ...