9.2.4 总体离散程度的估计 【课程标准要求】 1.理解方差、标准差的含义,会计算方差和标准差.2.掌握求分层随机抽样总样本的平均数及方差的方法. 知识点 平均距离、方差与标准差 1.平均距离 假设一组数据是x1,x2,…,xn,用表示这组数据的平均数.我们用每个数据与平均数的差的绝对值作为“距离”,即|xi-|(i=1,2,…,n)作为xi到的“距离”.可以得到这组数据x1,x2,…,xn到的“平均距离”为|xi-|. 为了避免式中含有绝对值,通常改用平方来代替,即(xi-)2.我们称(xi-)2为这组数据的方差.有时为了计算方差的方便,我们还把方差写成以下形式:-.方差的单位是原始数据的单位的平方.称为这组数据的标准差. 2.总体方差与总体标准差 如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为,则称S2=(Yi-)2为总体方差,S=为总体标准差.与总体均值类似,总体方差也可以写成加权的形式.如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为S2=fi(Yi-)2. 3.样本方差与样本标准差 如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为,则称s2=(yi-)2为样本方差,s=为样本标准差. 知识拓展 平均数反映了数据取值的平均水平,而方差、标准差描述了一组数据围绕平均数波动的大小,标准差、方差越大,数据离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定. 基础自测 1.已知一个样本中的数据为1,2,3,4,5,则该样本的标准差为( ) [A] 3 [B] 2 [C] [D] 2.从某项综合能力测试中抽取100人的成绩,统计如下表,则这100人成绩的标准差为( ) 分数 5 4 3 2 1 人数 20 10 30 30 10 [A] [B] [C] 3 [D] 所以s2=×[20×(5-3)2+10×(4-3)2+30×(3-3)2+30×(2-3)2+10×(1-3)2]==,所以s=. 故选B. 3.现有10个数,其平均数是4,且这10个数的平方和是200,那么这组数的标准差是 . s= = ==2. 4.(人教A版必修第二册P215练习T5改编)某校采用分层随机抽样的方法采集了高一、高二、高三年级学生的身高信息,部分调查数据如下表: 项目 样本量 样本平均数 样本方差 高一 100 167 120 高二 100 170 150 高三 100 173 150 则总的样本方差s2= . 所以总的样本方差为 s2=×[120+(167-170)2]+×[150+(170-170)2]+×[150+(173-170)2] =×(120+9)+×150+×(150+9) =146. 题型一 方差和标准差的概念 [例1] 甲、乙两名学生6次考试的成绩统计如图所示,甲、乙两组数据的平均数分别为,,标准差分别为s甲,s乙,则( ) [A] <,s甲s乙 [C] >,s甲,s甲>s乙 方差和标准差反映的是一组数据的集中与离散程度.一般地,标准差和方差越小说明数据越集中、越稳定,反之越离散、越不稳定. [变式训练] 下列说法正确的个数为( ) ①数据的极差越小,样本数据分布越集中、稳定; ②数据的平均数越小,样本数据分布越集中、稳定; ③数据的标准差越小,样本数据分布越集中、稳定; ④数据的方差越小,样本数据分布越集中、稳定. [A] 1 [B] 2 [C] 3 [D] 4 题型二 频率分布直方图中的方差计算 [例2] 某快捷超市计划通过停车收费推动快速购物进而提升顾客流量,在制定停车收费方案时,需要考虑顾客停车时间的长短.现随机采集了100个停车时长的数据(单位:min),按(0,20],(20,40],(40,60],(60,80],(80,100]分成 5组,其频率分布直方图如图. (1)如果该超市计划奖励35%的快速购物顾客不收取其停车费,那么应该允许免费停车多长时间 (2)记t0=+s,其中为样本平均数,s为样本标准差.如果该超市计划对停车时长超过t0的客户征收更高的停车费,求t0(精确到个位).(注:假设频率分布直方图中每组数据在组内均匀分布,同一组中的数据用该组区间的中点值作代表,参考数据:≈5.9) (0.005+a+0.017 5+0.007 5+0.007 5)×20=1, ... ...
~~ 您好,已阅读到文档的结尾了 ~~