(
课件网) 9.2用样本估计总体 9.1随机抽样要点回顾 1.了解全面调查、抽样调查的适用对象 2.了解总体、个体、样本、样本量的含义 3.随机抽样:(总体量大or有毁损性) (1)简单随机抽样:抽签法、随机数法 (2)分层随机抽样:各层在样本中的比例=各层在总体中的比例 4.用样本平均数可估计总体平均数、用样本中的比例可估计总体中的比例 如:调查高一级712名(男326/女386)同学的平均身高,抽50名同学作为样本 ①简单随机抽样: ②分层随机抽样: 搜集数据 整理和直观描述数据 分析数据 简单随机抽样 分层抽样 扇形图 用样本估计总体 用样本平均数估计总体平均数 用样本中的比例估计总体中的比例 条形图 折线图 频率分布表 频率分布 直方图 用样本的频率分布估计总体的频率分布 用样本的集中趋势估计总体的集中趋势 用样本的离散程度估计总体的离散程度 用样本的百分位数估计总体的百分位数 本节要点总览 问题1 我国是世界上严重缺水的国家之一,城市缺水问题较为突出.某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费. 那么标准a定为多少比较合理呢? (1)每户居民月均用水标准a如果定得太低,会影响_____; (2)每户居民月均用水标准a如果定得太高,会不利于_____; 很多居民的日常生活 节约用水 (3)为了较为合理地确定出这个标准,需要做哪些工作? 必须先了解全市所有居民用户中,月用水量在不同范围内的居民用户所占的比例情况. (4)如何调查全市所有居民用户的月用水量分布情况? ①全面调查:获取过去一年全市所有居民用户的月均用水量数据 ②抽样调查:分析样本观测数据,估计全市居民用户月均用水量的分布情况. 9.2.1总体取值规律的估计 在这个问题中,总体是该市的全体居民用户,个体是每户居民用户,调查的变量是居民用户的月均用水量. 假设通过简单随机抽样,获得了100户居民用户的月均用水量数据(单位:t) 9.0 13.6 14.9 5.9 4.0 7.1 6.4 5.4 19.4 2.0 2.2 8.6 13.8 5.4 10.2 4.9 6.8 14.0 2.0 10.5 2.1 5.7 5.1 16.8 6.0 11.1 1.3 11.2 7.7 4.9 2.3 10.0 16.7 12.0 12.4 7.8 5.2 13.6 2.6 22.4 3.6 7.1 8.8 25.6 3.2 18.3 5.1 2.0 3.0 12.0 22.2 10.8 5.5 2.0 24.3 9.9 3.6 5.6 4.4 7.9 5.1 24.5 6.4 7.5 4.7 20.5 5.5 15.7 2.6 5.7 5.5 6.0 16.0 2.4 9.5 3.7 17.0 3.8 4.1 2.3 5.3 7.8 8.1 4.3 13.3 6.8 1.3 7.0 4.9 1.8 7.1 28.0 10.2 13.8 17.9 10.1 5.5 4.6 3.2 21.6 易发现:居民用户月平均用水量最小值是___t,最大值是___t,其他在_____t之间. 1.3 28 1.3~28 极差:一组数据中最大值和最小值的差. 画频率分布直方图 2.决定组距与组数 ①数据的个数越多,所分的组数也越多. 当样本量不超过100时,常分成5—12组. ②一般取等长组距,且组距应力求“取整”. ③分组时可以先确定组距,也可以先确定组数. 1.求极差(一组数据中最大值与最小值的差) 样本观测数据的最小值是1.3 t,最大值是28.0 t, 极差为28.0 1.3=26.7, 这说明样本观测数据的变化范围是26.7 t. 合适的组距与组数对发现数据分布规律有重要意义,组数太多或太少,都会影响我们了解数据的分布情况. 组距与组数的确定没有固定的标准,常常需要一个尝试和选择的过程. 画频率分布直方图 1.求极差:最小值为1.3,最大值为28,极差为26.7 2.决定组距与组数:组距为3,分9组 3.将数据分组: 由于组距为3,9个组距的总长度为27,超过极差, 故可使第一组的左端点略小于数据中的最小值, 最后一组的右端点略大于数据中的最大值. 如,可取区间为[1.2,28.2],按如下方式把样本观测数据以组距3分为9组 ... ...