
2.2用样本估计总体 复习回顾 1、什么是简单随机抽样?什么样的总体适宜简单随机抽样? 2、什么是系统抽样?什么样的总体适宜 系统抽样? 3、什么是分层抽样?什么样的总体适宜分层抽样? 抽样是统计的第一步,接下来就要对样本进行分析 通过图、表、计算来分析样本数据,找出数据中的规律,就可以对总体作出相应的估计. 这种估计一般分成两种: ①是用样本的频率分布估计总体的分布. ②是用样本的数字特征(如平均数、标准差 等)估计总体的数字特征. 用样本去估计总体,是研究统计问题的一个基本思想. 初中时我们学习过样本的频率分布,包括频数、频率的概念,频率分布表和频率分布直方图的制作. 2.2.1用样本的频率分布 估计总体分布 探究:我国是世界上严重缺水的国家之一,城市缺水问题较为突出.某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了较为合理的确定出这个标准,需要做那些工作? 2000年全国主要城市中缺水情况排在前10位的城市 某市100名居民的月均用水量(单位:t) 3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2 将一批数据按要求分为若干组,各组内的数据的个数,叫做该组数据的频数,各个小组数据在样本容量中所占的比例的大小,叫做该组数据的频率。 为了解数据分布的规律,可利用频率分布表和频率分布图来分析, 具体做法如下: 1.求极差(即一组数据中最大值和最小值的差) 例如, 4.3-0.2=4.1, 这说明这些数据的变化范围大小是4.1t。 2.决定组距和组数 例如,若取组距为0.5,则 故可将数据分成9组。 (设k=极差÷组距,若k为整数,则组数=k, 若k不是整数,组数=k+1) 分组 频数 频率 [0,0.5) 4 0.04 [0.5,1) 8 0.08 [1,1.5) 15 0.15 [1.5,2) 22 0.22 [2,2.5) 25 0.25 [2.5,3) 14 0.14 [3,3.5) 6 0.06 [3.5,4) 4 0.04 [4,4.5] 2 0.02 合计 100 1.00 4.列频率分布表: 3.将数据分组 以组距0.5将数据分组如下: [0,0.5), [0.5,1),……,[4,4.5 ]. (频数=样本数据落在各小组内的个数, 频率=频数÷样本容量) 5.画频率分布直方图 用横轴表示月均用水量,纵轴表示频率与组距的比值,以 每个组距为底,以频率除以组距的商为高,分别画出矩形,这 样得到的直方图就是频率分布直方图。 思考:小矩形的面积与哪些量有关?如何表示? 频率分布直方图 0 0.1 0.2 0.3 0.4 0.5 0.6 0-0.5 0.5-1 1-1.5 1.5-2 2-2.5 2.5-3 3-3.5 3.5-4 4-4.5 用水量范围 频率/组距 频率分布直方图 0 0.1 0.2 0.3 0.4 0.5 0.6 0-0.5 0.5-1 1-1.5 1.5-2 2-2.5 2.5-3 3-3.5 3.5-4 4-4.5 用水量范围 频率/组距 横轴表示:月均用水量,纵轴表示:频率/组距 小长方形的面积=组距*(频率/组距)=频率 各小长方形的面积总和等于1 频率分布折线图 连接频率分布直方图中各个小长方形上端的中点,频率分布折线图 随着样本容量的增加,作图时所分的组数也会增加,相应的频率折线图会越来越接近于一条光滑的曲线,统计学中称这条光滑的曲线为总体密度曲线. 总体密度曲线 统计中称这条光滑曲线为总体密度曲线,它反映了总体在各个范围内取值的百分比. 阴影部分的面积表示总体在区间(a,b)内取值 ... ...
~~ 您好,已阅读到文档的结尾了 ~~