(
课件网) 第 20章 数据的初步分析 20.1 数据的频数分布 学习目标 1.明确频数直方图制作的步骤,会绘制频数直方图. 2.能从频数分布表和频数直方图中获取有关信息,作出合理的判断和预测. 学习重难点 会绘制频数直方图. 能从频数分布表和频数直方图中获取有关信息,作出合理的判断和预测. 难点 重点 复习导入 可以清楚地表示出每个项目的具体数目 可以清楚地反映事物变化的情况 可以清楚地表示各部分在总体中所占的百分比 你还记得各个统计图的特点吗? 条形统计图 折线统计图 扇形统计图 知识讲解 知识点 数据的频数分布 问题1某校学生在假期进行“空气质量情况调查”的课题研究时,他们从当地气象部门提供的今年上半年的资料中,随意抽取了30天的空气综合污染指数,数据如下: 根据国家环保总局公布的《空气质量级别表》如下: 把数据按上述级别分成0~50,51~100,101~150,151~200,201~250共5个组,进行整理,得下表: 《空气质量级别表》 (1)根据国家公布的级别,这30天的空气质量,各级别各占多大比例? (2)你能估计该地今年(365天)空气质量达到优级别的天数吗? 用样本的百分率估计总体的百分率. 并借助表格将分组结果及各组数据的个数进行整理, 要想从中获取所需要的信息. 然后统计出落在各个小组内数据的个数, 把相差不大的数据放在一起, 下面我们就来通过具体的例子,学习这种分析数据的分布方法 思考:根据上述问题的探究,说说面对大量的数据,如何获得它的整体分布情况? 问题 1 启示我们: 面对大量的数据, 常常先要选择好合适的统计表、图, 进行适当的分组 (例如,这里按空气质量级别分组), 便能反映出这批数据的分布规律. 这样, 40,21,35,24,40,38,23,52,35,62, 36,15,51,45,42,40,32,43,36,34, 53,38,40,39,32,45,40,50,45,40, 50,26,45,40,45,35,40,42,45,40。 为了了解这批数据反映的情况,可以对它们进行怎样的分析呢? 问题2 某校体卫组对该该校八年级学生一周内平均每天参加课外体育锻炼的时间(单位:min)有所了解,从中随机抽查了40名学生,结果如下: 一般地,可以按照下列步骤来分析: (1) 计算这批数据中最大数和最小数的差. (极差=最大数-最小数) 这批数据中,最大值是 ,最小值是 ,它们的差是 . 62 15 62-15=47 由此可知这批数据的变动范围. 组距通常根据问题的需要而定, 可分成5~12组, 并取组距为8, (2) 决定组距和组数 组数= 组距 最大数-最小数 47 8 = ≈6 组距是指 将这批数据分组, 一般来说, 当数据在100以内时, 如果每组组距相同, 即把数据分成6组 每个小组的两个端点间的距离. 那么 并把第一组的起点定为比最小的数据稍小一点的数. 如把第一组的起点定为14.5, 不好决定他们究竟属于哪一组. 一般地把表示分点的数比原数据多取一位小数, 我们发现数据23,39正好落在分点上, (3) 决定分点 55~63 将数据按照8min的组距分组, 从15开始分成 15~23, 23~31, 31~39, 39~47, 47~55, 这6组. 同学们对照数据发现什么问题?该如何解决能 ? 14.5~22.5, 为了避免这种情况, 这样所分的6个组是: 38.5~46.5, 22.5~30.5, 30.5~38.5, 46.5~54.4, 54.5~62.5 算出每个小组的频数, 称为这个组的频数. 那么 就是该组数据在这批数据中的频率。 下面请大家根据上面数据填写下频数分布表: (4) 列频数分布表 我们把一批数据中 通常用选举时唱票的方法,对落在各个小组内的数据个数进行记录, 并制成频数分布表. 如果一批数据共有n个, 而其中某一组数据是m个, 频率 = 总数 频数÷ 即 频率可用小数、分数、百分数表示. 落在某个小组内数据的个数 总数 = 频率 频数÷ 频数 = ... ...