ID: 19093176

第3章 数据的整理 课件(共61张PPT)-《统计学基础与应用》同步教学(高教版)

日期:2026-02-11 科目: 类型:课件 查看:85次 大小:6544384B 来源:二一课件通
预览图 1/12
高教,教学,同步,统计学基础与应用,PPT,3章
  • cover
(课件网) * 工作任务 任务1:对本组所得到的调查结果进行数据的整理,并用图表表现汇总结果,写出数据整理的报告。 * 主要内容 3.1 数据的审核及预处理 3.2 数据的分组 3.3 数据的汇总 3.4 数据汇总结果的图表表示 * 3.1 数据的审核及预处理 3.1.1 数据的审核 3.1.2 数据的预处理 * 3.1.1 数据的审核 准确性 完整性 及时性(时效性) * 3.1.2 数据的预处理 编码:问卷以编号,给变量值以数字代码,如A-1,B-2,C-3 排序:将数据按一定顺序排列,如升序或降序,便于研究者浏览数据从而发现数据分布的明显特征和趋势。 筛选:将符合某种特定条件的数据筛选出来,通过筛选可以剔除明显有错误的数据。 数据加权、变量重新计算并定义等处理方式。 * 3.2 数据的分组 数据整理的关键是数据的分组。由于总体单位存在的差异性,因此,可以对统计总体进行分组,而同一组的总体单位在某一标志上又存在“同质性”。 通过数据的分组,可以发现总体分布的特点和规律性。 通过数据的分组,可以认识现象之间质的差别。 通过数据的分组,可以反映总体内部结构的动态变化。 通过数据的分组,可以分析现象之间的依存关系。 * 3.2.1 什么是数据的分组 所谓分组是根据研究的目的,将总体按照某一标志划分为若干个组成部分的统计方法。 例如:将全班同学按性别分为两组,一组为男生,一组为女生。 * 3.2.2 数据分组的方法 数据的分组关键是如何选择分组标志。在选择分组标志时要遵循以下的原则: 1.根据研究的目的和任务选择 2.选择反映最本质特征的标志 3.选择分组标志时,考虑历史和经济条件 历史和经济条件的变化 * 3.2.3数据分组的类型 * 3.3 数据的汇总 3.3.1 手工汇总 3.3.2 机械汇总 * 3.3.1 手工汇总 1.划记法。按照事先分好的组用正字划记,计算各组的单位数和合计数。 2.过录法。将调查数据先过录到事先设计好的整理表上,并计算出合计数,然后再将结果填入正式的汇总表中。 3.折叠法。将所有调查表中需要汇总的项目和数值折在边上,一张接一张叠在一起进行汇总计算。 4.卡片法。将每个总体单位需要汇总的项目和数值摘录到事先准备好的卡片上,然后根据卡片进行分组和汇总计算。 * 3.3.2 机械汇总 * 3.4 数据汇总结果的图、表表现 3.4.1 汇总表的编制 3.4.2 统计图的绘制 * 汇总数据的表现方式 如何表现数据 文字描述 1 表格呈现 2 图表表示 3 北京市第六次人口普查数据显示,常住人口1961.2万人,其中,男性1012.6万人,占51.6%;女性为948.6万人,占48.4%。 * 表 格 呈 现 北京市第六次人口普查性别构成 * 图 表 表 示 * 3.4.1 汇总表的编制 汇总表在统计工作中是用的最多的一种数据表现形式,按数据的不同类型,可以分为品质型数据的汇总表和数值型数据的汇总表,汇总表又称为次数分布表或分布数列。 在编制时,由于品质型数据容易确定界限,较容易编制,数值型数据由于数量界限不易确定,编制起来相对复杂和困难。 汇总表主要包括分组和次数两个部分,通常在绘制时,还增加一行合计和一列频率(或称比例、比重) * 1.品质数列 * 北京市第六次人口普查性别构成 2.变量数列 单项变量数列 组距变量数列 * 单项变量数列 单项式数列是指一个数值代表一个组的变量数列。 应用情形:一般是按离散型变量分组且变量值变动幅度小,个数不多的时候采用,有时连续型变量也可采用单项式数列编制,如年龄是连续型变量,当年龄变动幅度较小时,也可以编制单项变量数列。 * 单项变量数列示例 * 组距变量数列 组距变量数列是指变量值变动的范围代表一个组。 应用情形:如按离散型变量分组且变量值变动幅度很大、个数很多时采用;而连续型变量分组时由于不能一一列举变量值,通常编制组 ... ...

~~ 您好,已阅读到文档的结尾了 ~~