(
课件网) 第4章 数据处理与应用 浙教版信息技术(高中) 必修1 数据与计算 4.1 常用表格数据的处理 课堂导入 (1)数据整理的目的是 检测和修正错漏的数据 、 整合数据资源 、 规整数据格式 、 提高数据质量 。 (2)常见的数据问题有 数据缺失 、 数据重复 、 数据异常 、 逻辑错误 、 格式不一致 等。 数据问题 处理方法 数据缺失 ①忽略含有缺失值的实例或属性 ②采用平均值、中间值或概率统计值来填充缺失值 数据重复 可以通过 COUNTIF、“条件格式” 和排序功能查找,在审核后进行合并或删除等处理 数据异常 指数据集中不符合一般规律的数据对象,它可能是要去掉的噪声,也可能是含有重要信息的数据对象 逻辑错误 数据集中的属性值与实际值不符,或违背业务规则或逻辑。可通过 “数据验证” 功能检查 格式不一致 可通过数据转换形成一个合适的形式。数据转换通常包括属性数据类型的转换、根据已有属性集构造新属性的转换、将不同来源的相同属性的定义及其值进行统一标准化表达的转换等 【问题与讨论1】 尝试读取文件 “问题与讨论1_问题.xlsx”,并回答以下问题, 请将回答写在记事本中,保存好并上传。 1、页A的“发布时间”列数据,有什么问题? 2、页A的“功耗”列数据,有什么问题? 3、在修改完以上问题之后,如果要把页A和页B的表格合并以方便对比,会遇到哪些问题?该如何处理? 数据计算是数据处理的常用方法之一。 日常简单的数据处理可以使用Excel完成,专业的数据处理和统计分析工具有SPSS、SAS、MATLAB等,也可通过Python、JAVA等计算机语言编程进行数据处理。 4.1.2 数据计算 常用的数据处理和统计分析工具 Excel软件是微软公司推出的Microsoft Office系列套装软件中的组成部分,是一个简单易用的电子表格软件,可以进行数据的处理、统计分析和辅助决策操作,广泛应用于文秘办公、财务管理、市场营销、行政管理和协同办公等事务。 SPSS是IBM公司推出的一款统计分析软件,具备数据收集、准备、分析、描述、解释和展现的功能。SPSS提供丰富的统计算法,并且操作简使、功能强大、扩展性强,但需要使用人员具备一定的数理统计学知识背器,比较退合专业分析、研究等人员使用。 SAS是SAS软件研究所开发的一套大同集成应用软件系统,共有三十多个功能模块,具有数据访问、数据管理、数据分析、数据皇现等功能。SAS系统从大型机上的系统发展而来,其操作以编程为主。系统地学习和掌握SAS, 需要花费一定的精力,比较适合统计专业人员使用。 MATLAB是MathWorks公司推出的一种科学计算语言和编程环境,主要应用于数据分析、无线通信、深度学习、计算机视觉、量化金融与风险管理等领域。MATLAB 将适合选代分析和设计过程的桌面环境与直接表达矩阵和数组远算的编程语言相结合,为分析数据、开发算法和创建模型等提供了便于探索和发现的环境,深受工程师和料学家的青缺。 拓展链接 算术运算符 :+、-、*、/、^、% 比较运算符:=、>、<、>=、<=、<> 结果的逻辑值:TRUE/FALSE 文本连接运算符:& SUM (numberl, [number2],...) 求参数的和 AVERAGE (numberl, [number2],...) 求参数的平均值 MIN (numberl, [number2],...) 返回参数列表中的最小值 MAX (numberl, [number2]._.) 返回参数列表中的最大值 函数是预定义的公式,参数可以是数字、单元格或单元格区域。 运算符和函数 A2 相对引用 $A$2 绝对引用:行列都锁定 $A2 绝对引用:仅列锁定 A$2 绝对引用:仅行锁定 【问题与讨论1.5】 尝试读取文件 “问题与讨论1.5_问题.xlsx”,并回答以下问题。 1、在 Excel 中,单元格 C1 输入 5,C2 输入 8,C3 输入 12,使用 SUM(C1:C3) 计算结果是多少? 2、计算C4、D4、E ... ...