课件编号14501971

5.3 数据的分析 课件 2022—2023学年粤教版(2019)高中信息技术必修1(26张PPT)

日期:2024-04-29 科目:信息技术 类型:高中课件 查看:87次 大小:1433559Byte 来源:二一课件通
预览图 1/9
26张,必修,信息技术,高中,2019,教版
  • cover
(课件网) 数据的分析 数据的分析 数据分析的概念 数据分析 数据分析的方法 数据分析的概念 数据分析的概念 数据分析是为了获取有价值的信息,使用适当的计算方法与工具对收集来的数据进行处理,提取有用信息,形成结论从而支持决策。 数据分析可以帮助我们: 了解事物的现状 剖析事物的发展历程 预测事物未来走向 数据分析 数据分析的方法 数据分析的作用:了解事物的现状 数据分析的概念 这是一张新冠肺炎疫情当前的数据。 通过对数据的分析,我们可以发现当前我国现有确诊人数较少,疫情控制良好,主要风险来自境外输入。而且境外的疫情数据可以展示出目前全球疫情的严峻现状。 故,数据分析可以帮助我们了解事物的现状。这就是数据分析的第一个作用。 数据分析 数据分析的方法 数据分析的作用:剖析事物的发展历程 数据分析的概念 这是一张我国新冠肺炎疫情的数据图表。通过表中的病死率和治愈率,我们可以通过图中的数据可以帮助我们了解疫情发展和变化的过程。 故,数据分析的第二个作用是了解事物的发展历程,从而进一步探究问题产生的原因。 数据分析 数据分析的方法 数据分析的作用:剖析事物的发展历程 数据分析的概念 我们来看这张图,这是一张2020到2050哈尔滨老年人口占比的预测图。通过已有数据,可以预测出未来哈尔滨老年人口的占比会高达38%,也就是极度老龄化。 这就数据分析的第三个作用———预测事物未来走向 数据的分析 数据分析方法 数据分析 数据分析的方法 数据预处理(特征探索) 数据分析的方法 数据处理中常遇到数据中存在着错误或异常(偏离期望值)的数据,或者重要的数据属性没有值,数据内涵出现不一致情况(例如,作为关键字的同一学生的学号编码在不同的地方出现不同值)。因此,数据预处理主要包括数据清洗、数据集成、数据转换和数据消减。 数据清洗:指消除数据中存在的噪声及纠正其不一致的错误。 数据集成:指将来自多个数据源的数据合并到一起构成一个完整的数据集。 数据转换:指将一种格式的数据转换为另一种格式的数据。 数据消减:指通过删除冗余特征或聚类消除多余数据。 数据分析往往是80%的数据处理,20%的分析。 数据分析 数据分析的方法 数据预处理:数据清洗 数据分析的方法 数据清洗过程包括遗漏数据处理,数据随机错误处理,以及不一致数据处理,主要通过以下几个方法进行: 对于遗漏数据一般采用忽略该条记录,手工填补遗漏值,利用默认值填、均值、同类别均值填补遗漏值来处理; 对于随机错误,可以取数据点的周围点(近邻)值或者用聚类、回归分析方法取值。 对于不一致的数据,常利用数据与外部的关联,手工解决这种问题。 数据分析 数据分析的方法 数据预处理:数据集成 数据分析的方法 即将来自多个数据源的数据,如数据库、数据立方、普通文件等,结合在一起并形成一个统一数据集合,以便为数据处理工作的顺利完成提供完整的数据基础。 Excel中使用vlookup函数实现多个表的合并,注意合并前需要对多个表的数据进行数据清理。(注意教师演示) Word中的邮件合并功能将Excel数据填充到Wrod中。(注意教师演示) 体 验 数据分析 数据分析的方法 数据预处理:数据转换 数据分析的方法 指将一种格式的数据转换为另一种格式的数据(如数字类型转换为文本类型),还包括将数据进行转换或归并,从而构成一个适合数据处理的描述形式。 格式转换:如数字类型转换为文本类型。 数据进行转换或归并:可以通过属性构造方法可以利用已有属性集构造出新的属性,如例如,根据宽、高属性,可以构造一个新属性(面积)。 数据分析 数据分析的方法 数据预处理:数据消减 数据分析的方法 数据消减技术的主要目的就是从原有巨大 ... ...

~~ 您好,已阅读到文档的结尾了 ~~