
教学设计 课程基本信息 学科 信息技术 年级 高一 学期 春季 课题 5.3数据的分析 5.3.1特征探索 教科书 书 名:信息技术 数据与计算 必修1 教材 -出卷网-:广东教育-出卷网- 教学目标 理解特征探索(数据预处理)的作用和常用方法。 掌握选用恰当的工具处理数据,可视化表达数据,揭示数据反映的本质问题。 体验多种数据分析技术,激发学生的学习热情,培养学生的编程兴趣。 教学重难点 教学重点: 理解数据预处理(特征探索)技术,能够通过程序简单实践数据的特征探索处理。 教学难点: 能够根据具体数据分析的需要,选用恰当的工具处理数据,并获取一定结论。 教学过程 情境导入 1、展示利用爬虫程序爬取的淘宝零食的部分数据,其中主要包括价格与评论。 2、提出问题: 在市场竞争中,通过现有的数据,企业应该如何轻松并且准确得来探索他的特征,分析出对自己有价值的信息呢? 进一步给出数据分析的概念: 数据分析是通过运用数字化工具和技术,对大批量杂乱无章的数据进行探索和分析,从中发现数据内在的结构和规律,并构建数学模型进行可视化表达。通过验证这些模型,我们可以将其转化为知识,以便更好地了解事物的现状、剖析事物的发展趋势,并预测事物的未来走向。 举例说明: 导入本节课主题:数据分析之数据特征探索,即对淘宝零食的部分数据预处理,并挖掘数据价值。 探究新知 特征探索的概念和作用 1.1教师:我们可以从哪些方面来对淘宝零食数据进行预处理? 发现和处理缺失值、异常数据 绘制散点图,直方图 观察分析数据的分布特征 求最大值、最小值、极差等描述性统计量。 极差:极差是最大值和最小值之间的差异或范围。它计算了数据集的全局范围。极差量化了数据的变异程度,提供了数据在整个取值范围内的大小差别。 他们能够很直观地描述数据的总体特征,取值范围,分布范围,集中度,大小排序,方便绘图,直观反映数据情况,获得更全面的数据分析和解释。 以上,对数据的预处理方式都属于数据的特征探索。通常情况,对于未知的数据先进行特征探索。 1.2教师:在对数据的完成预处理处理以后,如何来挖掘数据价值? 论证该使用何种统计推断进行分析 通过可视化对数据构建初始认知 对于数据集中的某些现象原因提出假设,分析 对进一步的数据收集及调查做基础 1.3过程:我们可以找到淘宝零食数据中的缺失部分,异常部分。 求最大值、最小值、极差 绘制散点图,直方图 在最后回答本节课问题: 通过分析直方图,企业能够得到什么有用的信息呢? 2、教师:数据库的建立 在进行数据分析前,通常需要建立一个数据库。通过建立数据库,存储大量数据,方便后续的数据分析和处理工作。 创建数据库csdn和数据表taob,并导入文件taob.sql中的数据。 (如果有不熟悉如何创建数据库的同学,可以参考配套资料) 3、引导学生开展探究活动 逐个完成“程序5-5-1 数据预处理(教材范例).py”,体验数据预处理过程。 3.1数据清洗,发现缺失值,并打印缺失值的个数。 3.2异常处理,利用画散点图,发现异常值部分。 3.3设置筛选条件,重新绘制散点图。 3.4求最大值、最小值、极差等描述性统计量。 3.5绘制价格直方图,可以让我们直观的看到商品在不同价格区间的分布数量。 3.6绘制评论数直方图,可以让我们看到不同评论数的商品数量。 4.展示结果。 教师:思考从直方图中,哪些价格区间的商品评论数较低,可能表现不佳,用户体验和满意度较低,可以进行提高改进? 4.1价格更高的商品,大家的评论的积极性会更强。 4.2消费者认为价格20-40元的商品价值较低,从而不愿意购买或分享购买体验。 4.3同时价格20-40元的商品可能意味着有潜在的商机和市场空白。如果这些商品能够提高它们的质量和知名度,吸引更多消费者的关注和评论,那么它们 ... ...
~~ 您好,已阅读到文档的结尾了 ~~