课件编号19653528

5.3 数据的分析 课件(共52张PPT) 2023—2024学年粤教版(2019)高中信息技术必修1

日期:2024-04-29 科目:信息技术 类型:高中课件 查看:29次 大小:3814654Byte 来源:二一课件通
预览图 1/12
2024,必修,信息技术,高中,2019,教版
  • cover
5.3 数据的分析 1 5.3 数据的分析 题 问 采集到的数据,没有分析处理,能直接使用? 2 5.3 数据的分析 数 据 分 析 4 5.3 数据的分析 流 交 ①分组:4—6位同学组成一个学习小组; ②通过查找资料、学习和交流,填写下表。 ①在一大批杂乱无章的数据中,运用数字化的工具和技术,探索数 据内在的结构和规律,构建数据模型,并进行可视化表达; ②通过验证将模型转化为知识,为诊断过去,预测未来发挥作用。 数 的 据 分 析 用 作 ①特征探索 ②关联分析 ③聚类分析 ④数据分类 ⑤建立模型和模型评价。 数 据 分 析 的 常 用 方 法 . . . . i . . z . t . t z i j i j z 5.3 数据的分析 1 特征探索 2 关联分析 CONTENT 3 目录 >> 聚类分析 4 数据分类 6 5.3 数据的分析 请各学习小组选择下面一个参考主题,或者自拟一个感兴趣的数据分析方法,开展项目学习。 ①特征探索 ②关联分析 ③聚类分析 ④数据分类 请各学习小组根据项目选题,利用老师下发的《5.3 数据分析》导学案 和《5.3 项目学习 活动记录表》,制定相应的项目活动方案。 . . . . i . . z . t . t z i j i j z 5.3 数据的分析 各学习小组根据项目选题及拟定的项目方案,结合探究的知识,完成相应的数据分析。 1.采用适当的方法完成相应项目选题的数据分析工作。 2.探究数据分析的方法和步骤,填写《5.3 项目活动记录表》 。 师生共同回顾项目活动的整个过程,总结和归纳本节课的知识,学习小组完善《5.3 项目 活动记录表》。 . . . . i . . z . t . t z i j i j z 5.3 数据的分析 1 特 征 探 索 9 5.3.1 特征探索 究 探 1. 观看微课视频“特征探索程序介绍”; 2. 打开运行配套学习资源包”第五章\课本素材\程序5-3数据预处理”,观 察、分析数据预处理结果; 3. 总结、归纳特征探索的主要任务。填写《5.3 项目学习活动记录表》 “活动2”的内容。 . . . . i . . z . t . t z i j i j z 5.3.1 特征探索 验 体 (1)数据清洗,发现缺失值。如果销量为0的,修改为64。 x=0 data ["price"][(data["price"]==0)]=None For i in data.columns: ? for j in range(len(data)): ?? if(data[i].isnull())[j]: # 如果为空即插入 值 ??? data[i][j]="64“ x+=1 # 空值插入64 print(x) . . . . i . . z . t . t z i j i j z 验 5.3.1 特征探索 体 (2)异常值处理中,利用画散点图发现异常值部分,找到异常值。 data2=data.T price=data2.values[2] comt=data2.values[3] plt.xlabel('price') # 显示X坐标标 签 plt.ylabel('paynum') # 显示Y坐 标标签 pyl.plot(price,comt,"o") pyl.show( ) . . . . i . . z . t . t z i j i j z 5.3.1 特征探索 验 体 (3)求最大值和最小值。 pricemax=da2[2].max(?) pricemin=da2[2].min(?) commentmax=da2[3].max(? ) commentmin=da2[3].min(? ) . . . . i . . z . t . t z i j i j z 验 5.3.1 特征探索 体 (4)求极差 pricerg=pricemax—pricemin commentrg=commentmax— commentmin (5)求组距 pricedst=pricerg/13 commentdst=commentrg/13 . . . . i . . z . t . t z i j i j z 验 5.3.1 特征探索 体 (6)绘制价格直方图。 pricesty=npy.arange(pricemin,pricemax, pricedst) pyl.hist(da2[2],pricesty) pyl.show(?) 分析结果:价格在10-30块之间的商品种类最多,此价位的商品竞争最激烈。 . . . . i . . z . t . t z i j i j z 验 5.3.1 特征探索 体 (7)绘制销量数直方图。 paynumsty=npy.arange(paynummin,paynummax+1, paynumdst) plt.xlabel('paynum') plt.ylabel('number') # 显示X坐标标签 # 显示Y坐标标签 pyl.hist(da2[3],paynumsty) pyl.show() 分析结果:销量在10以下的商品种类最多,大部分商品销量一般。 . . . . i . ... ...

~~ 您好,已阅读到文档的结尾了 ~~