4.2《大数据处理-数据可视化之词云》 教材分析 本节课是浙教版《数据与计算》必修一第四章第二节大数据处理中《文本数据处理》的内容。本节主要介绍了文本处理的相关内容,包含文本处理的一般过程以及文本数据分析与应用。本节要求学生通过典型案例应用实例,了解数据采集、分析和可视化表达的基本方法,并能根据任务需求,选用恰当的软件工具或平台处理数据。针对教学目标,本节课采用最近热点问题《政府工作报告》展开,对该文本内容进行可视化处理。考虑到学生已经熟练掌握Python基本编程知识,具备相应的编程能力,对于创新性内容比较感兴趣,设计了词云制作这一实践活动。 课程标准和教学目标 本节课项目: 《基于政府工作报告的可视化处理》课程标准: 1.4通过典型的应用实例,了解数据采集、分析和可视化表达的基本方法。 1.5根据任务需求,选用恰当的软件工具或平台处理数据。 教材内容 第四章4.2.3文本数据处理 教学目标 1.了解文本数据处理的目的、应用、一般过程和方法。 2.了解文件读取文本数据的方法以及中文分词常见的方法。 3.掌握数据词云的概念、历史,了解制作词云的基本步骤。 指向的核心素养 1.信息意识:能够在体验与探究过程中自主获取有效信息,并勇于展示与分享。 2.计算思维:能够对给定的任务进行需求分析,抽象问题的本质,设计相应的算法,用程序设计语言实现相关算法。 教学环境 多媒体网络教室、Python3.8编程环境(wordcloud、jieba、numpy库已安装) 教学重难点 文本数据的获取文本数据的分词用python制作可视化词云 教学过程 教学环节 教学过程 设计意图 回顾总结 回顾在前几课中学习的关于数据可视化处理的案例,总结对于EXCEL表格形式的数据常用的可视化方法。总结出这些数据共同特征是数值类型。 对之前的学习内容进行归纳与总结,再一次明确可视化处理的作用--能够高效、快速、清晰、准确的把握数据中包含的信息,为项目的引入做好铺垫 问题导入 2023年3月5日第十四届全国人民代表大会上国务院总理李克强同志所作的政府工作报告的字数达到了18915,如何快速获取该报告中所包含的信息呢?对于文本数据的处理,最常用的处理方式是词云。展示生活中有关词云的图片。 引入项目,明确本堂课的主要任务,同时向学生展示词云的图片,一方面激发学生学习兴趣,另一方面让学生对词云有一个形象直观的认识 体验与探究一 四行代码制作一个词云。 让学生打开python编辑器,自主输入以下四行代码。 Import word cloud w=word cloud. Word Cloud( ) w.generate ("hello, word, input, print") w.to_file("词云1.png") 运行后,在python的根目录底下查看生成的词云图片 通过实践一:学生可以亲身体验与感受用python制作词云的过程,同时,在制作的过程中可以引发学生对于如何制作词云的思考,为后续的展示与交流做好铺垫。 展示与交流 学生展示用python编码制作的词云效果。教师讲解用python制作词云的一般过程与方法: 引入词云库; 生成词云对象; 导入文本内容; 生成词云图片。 师生探讨制作出的词云的感受,引出实践二要体验与探究的内容,继续美化词云。 学生展示编码后的结果,对在编码过程中出现的问题进行总结。师生交流引出实践二体验与探究的内容。 体验与探究二 修改word cloud( )参数内容,美化词云。 Import numpy as np From PIL import Image Import word cloud mask=np.array(Image.open("alice_mask.png")) txt="Alice,漂亮、温柔、贴心、有爱心、友善、大方、热情、开朗、活泼、能歌善舞 "w=wordcloud. WordCloud ( #修改背景颜色 #修改字体 #修改蒙版 #修改字体颜色 #修改重复 #修改尺寸 #修改轮廓颜色和宽度) w. generate(txt) w. to_file("词云2.png") 技术支持:Word Cloud( )各 ... ...
~~ 您好,已阅读到文档的结尾了 ~~