ID: 8836297

高中信息技术(人教中图2019)必修1 章2.4.3算法与程序综合应用2(第二十课时)-教学设计

日期:2025-11-19 科目:信息技术 类型:高中教案 查看:36次 大小:22354B 来源:二一课件通
预览图 1/4
高中,课时,第二十,应用,综合,程序
  • cover
课程基本信息 课题 算法与程序综合应用2 教科书 书名: 《信息技术》必修1 -出卷网-:人民教育-出卷网-;中国地图-出卷网- 出版日期:2019 年 6 月 教学目标 教学目标: 了解文本分析的一般思路,体验解决文本问题的全过程; 能利用读取文本文件的方式获取数据; 认识字典数据类型,能利用字典存储和管理数据; 知道jieba库的功能,能利用jieba库实现中文分词; 能选择并利用已学算法,实现词频统计; 学习程序调试方法,提高编程能力; 教学重点: 文本分析的思路;读取文件的方法;字典及其使用;jieba库的功能及使用; 教学难点: 运用算法与编程知识来解决问题 教学过程 时间 教学环节 主要师生活动 2分钟 情境引入 利用python进行编程,我们不仅能处理数值数据、解决数学问题。它在处理文本数据 ,进行文本分析方面也颇具优势。比如,我们看到的热词榜、词云图、舆情趋势、文本情感分析等,这些都是利用编程来对文本进行分析处理的结果。这节课,我们就一起来分析解决一个文本数据处理的问题。 小明在阅读时萌生了利用编程分析文学作品的想法,来看看他具体的需求。小明在阅读《三国演义》时,为了分析这部文学作品的内容及其写作特色,想把作品中出现次数最多的20个词查找出来。如何利用编程来实现呢? 3分钟 问题分解 要解决的核心问题是查找文章的高频词 已知条件是待处理的文本数据;编程实现时需要有读取模块。 求解目标:输出高频词20个。编程时需要有显示输出模块。 如何求解的呢?我们可以根据结果 逆推一下。 求解过程分析:分析统计、输出的是词语。但原始文本数据是整篇文章。人能识别提取文章中的词语,但计算机不行。因此,需要想办法将整篇文章切分或转换成相应的词语集合。这需要中文分词功能。 需要统计每个词语的出现次数。这需要词频统计功能。 根据词语的出现次数进行排序比较,选出符合要求的前20个词语。这需要词频排序功能。 据前面的分析,我们可以将这个较为复杂的大问题分解为读取文件、中文分词、统计词频、词频排序和显示输出五个功能模块。 16分钟 实践探究 5 实践探究 实践探究 实践探究 1、读取文件 实践活动一: 请同学们自行阅读任务单活动一学习材料。 输入并尝试理解相关语句。 代码分析: 读取文件通过两条语句来完成。 第一条语句,打开指定的文件,创建一个文件对象; 第二条语句,读取文件中的全部内容。 调试方法及演示: 一个非常简单但有效的调试程序方法,我们可以利用print函数随时输出变量的内容或类型,来观察程序的进展 。 程序演示与分析: 见视频 2、中文分词 (1)中文分词: 读取文件输入数据已实现。下面我们来看看中文分词功能。文本数据已输入。我们需要将文本内容进行分词。 问:什么是中文分词呢? 中文分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。 问:为什么中文需要分词? 中文是以字为基本书写单位,词语之间没有明显的区分标记,因此进行中文处理时通常先将文本字符串切分成合理的词语 序列,然后再进行其它分析处理。 (2)jieba与模块 Jieba模块对中文有着强大的分词能力。Jieba模块是我们目前为止接触和使用的第一个第三方库。简要介绍下.Ptyhon语言中模块可分为标准模块、第三方模块和自定义模块。标准库是默认自带,不需要下载安装的。如之前我们接触和使用过的random随机数库。第三方模块是需要下载安装的模块。Jieba模块是使用前需要下载安装。 (3)实践活动2: 下面请同学们参照任务单中说明完成jieba模块的安装。自学中文分词相关语句的基本使用方法。 (4)代码分析与效果演示: 中文分词功能通过两条语句实现。首先导入分词模块。接着利用模块中lcut方法,将变量txt中的文本切分成词语后赋值给变量words。 老师来演示一下调试过 ... ...

~~ 您好,已阅读到文档的结尾了 ~~