ID: 21417237

4.2.3 文本数据处理(学习任务单)-2024-2025学年《信息技术》高中·必修 1 数据与计算(浙教版)

日期:2024-10-17 科目:信息技术 类型:高中试卷 查看:43次 大小:267428B 来源:二一课件通
预览图 0
4.2.3,高中,计算,数据,必修,信息技术
    学习任务单 课程基本信息 学科 信息技术 年级 高一 学期 秋季 课题 文本数据处理 教科书 《数据与计算》 学生信息 姓名 学校 班级 学号 学习目标 探索手工标签云的制作,掌握分词、特征提取等关键步骤,理解文本数据处理的一般过程。 掌握jieba、wordcloud等库的运用,能根据实际需求,选用合适的工具和方法对文本数据进行可视化。 分析典型案例,能从实际生活中发现数据可视化的应用价值,认识到有效处理对提高数据价值的重要意义。 课前学习任务 1. 预习课本4.2.3《文本数据处理》教材内容 课上学习任务 【学习任务一】 手工标签云制作 1.中文分词 用“/”将下方句子切分为一个个单独的词。 文化自信是基础,道路自信、理论自信、制度自信,是文化自信的具体表现。 2.特征提取 词语词频 【学习任务二】 体验jieba分词 打开jupyter notebook,完成结巴分词上机操作。 【学习任务三】 项目实践:探秘古诗词 唐诗宋词是中国文学史上的两颗明珠,我们从小到大背诵过很多诗词,但始终无法穷尽近5万首唐诗与2万多篇宋词。请制作古诗词标签云,探秘隐藏其中鲜为人知的信息。 请参考jupyter notebook中的代码与注释,绘制个性化的标签云 推荐的学习资源作业练习 课程基本信息 学科 信息技术 年级 高一 学期 秋季 课题 文本数据处理 教科书 文本数据处理 学生信息 姓名 学校 班级 学号 作业练习 分析各互联网公司招聘公告,创建标签云如图1所示。 图1 其中文本的特征项是( ) A.字B.词C.句子D.段落 图1标签云中最能表现招聘文档的特征词有_____(写3~5个)。 3.自主上网收集文本数据资料,打开在线标签云网站,绘制标签云,并完成分析报告 文本主题:_____ 标签云: 此处粘贴标签云 分析数据:_____(从标签云中可以得到的信息) 完善程序 标签云网站的背后是Python编程实现,其统计词频代码如下。在划线处填写合适代码,完善程序。 s="文本略" #s为招聘公告汇总文本 result2 = jieba.lcut(s) dictCount = dict() # 词频字典 for r in result: if r not in dictCount: dictCount[r] = 1 # 若不存在单词,则词频为1 else: _____ print(dictCount)

    ~~ 您好,已阅读到文档的结尾了 ~~