ID: 16104687

5.2数据的采集-2 课件(共20张PPT)　2022—2023学年高中信息技术粤教版（2019）必修1

日期：2026-03-07 科目：信息技术类型：高中课件查看：23次大小：1662686B 来源：二一课件通

预览图 1/9 张

2023,必修,2019,教版,信息技术,高中

(课件网) 第五章数据处理和可视化表达 5.2数据的采集（第二课时）一、本章情况学习目标（1）了解大数据的概念，理解大数据的特征，知道大数据对日常生活的影响，明晰传统数据与大数据的区别；（2）了解数据采集的方法和工具，掌握数据的存储方式，理解对数据进行保护的意义；（3）知道数据预处理及分析，体验多种数据分析技术；（4）学会选用恰当的工具处理数据，学会总结和归纳数据分析的方法和步骤；（5）了解数据可视化两种呈现类型，学会选用恰当的工具可视化表达数据。 5.1认识大数据 5.2数据的采集 5.3数据的分析 5.4数据的可视化表达教学内容二、项目指导交流分享依据自己小组项目实施的实际情况，对于项目实施过程的进度、亮点、困难予以分享，交流。 1. 项目完成基本情况。 2.对所选定主题的大数据特征进行分析。三、学习新知 2. 网络数据采集法探究活动分析网页“wholesale.html”的内容，网页通过本地网站访问，网址http://127.0.0.1/wholesale.html。网页为鞋类销售数据。打开程序文件“程序5-2-2 爬取程序.py”，分析程序代码中使用了哪些库？URL是什么？本程序只使用1个网页的数量，暂时不爬取其他 URL 的数据。三、学习新知探究活动运行程序 “程序5-2-2 爬取程序.py”，得到导出的电子表格。对比网页“wholesale.html”和电子表格中的数据，分析网络爬虫程序获取了哪些数据？分析本程序的基本结构。三、学习新知 2. 网络数据采集法程序分析（1）爬取网页的内容 for i in range(0, 5): # 循环5次，就是5个页的商品数据 payload['page'] = i+ 1 # 此处为页码，根据网页参数具体设置 resp = requests.get(url, params=payload) soup = bs4.BeautifulSoup(resp.text, "html.parser") print(resp.url) # 打印访问的网址 resp.encoding = 'utf-8' # 设置编码注：演示网页 http://127.0.0.1/wholesale.html 只有1页，只爬取1页内容。三、学习新知 2. 网络数据采集法程序分析（2）爬取商品标题 # 标题 all_title = soup.find_all('a', class_='item-title') for j in all_title: soup_title = bs4.BeautifulSoup(str(j), "html.parser",) title.append(soup_title.a.string) 网页标签： a data-p4p="true" class="item-title" 三、学习新知 2. 网络数据采集法程序分析（3）爬取商品价格 # 价格 all_price = soup.find_all('span', class_="price-current") for k in all_price: soup_price = bs4.BeautifulSoup(str(k), "html.parser") price.append(soup_price.span.string) 网页标签： span class="price-current" 三、学习新知 2. 网络数据采集法程序分析（4）爬取订单量 # 订单量 all_order = soup.find_all('a', class_="sale-value-link") for l in all_order: soup_order = bs4.BeautifulSoup(str(l), "html.parser") order.append(soup_order.a.string) 网页标签： a data-p4p="true" rel="nofollow" class="sale-value-link" 三、学习新知 2. 网络数据采集法程序分析（5）爬取店铺名称 # 店铺名称 all_store = soup.find_all('a', class_="store-name") for m in all_store: soup_store = bs4.BeautifulSoup(str(m), "html.parser") store.append(soup_store.a.string) 网页标签： a class="store-name" 三、学习新知 3. 其他数据采集法对于企业生产经营或科学研究等保密性要求较高的数据，可通过与企业或研究机构合作，使用特定系统接口等相关方式收集数据。例如，科学研究的数据是通过科学实验的各种传感器采集，并传输到数据库管理系统中的。 ①使用传感器采集数据。 ②使用网络爬虫工具采集：八爪鱼采 ... ...

~~ 您好，已阅读到文档的结尾了 ~~

立即下载

免费下载（校网通专属）

登录下载Word版课件

5.2数据的采集-2 课件(共20张PPT) 2022—2023学年高中信息技术粤教版（2019）必修1

同类资源

5.2数据的采集-2 课件(共20张PPT)　2022—2023学年高中信息技术粤教版（2019）必修1