5.2.1 数据采集的方法和工具 同步练习及答案 一、选择题 1.项目小组在调查中学生兴趣爱好情况,通过网络问卷收集到数据。这个步骤属于数据处理的哪个环节( )。 A.数据收集 B.数据处理 C. 数据分析 D.数据可视化 【答案】A 【解析】本题考查的是对数据采集的理解 2.数据采集的基本方法包括( )。 A.系统日志采集法 B.网络数据采集法 C.其他数据采集方法 D.以上都对 【答案】D 【解析】本题主要考查数据采集的基本方法。数据采集可使用系统日志采集法、网络数据采集法和其他数据采集方法。 3.小新是学校学生会会长,在开学初,他和学生会成员想要制作一期关于预防新冠状病毒的宣传栏,小新可能会通过下面哪种方法采集信息( ) ①通过网络,去权威网站查找关于病毒的科普知识以及预防知识 ②采访一个武汉市民 ③采访当地一名专业医生 A.①③ B.②③ c.①② D.①②③ 【答案】A 【解析】本题考查数据采集的相关知识点。数据采集采用哪种方式要根据具体的要求与方法。②采访一个武汉市民是不具有代表性的,故本题选A选项 4.小芳妈妈病了,小芳应用网络预约挂号,医生根据网络大数据为她的妈分析病史数据,方便并更加科学诊病。以下说法错误的是( )。 A.只要是爬虫程序可以爬取到的信息,我们都可以任意使用 B.大数据时代让我们的生活更方便快捷 C.网络信息随时都可能被不法分子窃取 D.网络公司能捕捉到用户在网站上的行为 【答案】A 【解析】获取网络信息应该遵循相应的网络道德规范,因此A选项错误。 5.电子警察采用拍照的方式来约束车辆的行为,其拍照的过程属于( ) A.数据分析 B.数据采集 C.数据分类 D.数据可视化表达 【答案】B 【解析】本题考查的是对数据采集的理解。 6.数据采集的过程是( ) ①制定需求清单和内容大纲 ②数据的存储和保护 ③采用适当的方法和工具 ④明确数据应用项目的需求 A.①②③④ B.④②①③ C.④①③② D.①④②③ 【答案】C 【解析】采集数据首先要明确数据应用项目的需求,围绕选定的项目主题,制订数据采集的需求清单和内容大纲,再采用适当的方法和工具进行采集。 7.系统日志采集法通常是在目标主机上安装一个小程序,将目标主机的( )等日志信息有选择的定向推送到日志服务器进行存储、监控和管理。 ① 文本 ② 应用程序 ③ 数据库 ④主机硬件信息 A.①②③ B.②③④ C.①③④ D.①②③④ 【答案】D 【解析】在信息相同中,系统日志是记录系统中硬件、软件和系统问题的信息文件,① 文本② 应用程序③ 数据库属于系统中软件。 8.智能健康手环的应用开发,体现了( )的数据采集技术的应用。 A、统计报表 B、网络爬虫 C、API接口 D、传感器 【答案】D 【解析】略 9.以下不是网络爬虫的正确应用的是( ) A.爬取金融信息进行投资分析 B.爬取他人私人网页信息,进行信息利用 C.爬取多网站新闻进行集中阅读 D.利用爬虫程序自动取网页广告 【答案】B 【解析】选项B侵犯了他人的隐私权。爬虫程序在使用过程中要重视其合法性。 10.以下不是python常用的第三方扩展库的是( ) A.Numpy B. map C.Pandas D.Matplotlib 【答案】B 【解析】B中map是c++中的库,是C++中STL中的一个关联容器,以键值对来存储数据。 11、在Python模块库中有大量模块可供使用,要想使用这些文件,就需要用( )语句把指定模块导入当前程序中。 A.move B.in C.import D.print 【答案】C 【解析】A中move是Python中的运动函数,例如move(num,a,b,c)是一个典型的挪动盘子的例子,B中in是成员运算符,D中print是python中输出函数。C中import是把指定模块导入当前程序中。 二、判断题 12、要完成数据的采集工作,首先需要明确数据需求选定项目主题。( ) 【答案】√ 【解析】根据数据采集的流程,采集数据首先要明确数据应用项目 ... ...
~~ 您好,已阅读到文档的结尾了 ~~