(
课件网) 第五章:数据处理和可视化表达 5.1认识大数据 情境导入:不同的人打开手机淘宝的推荐页内容为什么不一样? 左侧是三个不同的人打开淘宝之后出现的页面内容,观察其存在什么差异?以及为什么会出现这样的差异? 认识大数据 在日常工作、学习和生活中,我们的一举一动基本上都可以数字化,这些差生的数据随着数据级的积累,最终形成了大量的数据。那么什么是大数据?它会产生哪些影响呢? 认识大数据 大数据的概念 大数据的特征 大数据的影响 大数据的概念 海 量 数 据 移动互联网 车联网 手机 电脑 物联网 云计算 各种传感器 ...... 大数据的概念 数据:是现实世界客观事物的符号记录,是信息的载体,是计算机加工的对象。 大数据:是指无法在可承受的时间范围内用常规软件工具进行高效捕捉、管理和处理的数据集合。 任务:阅读学习任务单的材料,补全下面表格 大数据的特征 大 数 据 的 特 征 互联网产生大数据角度 互联网思维角度 存储和计算角度 数据体量____(填“大”或“小”) 数据类型____(填“多”或“少”) 价值密度____(填“高”或“低”) 变化速度____(填“快”或“慢”) ____数据(填“全体”或“抽样”) 追求___(填“精确”或“模糊”) 注重___(填“因果”或“相关”) 分布式存储 分布式并行计算 大数据的特征 1、从互联网产生大数据的角度来看 数据体量巨大 例如:交通卡刷卡每天产生1900万条记录;手机定位数据每天产生1800万条;出租车运营数据每天产生100万条;电子停车收费系统数据每天产生50万条...... 从TB级别跃升到PB级别 大数据的特征 1、从互联网产生大数据的角度来看 数据体量巨大 数据类型繁多 例如:网络日志;视频;图片;地理位置信息等 大数据的特征 1、从互联网产生大数据的角度来看 数据体量巨大 数据类型繁多 价值密度低 例如:在连续不间断的视频监控过程中,有用的数据可能仅仅只有一两秒。 大数据的特征 1、从互联网产生大数据的角度来看 数据体量巨大 数据类型繁多 价值密度低 变化速度快 数据来自世界各地的网络终端,且以秒为单位快速变化。 大数据的特征 1、从互联网产生大数据的角度来看 数据体量巨大 数据类型繁多 价值密度低 变化速度快 “4V”特征 大数据的特征 2、从互联网思维的角度来看 样本渐趋于总体 全量 抽样 大数据的特征 2、从互联网思维的角度来看 样本渐趋于总体 精确让位于模糊 在大数据时代,只要掌握了大体的发展方向即可,适当忽略微观层面上的精确度,会让我们在宏观层面有更好的洞察力。 大数据的特征 2、从互联网思维的角度来看 样本渐趋于总体 精确让位于模糊 相关性重于因果 在大数据时代,无须再紧盯事物之间的因果关系,而应该寻找事物之间的相关关系;相关关系也许不能精确地告诉我们某件事情为何会发生,但是会提醒我们这件事情正在发生。 大数据的特征 3、从大数据存储和计算的角度来看 分布式存储 分布式并行计算 大数据的影响 任务:阅读书本P103和学习任务单提供的材料,思考下面问题 大数据对我们的日常生活等产生了哪些影响? 我们应该如何看待大数据对我们生活产生的影响? 大数据的影响 使人们日常生活更加便捷 对人们日常生活的负面影响 方便支付 方便出行 方便购物和产品推介 方便看病和诊病 ...... 个人信息泄露 信息伤害与诈骗 ...... 大数据的影响 总结:要辩证的看待大数据所带来的影响 合理看待大数据技术 学会保护自己和他人信息安全 练习与巩固 1、以下不属于大数据的“4V”特征的是( ) A.种类多 B.体量大 C.风险大 D.速度快 2、下列关于大数据的哪项做法是不正确的( ) A.尽可能的收集总体数量或趋近于总体数量的样本 B.不必追求精确,应当一味追求混杂的数据 C. ... ...