(
课件网) 5.1认识大数据 信息技术必须一《数据与计算》 学习目标 大数据是什么 大数据的特征 大数据与传统数据的区别 大数据对日常生活的影响 大数据的技术背景 大数据的产生是与 人类日益普及的网络行 为所伴生的:物联网、 云计算、移动互联等。 产生的数据以大爆发性 的速度增长。 大数据已成为人们 提取信息、做出决策的 重要依据,是推动信息 社会发展的重要资源。 01 大数据是什么 大数据是什么 观看《认识大数据》视频,了解大数据的概念 ,并填写项目活动记录表。 无法在可承受的时间范围内用常规软件工具 进行高效捕捉、管理和处理的数据集合,是需 要新处理模式才能具有更强的决策力、洞 察发现力和流程优化能力的海量、高增 长率和多样化的信息资产。 下面哪些是大数据? 1、2022年安徽省参加高考的学生总数。 在一定时间范围内, 用常规软件工具捕 捉、管理和处理的 数据不属于大数据 2 、淮南一中期末考试之后,所有学生的考试成绩。 3 、100本《百科全书》。 4 、第六次全国人口普查统计的各地人口的数量、年龄、性别等数据 5 、网络购物平台一天所生成的数据量。 2021中国产生的数据:10ZB(118万亿亿字节) 11,805,916,207,174,113,034,240 字节 ZB、EB 、PB 、TB 、GB 、MB 、KB 数据来源:东方财富网(前瞻产业研究院) 数据的存储单位 1 Byte (字节) = 8 bit (位) 1KB( 千 字 节 )= 1024 B 1MB(兆字节)= 1024 KB 1GB(吉字节)= 1024 MB 1TB(太字节)= 1024 GB 1PB(拍字节)= 1024 TB 1EB(艾字节)= 1024 PB 1ZB(泽字节)= 1024 EB 1YB(尧字节)= 1024 ZB 一首三分钟的歌曲,如果用最高质量 的mp3的格式,把它录下来的话大 概8MB,1个ZB可以存多少首歌曲? 140万亿首!可以算一下,一个人要 听一遍的话,得8亿多年才可以听完 ! 02 大数据的特征 大数据的特征 1 、从互联网产生大数据的角度来看 2 、从互联网思维的角度来看 3 、从大数据存储与计算的角度来看 活动一 以小组为单位,探究大 数据的特征并完成项目 活动记录表。 从互联网产生大数据的角度———4V特征(重点) 高速(velocity) 多样(variety) 大量(volume) 价值密度低(value) 多样(variety):网络日志、音频、视频、图片、地理位置…. 价值密度低(value):在连续不间断的监控视频中,只有几秒钟有用 高速(velocity):数据来自世界各地,每时每刻都在变化 email:Email:2.04亿封被发出 Google:200万次搜索请求被提交 大数据 Youtube:2880分钟的视频被上传 刚刚过去的一分钟 Facebook:69.5万条状态被更新 Twitter:98000条推送被发出 12306:1840张车票被卖出 数据世界里 发生了什么? 从互联网思维角度认识大数据 精确 让位 模糊 样本 趋于 总体 相关 重于 因果 强调大数据生成的动态性 强调数据之间的离散性 强调大数据研究统计性 传 统 样 本 趋 于 总 体 抽样 大 数 据 不抽样 计算能力 存储能力 精确? 精 确 让 位 模 糊 研究趋势、把握整体 强调大数据研究统计性 全球零售业巨头沃尔玛在对消费者购物行为分析时发现, 男性顾客在购买婴儿尿片时,常常会顺便搭配几瓶啤酒 来犒劳自己,于是尝试推出了将啤酒和尿布摆在一起的 促销手段。没想到这个举措居然使尿布和啤酒的销量都 大幅增加了。 相 关 重 于 因 果 大数据存储与计算角度 分布式存储 分布式并行计算 大数据存储在互 联网不同的服务 器和各客户终端 应用分布式并行计算 处理互联网的大数据 03 传统数据与大数据的区别 流 交 大数据与传统数据的区别 传统数据 大数据 数据体量巨大 数据类型繁多 价值密度低 数据量小 数据类型少 价值密 ... ...