(
课件网) 任务1 初识大数据 学习单元七———模块二 课堂引入 【疫情】通信大数据行程卡+四川天府健康通(如何判断“密切接触”) 任务介绍 大数据是人类信息时代的产物,蕴含丰富的社会价值。那么什么是大数据?大数据在现实生活中有哪些应用? 目录 / CONTENTS 01. 什么是大数据 What is Big Data 02. 大数据的特征 Characteristic of Big Data 03. 大数据的应用 Application of Big Data PART 01 什么是大数据 What is Big Data 什么是大数据 数据:对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合。 身高(140cm) 存款(262170.12元) 时间(10:10) 什么是大数据 何为大?—数据度量。 1Byte = 8 Bit 1KB = 1,024 Bytes 1MB = 1,024 KB = 1,048,576 Bytes 1GB = 1,024 MB = 1,048,576 KB = 1,073,741,824 Bytes 1TB = 1,024 GB = 1,048,576 MB = 1,099,511,627,776 Bytes 1PB = 1,024 TB = 1,048,576 GB =1,125,899,906,842,624 Bytes 1EB = 1,024 PB = 1,048,576 TB = 1,152,921,504,606,846,976 Bytes 1ZB = 1,024 EB = 1,180,591,620,717,411,303,424 Bytes 1YB = 1,024 ZB = 1,208,925,819,614,629,174,706,176 Bytes 倍数:1024 什么是大数据 大数据是指那些数据量特别大、数据类别特别复杂的数据集。这种数据集不能用传统的数据库进行转存、管理和处理,是需要新处理模式才能具有更强大的决策力、洞察发现力和流程优化能力的海量、高增差率和多样化的信息资产。 《红楼梦》含标点87万字(不含标点853509字) 每个汉字占两个字节:1汉字=16bit = 2*8位=2bytes 1GB 约等于 671部红楼梦 1TB 约等于 631,903 部红楼梦 1PB 约等于 647,068,911部红楼梦 PART 02 大数据的特征 Characteristic of Big Data 大数据的特征(4V) 种类多(Variety) 75% 网络日志、音频、视频、图片、地理位置信息 基因序列 社交媒体中产生的数据 25% “1、2、3、4”等 传统数字以及符号表示的数据 非结构化数据 结构化数据 大数据的特征(4V) 容量大(Volume) 中国国家图书馆 100 百度每天处理数据量 根据IDC(国际数据公司)的监测统计,2020年全球将总共拥有35ZB的数据量,2025年人类的大数据量将达到163ZB,增长近5倍,相当于我们地球上所有海滩沙粒总数的157倍。 截至2020年,人类拥有的信息 总量大概是35Z 存储数据量最大的图书馆之一。截止2020年,拥有1000TB的数据 一首歌 4M ×1024 ×1024 一部电影1G ×1024 一图书馆藏书1T ×1024 谷歌每小时处理1P 13亿中国人 人手1本500页书的信息量总和=1E ×1024 吉(G) 兆(M) 太(T) 拍(P) 艾(E) 泽(Z) 约为100个中国国家图书馆 数据总和 大数据的特征(4V) 应用价值大(Value) 大数据之“大”,其实并不在于其表面的“大容量”,而在于其潜在的“大价值”。如果不能把拥有的数据转化为价值,那么拥有再多的数据也是毫无意义的。 个人位置大数据服务 8000亿美元的市场规模 零售业大数据 帮助企业增加60%的利润 制造业大数据 降低50%的产品开发制造装配成本 大数据的特征(4V) 存取速度快(Velocity) 数据产生得快 抖音平台现在每天上传的视频量是6000万条 每条视频平均10MB 6000万条*10M/条=6亿M≈572TB 1TB的硬盘×572个 数据处理速度快 大数据通过云计算, 以上数据储存仅需几分钟左右 已完成50% PART 03 大数据的应用 Application of Big Data 大数据的应用 生活无处不大数据 大数据的应用 大数据让政府治理更精准透明 大数据的应用 大数据让经济治理更有效 芝麻信用:在授权开通之后,支付宝平台结合内部数据和外部数据进行综合评估,得到芝麻分 ... ...