(
课件网) 粤教版普通高中教科书 信息技术 必修1 5.1 认识大数据 灵璧县第二中学 王凤龙 身边的大数据 场景一:当我们打开淘宝、拼多多等购物软件时,首页会显示出推荐的商品。为什么购物软件推荐的商品总是很合我们心意? 场景二:当我们打开抖音、哔哩哔哩等视频软件时,首页会显示出推荐的视频。为什么打开视频软件就刷到停不下来了? 大数据分析 播放时长 点赞 视频类型 评论 教育程度 性别 年龄 地域 职业 搜索记录 用户观看视频行为分析 用户网络购物行为分析 学习内容 大数据的基本概念 大数据是指无法在可承受的时间范围内用常规软件工具进行高效捕捉、管理和处理的数据集合。 常规数据处理软件工具 数据量 <100万条 Python R语言 Hadoop Spark Excle Wps 大数据处理软件工具 数据量 >100万条 …… 大数据的产生和意义 大数据的产生是与人类日益普及的网络行为所伴生的。互联网生成的数据量,不仅远超此前一切人类所生成的数据量的总和,而且在以大爆发性的速度不断增长。 在天气预报、大气监测、地球物理探矿和天体运动观测等科学实验和科学观察等活动中,各种各样的传感器每时每刻都在产生大量的数据。 大数据已成为人们提取信息、做出决策的重要依据,是推动信息社会发展的重要资源。 交通大数据 购物大数据 新冠肺炎大数据 气象大数据 大数据的特征 案例1:某市交通智能化分析平台的数据来源于道路交通、电信、地理信息系统等各行各业。例如,交通卡刷卡每天产生1900万条记录,手机定位数据每天产生1800万条,出租车运营数据每天产生100万条,电子停车收费系统数据每天产生50万条,等等。这些数据在体量和速度上都达到了大数据的规模。 大数据的特征 结合书本案例1,从互联网产生大数据的角度来看大数据具有哪些特征? 数据体量巨大:从TB级别跃升到PB级别。(1024GB=1TB,1024TB=1PB) 1PB约相当于1024*200个王者荣耀 1PB约相当于1024*50个原神 5GB 20GB 案例1:某市交通智能化分析平台的数据来源于道路交通、电信、地理信息系统等各行各业。例如,交通卡刷卡每天产生1900万条记录,手机定位数据每天产生1800万条,出租车运营数据每天产生100万条,电子停车收费系统数据每天产生50万条,等等。这些数据在体量和速度上都达到了大数据的规模。 大数据的特征 - 从互联网产生大数据的角度来看 结合书本案例1,从互联网产生大数据的角度分析大数据具有哪些特征? 数据类型繁多:如网络日志、视频、图片、地理位置信息等 淘宝 小红书 案例1:某市交通智能化分析平台的数据来源于道路交通、电信、地理信息系统等各行各业。例如,交通卡刷卡每天产生1900万条记录,手机定位数据每天产生1800万条,出租车运营数据每天产生100万条,电子停车收费系统数据每天产生50万条,等等。这些数据在体量和速度上都达到了大数据的规模。 大数据的特征 结合书本案例1,从互联网产生大数据的角度分析大数据具有哪些特征? 数据价值密度低:大数据的数据量很多,但其中有价值的数据却相对占比较少。以视频为例,在连续不间断的监控过程中,有用的数据可能仅仅一两秒。 警察利用监控视频破案 案例1:某市交通智能化分析平台的数据来源于道路交通、电信、地理信息系统等各行各业。例如,交通卡刷卡每天产生1900万条记录,手机定位数据每天产生1800万条,出租车运营数据每天产生100万条,电子停车收费系统数据每天产生50万条,等等。这些数据在体量和速度上都达到了大数据的规模。 大数据的特征 结合书本案例1,从互联网产生大数据的角度分析大数据具有哪些特征? 数据变化速度快:数据来自世界各地的网络终端,且以秒为单位快速变化。 互联网加快了数据产生和变化的速度 …… 各类 ... ...