(
课件网) 数据分析(第二十四课时) 回顾 数据处理一般过程 数据采集 数据整理 数据分析 数据呈现 1.数据分析概念 数据分析是为了获取有价值的信息,使用适当的计算方法与工具对收集来的数据进行处理,提取有用信息,形成结论从而支持决策。 2.数据分析作用:了解事物的现状 2.数据分析作用:剖析事物的发展历程 2.数据分析作用:预测事物未来走向 3.数据分析 金山银山不如绿水青山,最近这些年,国家落实严控环境污染、修复生态环境等政策。随着政策落实,你所在家乡的空气质量是否有所改善? 我们需要数据来做出分析。 上节课,我们对空气质量原始数据做了整理。本节课,我们要分析之前整理的数据,从而做出判断。 课堂任务1:计算每日AQI平均值 怎样判断一天的空气质量如何? 计算一天中24小时的空气质量指数(AQI)的平均值。 平均分析法。 平均分析法:是指运用计算平均数的方法来反映总体在一定时间、地点条件下某一数量特征的一般水平。多用于比较同类现象在不同地区、不同行业、不同类型单位等之间的差异程度,分析现象之间的依存关系;也可以对某一现象在不同时间的水平进行比较,以说明现象的发展规律及趋势。 平均工资、平均年龄、平均身高、平均分 平均分析法 课堂任务1:计算每日AQI平均值 所需数据: 每天空气质量指数的平均值 计算一天中24小时的空气质量指数(AQI)的平均值 DataFrame筛选用法 DataFrame筛选数据 df.loc[条件,列索引号]筛选数据 df.loc[ df['北京']<50,['北京'] ] 筛选北京这一列值小于50的数据 DataFrame按日期筛选 DataFrame按日期筛选数据 df.loc[日期索引][列索引号]筛选 df.loc['2014-05-13']['北京'] 筛选2014-05-13的行,显示出北京这列的数据 课堂任务1:计算每日AQI平均值 下载 课堂活动1(每日AQI平均值).py 文件,和上节课生成的补全数据.csv放在同目录。 根据自己选择的城市,修改代码中城市名和文件名。 课堂任务1:计算每日AQI平均值 课堂任务1:计算每日AQI平均值 课堂任务1:计算每日AQI平均值 暂停视频 运行 课堂活动1(每日AQI平均值).py 文件 观察同目录下的结果数据文件 课堂任务1:计算每日AQI平均值 课堂任务2:统计每年AQI为优的天数 怎样判断现在的空气质量和过去比是否有了改善? 可以对比空气质量为优的天数在过去几年间的变化趋势 这里用到了对比分析法 对比分析法:也叫比较分析法,通常用于从数量上展示 和说明研究对象规模大小,水平高低等。 对比分析法分为横向和纵向对比两大类。 对比分析法 对比分析法———横向对比 对比分析法———纵向对比 课堂任务2:统计每年AQI为优的天数 所需数据: 每年空气质量为优的天数(AQI<=50) 需求: 对比空气质量为优的天数在过去几年间的变化趋势。 课堂任务2:统计每年AQI为优的天数 下载 课堂活动2(统计AQI为优数据).py 文件,和活动1生成的AQI每日平均值文件放在同目录。 注意:根据自己选择的城市,修改代码中城市名和文件名。 课堂任务2:统计每年AQI为优的天数 课堂任务2:统计每年AQI为优的天数 课堂任务2:统计每年AQI为优的天数 暂停视频 运行 课堂活动2(统计AQI为优数据).py 文件 观察同目录下的结果数据文件 课堂任务2:统计每年AQI为优的天数 课堂任务3:统计每年AQI各类情况的天数 怎样了解某一年某城市的空气质量整体情况? 可以呈现一年中空气质量为优、良好、轻度污染、中度污染、重度污染的天数占比比例。 这里用到结构分析法。 结构分析法 结构分析法:也称构成分析法,是将各个部分与总体进行对比,是分析事物内部的结构和部分与整体之间关系的方法。 课堂任务3:统计每年AQI各类情况的天数 所需数据: 每年空气质量为优(0-50)、良好(5 ... ...