(
课件网) 3.2 数据采集与整理 学习目标: 通过生活中的应用实例,体验数据分析的方法和作用,感受数据分析对人们日常生活的影响。 能够利用软件工具或平台、Python程序对数据进行计算与分析。 了解数据可视化的概念、作用和表现形式,能够根据需求选择合适的可视化形式,能够挖掘数据分析的社会价值。 理解南水北调工程的重要意义,提高合理用水、节约用水意识。 南水北调工程的起因是什么? 如今中线工程完工供水对沿途四省市有什么 具体影响? 对当地今后的经济和社会可持续发展战略作用是什么? 新课导入: 数据 收集、整理、存储 收集整理存储的这些数据到底有什么作用? 如何去分析处理才能有助决策? 数据分析 1.数据分析的作用 2.数据分析的基本方法 3.数据分析体验 数据 知识 信息 数据收集 数据整理 数据存储 数据分析 数据分析: 指用适当的计算方法与工具对收集来的数据进行处理,提取有用信息,形成结论,从而支持决策。 描述性 数据分析 探索性 数据分析 验证性 数据分析 侧重于对数据的各种特征进行分析,对变量之间的关系进行评估和描述。 主要用于在数据中发现新的特征。 为侧重于验证已有假设的真伪。 数据分析的基本方法 结构分析法: 也称构成分析法,是将各个部分与总体进行对比,是分析事物内部的结构和部分与整体之间关系的方法。结构分析法的基本表现形式就是计算结构指标。 对比分析法: 也叫比较分析法,是将两个或两个以上的数据进行比较,分析它们的差异,揭示出这些数据所反映的事物规律的方法,是一种常用的分析方法。 平均分析法: 运用计算平均数的方法来反映总体在一定时间、 地点等条件下某一数量特征的一般水平。 平均指标中最常用的是算术平均数,如平均身高、平均工资和平均降水量等。 体验数据分析 用电子表格软件进行数据分析 用在线数据平台进行数据分析 使用编程工具进行 数据分析 体验实践: 使用编程工具进行数据分析。 (1)问题:编写程序统计分析南水北调中线工程各地区2007-2016年水资源情况。 (2)任务:运用解析算法描述问题求解过程。 ①分析问题(已知条件、求解目标、已知和未知的关系); ②规划问题求解流程; ③利用Python语言编程实现与调试;(教科书第111页) ④保存文件,运行程序。 (3)分析结论,思考下列两问题: ①中线各地区水资源的实际情况如何? ②政府实施南水北调工程的起因是什么? 数据可视化: 数据可视化是以图形、图像和动画等方式直规生动地呈现数据及数据分析结果,揭示数据之间的关系、趋势和规律等,方便人们更好地理解数据。 体验探究1: 在Excel中实现数据的可视化 体验探究2: 在python中 编写程序制作《三国演义》词云。 from scipy.misc import imread import matplotlib.pyplot as plt from wordcloud import WordCloud import jieba import imageio import numpy as np text=open("sanguo.txt","rb").read() text_jieba=" ".join(jieba.cut(text)) mask=np.array(image.open("2.png")) wc =WordCloud( font_path="C:\Windows\Fonts\SimHei.ttf", background_color="white", max_words=200, mask=mask, max_font_size=30 ) wc.generate(text_jieba) wc.to_file("三国演义词云.jpg") plt.figure() plt.imshow(wc) 知识拓展: 1.Scipy:科学计算核心库之一。 Scipy的misc用于对图像进行操作,函数imread()读入用于生成词云的图像文件。 2.Jieba:中文分词工具,使用cut方法进行分词。 3. Wordcloud:词云生成工具,使用generate方法读取文本生成词云。 作业: 现有5名篮球队员的比赛数据,如表3.3.5所示。试分析比较他们在各项能力上的差异。思考:哪种图表形式适合呈现队员的数 ... ...