(
课件网) 第二十四章 数据的分析 八下数学 RJ 第1课时 24.2 数据的离散程度 1.了解数据离散程度的含义,掌握离差、离差平方和、方差的定义与意义. 2.学会计算一组数据的离差平方和与方差,能用方差比较两组数据的波动大小. 3.能利用方差分析和解决实际问题中数据的稳定性问题,从而做出合理判断. 在数据分析中,除了集中趋势,数据的波动情况也是人们经常关注的特征,统计中把它称为数据的离散程度.本节我们将学习刻画一组数据离散程度的两个常见统计量———离差平方和、方差. 问题 某农业科学院专家为某地选择合适的甜玉米种子.选择种子时,甜玉米的产量和产量的稳定性是专家所关心的问题.为了解甲、乙两种甜玉米种子的相关情况,专家各用10块自然条件相同的试验田进行试验,得到各试验田每公顷的产量 (单位:t) 如下表所示. 甲 7.65 7.50 7.62 7.59 7.65 7.64 7.50 7.40 7.41 7.41 乙 7.55 7.56 7.53 7.44 7.49 7.52 7.58 7.46 7.53 7.49 根据这些数据估计,专家应该选择哪种甜玉米种子呢 由样本平均数 估计总体平均数 上面两组数据的平均数分别是 甲=7.537,乙=7.515. 说明在试验田中,甲、乙两种甜玉米的平均产量相差不大. 由此可以估计出这个地区种植这两种甜玉米,它们的平均产量相差不大. 甲 7.65 7.50 7.62 7.59 7.65 7.64 7.50 7.40 7.41 7.41 乙 7.55 7.56 7.53 7.44 7.49 7.52 7.58 7.46 7.53 7.49 为了直观地观察甲、乙两种甜玉米在各试验田产量的分布情况,我们把表中的两组数据分别用图形进行描述,如图所示. 比较两幅图可以看出,甲种甜玉米在各试验田的产量波动较大,多个产量离平均产量较远;而乙种甜玉米在各试验田的产量波动较小,较集中地分布在平均产量附近.因此,从直观上判断乙种甜玉米的产量稳定性更好. 思考 如何用一个值刻画一组数据的波动程度或离散程度呢? 正如两幅图所呈现的,当数据分布比较分散时,数据与平均数的差异相对较大;当数据分布比较集中时,数据与平均数的差异相对较小. 反过来也成立. 这样,为了全面反映一组数据的离散程度,可以通过数据与平均数的差异来刻画. 一般地,有 n 个数据 x1,x2,,xn,用表示它们的平均数,我们把 xi- (i=1,2,,n)叫作 xi 关于平均数的离差. 思考 可以用平均离差刻画一组数据的离散程度吗? 用离差可以刻画每个数据与平均数的差异,但由 (x1- )+(x2- )++(xn- )=x1+x2++xn-n=0 可知,一组数据的离差和总是0,因此平均离差无法刻画一组数据与平均数的差异. 为了避免离差求和时正负抵消的问题,统计中通常先对离差进行平方,然后求和.我们把 (x1- )2+(x2- )2++(xn- )2 叫作这 n 个数据关于平均数的离差平方和,记作“d2”. 例1 体育老师随机选取八年级两个班各10名同学测量身高(单位:cm),数据如下: 八(2)班:154,161,149,158,162,155,160,152,156,163; 八(5)班:148,150,166,168,152,155,158,149,165,159. (1)分别计算两组数据的离差平方和; 解:(1)计算平均身高: 八(2)班:1= × (154+161+149+158+162+155+160+152+156+163) =157. 八(5)班:2 = × (148+150+166+168+152+155+158+149+165+159) =157. 计算离差平方和: 八(2)班:d12=(154 157) +(161 157) +(149 157) +(158 157) +(162 157) +(155 157) +(160 157) +(152 157) +(156 157) +(163 157) =190. 八(5)班:d22=(148 157) +(150 157) +(166 157) +(168 157) +(152 157) +(155 157) +(158 157) +(149 157) +(165 157) +(159 157) =494. 例1 体育老师随机选取八年级两个班各10名同学测量身高 (单位:cm),数据如下: 八(2)班:154,161,149,158,162,155,160,152,156,163; 八(5)班:148,150,166,168,152,155,158,149,165,15 ... ...