变量间的相关关系__统计案例 [知识能否忆起] 一、变量间的相关关系 1.常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系. 2.从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关. 二、两个变量的线性相关 1.从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线. 2.回归方程为=x+,其中=, =-. 3.通过求的最小值而得到回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法. 4.相关系数=, 当r>0时,表明两个变量正相关; 当r<0时,表明两个变量负相关. r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0时,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性. 三、独立性检验 1.2×2列联表:假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表(称2×2列联表)为: y1 y2 合计 x1 a b a+b x2 c d c+d 总计 a+c b+d a+b+c+d K2=(其中n=a+b+c+d为样本容量). 2.用K2的大小可以决定是否拒绝原来的统计假设H0,若K2值较大,就拒绝H0,即拒绝事件A与B无关. 3.当K2>3.841时,则有95%的把握说事件A与B有关; 当K2>6.635时,则有99%的把握说事件A与B有关; 当K2>2.706时,则有90%的把握说事件A与B有关. [小题能否全取] 1.(教材习题改编)观察下列各图形 其中两个变量x、y具有相关关系的图是( ) A.①② B.①④ C.③④ D.②③ 解析:选C 由散点图知③④具有相关关系. 2.(教材习题改编)已知变量x,y之间具有线性相关关系,其回归方程为=-3+bx,若i=17,i=4,则b的值为( ) A.2 B.1 C.-2 D.-1 解析:选A 依题意知,==1.7,==0.4,而直线=-3+bx一定经过点(,),所以-3+b×1.7=0.4,解得b=2. 3.在一次对性别与说谎是否相关的调查中,得到如下数据: 说谎 不说谎 合计 男 6 7 13 女 8 9 17 合计 14 16 30 根据表中数据,得到如下结论中正确的一项是( ) A.在此次调查中有95%的把握认为是否说谎与性别有关 B.在此次调查中有99%的把握认为是否说谎与性别有关 C.在此次调查中有99.5%的把握认为是否说谎与性别有关 D.在此次调查中没有充分的证据显示说谎与性别有关 解析:选D 由于K2=≈0.0024,由于K2很小,因此,在此次调查中没有充分的证据显示说谎与性别有关.故选D. 4.某考察团对全国10大城市的居民人均工资收入x(万元/年)与居民人均消费y(万元/年)进行统计调查,发现y与x具有相关关系,且y对x的回归方程为=0.66x+1.562.若某城市居民人均消费为7.675(万元/年),估计该城市人均消费占人均工资收入的百分比约为_____. 解析:因为当=7.675时,x=≈9.262, 则≈0.829≈83%. 答案:83% 5.已知x,y之间的数据如表所示,则回归直线过点_____. x 1 2 3 4 5 y 1.2 1.8 2.5 3.2 3.8 解析:=3,=2.5, ∴样本点中心为(3,2.5),回归直线过样本点中心. 答案:(3,2.5) 1.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义. 2.由回归方程进行预报,仅是一个预报值,而不是真实发生的值. 3.使用K2统计量作2×2列联表的独立性检验时,要求表中的4个数据都要大于5,在选取样本容量时一定要注意. 相关关系的判断 典题导入 [例1] (2012·新课标全国卷)在一组样本 ... ...
~~ 您好,已阅读到文档的结尾了 ~~