(
课件网) 管理统计学 11 主成分分析与因子分析 11.1 因子分析 11.1.1 因子分析的理论与方法 11.1.2 因子分析的SPSS应用 11.2 主成分分析 11.2.1 主成分分析的理论与方法 11.2.2 主成分分析的SPSS应用 11.1 因子分析 因子/基础变量:既能包含原来众多变量代表的信息,又能解释这些变量相互依存关系的变量 因子分析:多元统计分析技术的一个分支,用于处理多变量问题,是一种降维、简化数据的技术 因子分析的应用 寻求基本结构 数据化简 11.1.1 因子分析的理论与方法 因子分析的数学模型 因子分析的有关概念 因子负载 公共因子方差 因子的贡献 因子旋转 解释因子 因子得分 因子分析的步骤 因子分析的数学模型 F1,F2,…,Fm称为公共因子, i为Xi的特殊因子 矩阵形式X=AF 需满足: m p Cov(F, )=0 且 因子负载 联系观测变量和公共因子的桥梁 公共因子完全不相关时,因子负载aij等于第i个变量和第j个因子之间的相关系数 aij的绝对值越大,公共因子与观测变量关系越大 公共因子彼此不相关时,变量Xi与Xj的相关系数为 比较观测数据计算出的相关系数和模型导出的变量的相关系数,判断因子解是否合适 差别很小,模型很好的拟合观测数据,因子解合适 公共因子方差/共同度 观测变量的方差中由公共因子决定的比例 说明用公共因子替代观测变量后,原来每个变量信息被保留的程度 公共因子方差越大,变量能够被因子说明的程度越高 当公共因子彼此正交时,公共因子方差等于和该变量有关的因子负载的平方和 因子的贡献 用因子所能够解释的总方差衡量的每个公共因子对变量的解释能力 所有公共因子的总贡献为: 实际中,相对指标更为常用,即每个因子所解释的方差占所有变量总方差的比例Vp/k K为观测变量的个数 因子旋转 因子结构:因子和变量之间的相关关系 因子模式:因子负载矩阵 因子旋转的条件 一个变量在多个公共因子上有较大的负荷 多个变量在同一个公共因子上有较大的负荷 因子旋转的目的 使同一个因子在各个变量上的负载尽可能的向靠近1和靠近0的两极分离 因子旋转的方式 正交旋转:使因子轴之间仍然保持90度角,因子之间仍旧不相关,因子结构与因子模式等同 斜交旋转:因子之间的夹角是任意的,因子负载不再等于因子和变量之间的相关系数 因子模式与因子结构的关系为S=BW,S为因子结构矩阵,B为因子负载矩阵,W为斜交因子之间的相关系数矩阵 解释因子 解释因子的作用 借助因子负载矩阵,找出在某个因子上有显著负载的变量 根据这些变量的意义给因子一个合适的名称 具有较高负载的变量对因子名称的影响较大 解释因子的确定 一般认为绝对值大于0.3的因子负载就是显著的 因子得分 因子得分的求解过程 用观测变量的线性组合表示因子 依据因子对应的每个变量的具体数值进行测度 因子得分的计算 在因子分析模型中,不考虑特殊因子的影响,当m=p且A可逆时,该样本在因子F上的得分F=A-1X 实际应用要求m p,只能对因子得分进行估计 因子分析的步骤 计算所有变量的相关系数矩阵 提取因子,确定因子的个数和求因子解的方法 进行因子旋转,使因子解的实际意义更容易解释 计算因子得分 11.1.2 因子分析的SPSS应用 添加分析变量 描述性统计设置 因子提取设置 因子旋转设置 因子得分设置 缺失值及因子负载矩阵设置 生育率影响因素分析 变量设置 X1: Multi-parity(%), X2: Contraception(%) X3: J.school& above(%), X4: Average income(元), X5: Urban(%) Id X1 X2 X3 X4 X5 Id X1 X2 X3 X4 X5 1 0.94 89.89 64.51 3577 73.08 16 9.04 88.76 39.71 880 15.52 2 2.58 92.32 55.41 2981 68.65 17 12.02 87.28 38.76 1248 28.91 3 13.46 90.71 38.2 1148 19.08 18 11.15 89.13 36.33 976 18.23 4 ... ...