评价指标的建立
针对我国各省市综合发展情况做因子分析。数据表中选取了六个指标分别是:人均GDP(元)X1,新增固定资产(亿元)X2,城镇居民人均年可支配收入(元)X3,农村居民机家庭纯收入(元)X4,高等学校数量(所)X5,卫生机构数量(所)X6。。见下表:
各项指标及评价的内容 人均GDP 经济实力 新增固定资产 发展潜力能力 城镇居民人均年可支配城镇居民生活水平 收入 农村居民机家庭纯收入 农村居民生活水平 高等学校数量 教育水平 卫生机构数量 医疗水平 考察数据是否适合做因子分析
运用因子分析方法的前提是,变量之间存在线性的关系,这样才能够达到减
少变量,方便分析的目的。通过变量的相关矩阵可知,大多数变量的相关系数大于0.3,具有较强的相关性,同时,对上述变量进行了KMO测试度和Baetlett球体检验,见下表: Correlation Matrix 人均GDP 新增固定城镇居民人均年农村居民机家高等学校卫生机构资产 .459 1.000 .259 可支配收入 .760 .259 1.000 庭纯收入 .935 .449 .845 数量 .286 .658 .258 数量 -.061 .570 .134 Correlation 人均GDP 新增固定资产 城镇居民人均年可支配收入 农村居民机家庭纯收入 高等学校数量 卫生机构数量 Sig. (1-tailed) 人均GDP 新增固定资产 城镇居民人均年可支配收入 农村居民机家庭纯收入 1.000 .459 .760 .935 .449 .845 1.000 .390 .093 .286 -.061 .658 .570 .006 .258 .134 .000 .087 .390 .093 .000 .007 .000 1.000 .748 .066 .000 .088 .748 1.000 .377 .001 .244 .006 .000 .087 .000 .000 .007 .018 .315 1
高等学校数量 卫生机构数量 .066 .377 .000 .001 .088 .244 .018 .315 .000 .000 KMO and Bartlett's Test Kaiser-Meyer-Olkin Measure of Sampling Adequacy. Bartlett's Test of Sphericity Approx. Chi-Square df Sig. .635 148.798 15 .000 分析可知,巴特利特球度检验统计量观测值为148.798,相应的概率P接近0。如果显著性水平为0.05,由于概率P小于显著性水平0.05,应拒绝零假设,认为相关矩阵与单位矩阵有显著差异。同时,KMO值为0.635,较好的达到了标准,可以运用因子分析的方法。
提取因子
根据原来变量的相关系数矩阵,采用主成分分析法提取因子并选取大于1的特征根。 Communalities 人均GDP 新增固定资产 城镇居民人均年可支配收入 农村居民机家庭纯收入 高等学校数量 卫生机构数量 Initial 1.000 1.000 1.000 1.000 1.000 1.000 Extraction .930 .721 .795 .961 .847 .859 Extraction Method: Principal Component Analysis. 表中第2列是根据因子分析初始解计算出来的变量共同度,第三列是根据因子分析最终解计算出的变量共同度。可以看出,变量的绝大部分信息可被因子分析,信息丢失较少。因子提取的总体效果比较好。 Total Variance Explained Extraction Sums of Squared Initial Eigenvalues % of Component 1 Total Variance Cumulative % Total 55.449 3.327 Loadings % of Variance 55.449 Cumulative % Total 55.449 2.796 Rotation Sums of Squared Loadings % of Variance 46.605 Cumulative % 46.605 3.327 55.449 2
2 1.786 29.771 85.220 1.786 29.771 85.220 2.317 38.614 85.220 3 4 5 6 .497 .262 .088 .040 8.285 4.362 1.473 .660 93.505 97.867 99.340 100.000 Extraction Method: Principal Component Analysis. 看图表的第二列,变量相关系数矩阵有2大特征根大于1,它们分别是:3.327,1.786. 它们一起解释了各省市综合发展情况的85.22%。也就是说前2个因子集中体现了原始数据大部分的信息,因此,提取2个公共因子是合适的,能够比较全面的反映情况。同时可以参考碎石图来验证。 该图的横坐标为因子数目,纵坐标为特征根。曲线迅速下降,然后下降变得平缓,从第3个因子开始变成近似一条直线,特征跟值小于1,解释原有的变量贡献小。曲线变平开始的前一个点被认为是提取的最大因子数,即提取2个公因子。第3个因子后面的这些散点像山脚下的碎石,可以舍去,不会损失太多信息。
因子的命名与解释
计算输出因子载荷矩阵(component martix),是用标准化的公因子近似表示标准化原始变量的系数矩阵,见下表: Component Matrix 3
a 农村居民机家庭纯收入 人均GDP 城镇居民人均年可支配收入 新增固定资产 高等学校数量 卫生机构数量 Component 1 .893 .831 .781 .732 .694 .461 2 -.405 -.490 -.431 .430 .605 .804 Extraction Method: Principal Component Analysis. a. 2 components extracted. 农村居民机家庭纯收入=0.893F1-0.405F2 人均GDP=0.831F1-0.490F2
城镇居民人均年可支配收入=0.781F1-0.431F2 新增固定资产=0.732F1-0.430F2 高等学校数量=0.694F1-0.605F2 卫生机构数量=0.461F1-0.804F2 Rotated Component Matrix a 农村居民机家庭纯收入 人均GDP 城镇居民人均年可支配收入 卫生机构数量 高等学校数量 新增固定资产 Component 1 .961 .960 .885 -.098 .207 .340 2 .196 .091 .109 .922 .897 .778 Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization. a. Rotation converged in 3 iterations. 根据因子正交旋转矩阵,将指标分成4个公共因子并命名:第一个公因子F1在农村居民机家庭纯收入、人均GDP、城镇居民人均年可支配收入有较大的载荷,这三个指标是对城市整体经济发展情况的描述,因此,可称为经济因子;第二个因子F2在新增固定资产、高等学校数量、卫生机构数量有较大的载荷,这三个指标反映对社会建设情况的描述,因此可称为社会因子。
公共因子命名 变量 载荷 指标
F1 农村居民机家庭纯收入 人均GDP 4
F2 新增固定资产 高等学校数量 城镇居民人均年可支配收入 因子 命名 经济因子 旋转后的因子载荷图
卫生机构数量 社会因子 计算因子得分与综合评价得分及排序
Component Score Coefficient Matrix 人均GDP 新增固定资产 城镇居民人均年可支配收入 农村居民机家庭纯收入 高等学校数量 卫生机构数量 Component 1 .363 .037 .332 .350 -.030 -.152 2 -.075 .324 -.058 -.026 .396 .446 5
搜索“diyifanwen.net”或“第一范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,第一范文网,提供最新高中教育因子分析主成份分析案例详解 全文阅读和word下载服务。
相关推荐: