学 海 无 涯
4实证过程与结果
4.1主成分与聚类分析
首先通过SPSS软件对环境污染的相应指标进行主成分分析,得到:
提取Y1、Y2、Y3和Y4四个主成分,其累积贡献率已经达到,超过80%,代表所有环境污染指标的绝大部分信息。Y1偏向于解释工业氢氧化物排放量,Y2偏向于解释生活烟尘排放量,Y3偏向于解释生活废水排放量,Y4偏向于解释工业二氧化硫排放量。
然后,根据主成分分析结果,用Z=0.43226*Y1+0.21911*Y2+0.10380*Y3+ 0.06519*Y4计算综合得分,见下表1。
表1 环境污染地区的主成分综合得分表
序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
最后将环境污染的综合得分作为个案进行层次聚类分析,将31个地区分为5类,如表2。
地区 北京 天津 石家庄 太原 呼和浩特 沈阳 长春 哈尔滨 上海 南京 杭州 合肥 福州 南昌 济南 郑州
Z 0.863 1.088 0.455 0.209 -0.052 -0.273 -0.257 2.489 1.979 -0.232 0.175 -0.5 -0.525 -0.949 0.022 -0.152
排名 5 4 6 8 12 17 16 2 3 15 9 21 25 29 10 14
序号 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
地区 武汉 长沙 广州 南宁 海口 重庆 成都 贵阳 昆明 拉萨 西安 兰州 西宁 银川 乌鲁木齐
Z -0.116 -0.841 -0.373 -0.519 -1.29 2.767 -0.451 -0.331 -0.552 -1.275 0.357 -0.514 0.004 -0.702 -0.502
排名 13 28 19 24 31 1 20 18 26 30 7 23 11 27 22
学 海 无 涯 表2 各地区污染分类
分类 1
污染情况 轻度污染
地区 海口、拉萨
合肥、乌鲁木齐、福州、南宁、兰州、,昆明、成都、
2
比较轻度污染
银川、南昌、长沙、沈阳、长春、南京、广州、贵
阳、郑州、武汉、济南、西宁、呼和浩特
3 4 5
4.2主成分分析和聚类分析在SPSS中的操作过程
打开SPSS,“文件-打开-数据”,选中excel,如下图结果。
污染情况一般 污染比较严重 污染十分严重
太原、杭州、石家庄、西安
北京、天津 上海、哈尔滨、重庆
首先将变量标准化,“分析-描述统计-描述”,将变量全部选入对话框,点上“将标准化得分另存为变量(Z)”,结果如下。
学 海 无 涯
在做主成分分析,“分析-降维-因子分析”,将为标准化的变量选入对话框。选择右侧“描述”,在弹出来对话框中点上“系数、显著性水平、KMO和Bartlett的球形度检验”,点“继续”。选择右侧“抽取”,在弹出来对话框中将方法改成“主成分”,“基于特征值”改成“0.6”,点“继续”。选择右侧“旋转”,在弹出来对话框中,将方法改成“最大方差法”,点“继续”。
相关推荐: