% 1.00 2.00 3.00 4.00 100.0 .0 .0 .0 .0 100.0 .0 .0 .0 .0 100.0 .0 .0 .0 .0 100.0 100.0 100.0 100.0 100.0 a. 已对初始分组案例中的 100.0% 个进行了正确分类。 可以看到,由于加入了代表该年度的案例的数量特这,因此判别的结果是比较理想的,即对训练样本的所有个案正确分类,由此也检验了聚类分析的结果的合理性。
2.3 聚类分析结果的试探性分析 在查阅广州市往年的经济发展年度汇报等相关资料后,得到的结论是分类的结果跟广州市总体的经济形势是相符合的。 具体来说,聚类分析的结果是:2003、2004和2005一组,2006和2007一组,2008、2009和2010一组, 2011、2012和2013一组。从每年的广州市国民经济和社会发展统计公报中可以看出:
(1)2003年到2005年是广州市经济发展的快速时期,每年的GDP增长分别是15%、15%和13%。
(2)2006开始,国家开始采取宏观调控措施,抑制经济发展过热的现象,宏观调控措施可能是稍早之前就开始实施的,但在2006开始,确实是初见成效,这在很多经济分析报到中可以看到。
(3)而08年开始,受国内低温雨雪冰冻灾害、四川汶川特大地震灾害的影响和国际金融危机对实体经济的冲击,广州市的经济也收到相当大的影响,该年的GDP增长为12.3%,09年跟10年分别是11.5%跟13.0%(经济回暖过渡期)。
(4)2011年为国家的十二个五年计划的第一年,广州市有效应对了金融危机的影响,2011年至2013年广州市经济处于平稳发展的时期。 再回顾一下聚类分析的结果,就可以发现两者是相符合的。
第三部分 基于行政区域的聚类与判别分析
3.1 概述
1.安装spss软件,查阅资料。2.将判别分析法和聚类分析法应用到数据中。3.根据结果进行分析,对数据进行进一步的预处理,反复调整方法,直至得到一个合理的有意义的结果。
3.2 实现过程
首先我们得到的是14000多个样本,这是不方便进行聚类分析的。因此为了聚类,我们把样本按不同地区划分为24类。它们的共同属性是公司注册资金的均值。我们以此为依据进行聚类分析。
图3.2.1
将结果输出到一个新的表格,变量包括注册资金的均值和对应地区的个案数。
图3.2.2
再进行聚类分析
图3.2.3
聚类分析生成树状图如下所示
图3.2.4
从树形图进行分析,可以分成4个类别。对原表格添加一个“类别”变量
图3.2.5
分析:
1、 我们按广州市行政区划分析各个市辖区的经济发展状况。其中变量取值为“广州市”和“市辖区”的这一行对我们的分析帮助不大。且注意到“广州市”之所以注册资金如此高,是因为有一家公司注册资金达55万元,大幅抬高了总体水平。
2、 最后一行南海区样本数太少,删去。最后得到的数据再进行一次聚类分析得到结果如下
相关推荐: