第一范文网 - 专业文章范例文档资料分享平台

多元统计分析课程设计

来源:用户分享 时间:2025/5/22 6:08:00 本文由loading 分享 下载这篇文档手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:xxxxxxx或QQ:xxxxxx 处理(尽可能给您提供完整文档),感谢您的支持与谅解。

设计目的与要求:

掌握用统计软件利用主成分分析的方法对涉及众多变量的某一问题进行分析 设计环境或器材、原理与说明: 机房spss软件

?设x?X1,?,Xp是一个p维随机向量,有二阶矩存在,记μ?E?x?,Σ?D?x?。

??考虑它的线性变换:

?x?a11X1?a21X2???ap1Xp?Y1?a1??Y2?a?2x?a12X1?a22X2???ap2Xp (5.1) ??????Y?a?x?aX?aX???aXp1p12p2ppp?p易见

?Var?Yi??Var?a?ix??aiΣai,??Cov?Yi,Yj??Cov?a?ix,ajx??aiΣaj,i?1,?,p (5.2)

假如我们希望用Y1来代替原来的p个变量X1,?,Xp,这就要求Y1尽可能地反映原来p个变量的信息,这里“信息”用什么来表达?最经典的方法是用Y1的方差来表达。Var?Y1?越大,表示Y1包含的信息越多。由(5.2)可以看出,对a1必须有某种限制,否则可使Var?Y1???,常用的限制是

a?,?,p (5.3) iai?1,i?1?Σa1达到极大,Y1就称为第一主成分。如故我们希望在约束(5.3)下找a1,使得Var?Y1??a1果一个主成分不足以代表原p个变量,可再考虑采用Y2,为了最有效地代表原变量的信息,

Y1已有的信息就不需要出现在Y2中,用数学语言来讲,就是

Cov?Y1,Y2??0 (5.4)

于是,求Y2就是在约束(5.3)和(5.4)下求a2,使Var?Y2?达到极大,所求的Y2称为第二主成分。类似地,我们可以定义第三主成分、第四主成分、…。一般地讲,x的第i个主成分Yi?a?ix是指:在约束

a?,?,p iai?1,i?1?Cov?Yi,Yk??Cov?a?ix,akx??0?k?i?

下求ai,使得Var?Yi??a?iΣai达到极大。

令?1????p?0表示Σ?D?x?的特征根,t1,?,tp为相应的单位特征向量。若特征根有重根,对应于这个特征根的特征向量组成一个Rp的子空间,子空间的维数等于重根的次数。在子空间中任取一组正交的坐标系,这个坐标系的单位向量就可用来作为它的特征向量。显然,这时特征向量的取法不唯一,有无穷多种取法,在下面的讨论中,我们总假定已选定的某一种取法。

设计过程(步骤)或程序代码:

1、将原始数据标准化,标准化的数据见下表

0.423523 1.338405 1.590282 1.687556 2.239634 0.481971 0.954746 1.260371 0.995199 1.409649 1.631453 0.667228 1.065873 1.188758 1.855394 1.133844 -0.14352 -0.271 -0.10906 -0.29487 -0.00854 -0.57821 -0.45763 -0.15279 -0.81499 -0.98577 -1.08721 -1.81143 2.740046 -1.79273 -0.84655 -0.56349 -1.06992 -1.20067 -1.303 -0.61894 -1.14919 -0.86449 -0.69303 -1.00129 -0.15024 0.186827 0.583737 0.771033 0.694243 -0.3171 -0.11989 -2.2717 -0.47486 -0.71949 -0.7039 -0.68477 -0.82907 -0.43245 -0.4167 -0.69238 -0.58206 -0.43218 -0.29078 0.39379 0.359408 -0.47334 -0.22224 -0.62003 2.009583 3.080956 2.988656 1.300186 2.096133 2.755433 1.671171 2.983284 2.430294 0.949485 0.548246 -1.48989 -0.58254 1.555783 2.26478 1.659299 2.465025 1.581335 1.002539 -0.85187 -0.04166 2.194408 1.753048 1.4367 0.226481 0.137774 0.199007 -0.15562 -1.02776 -0.26257 -0.25294 -0.15767 0.503868 0.350337 0.172033 -0.24423 -0.38385 0.505041 0.156444 -0.22732 -0.14028 -0.56298 -0.64428 -0.9658 -0.99465 -0.05179 -0.24271 -0.51352 0.383929 0.281429 0.308322 -0.16574 -0.10789 0.106557 0.330433 0.72583 -0.34774 -0.25932 -0.21838 0.206435 -0.63406 -0.43245 -0.60092 -0.38161 0.068569 -0.00238 -0.03382 -0.13536 -0.08581 0.115994 0.27926 0.37519 0.07019 0.227705 0.363689 0.335558 -0.24771 -0.4681 -0.50881 -0.05958 0.820617 0.481145 0.299804 -0.49995 -0.56783 1.300963 1.261785 0.461673 -0.00645 0.294277 0.309741 0.652037 0.101843 0.014276 -0.35529 -0.18072 -0.37669 -0.60386 -0.6457 -0.60122 -0.52735 -0.42825 -0.14036 -0.30489 -0.97128 -0.58868 -0.62014 1.322972 -0.47952 -0.68202 -1.18429 -0.64022 -0.63161 0.279093 0.565282 2.636993 -0.00486 -0.28459 -0.54975 -0.16793 -0.53205 -0.74635 -0.87284 -0.62654 -0.07477 0.013227 -0.40646 -0.36109 -0.95809 -0.63656 -0.35182 1.08498 0.71632 -0.83093 -1.37875 -0.07253 -1.14239 -1.30812 -1.48472 -0.80883 -0.86219 -0.69566 -1.19453 -0.71829 -1.11252 -1.3163 -1.40522 -0.94555 -1.03512 -0.92741 -1.38899 -0.52311 -0.94257 -0.96475 -0.79192 -0.15815 -0.36913 -0.71034 0.432779 -0.42603

2、将以上数据导入spss软件,依次点击分析—降维—因子分析

点击 按钮,在弹出的对话框中,在 中选择。回到原对话框点击右侧的确定。即可得到以下输出结果

0.04881.20010.490-0.159-1.1870.3089-0.343-0.4662.16251.96481.58850.81860.1268-0.3370.6452-0.3010.26030.26200.69550.0436-0.891-1.5110.0331-1.275-0.816-2.035-0.840-0.483

Total Variance Explained Component 1 2 3 4 5 6 7 8 9 Total 6.150 1.473 .697 .318 .190 .116 .029 .024 .002 Initial Eigenvalues % of Variance 68.332 16.365 7.749 3.531 2.112 1.289 .324 .270 .027 Cumulative % 68.332 84.698 92.447 95.978 98.090 99.379 99.703 99.973 100.000 Extraction Sums of Squared Loadings Total 6.150 1.473 % of Variance 68.332 16.365 Cumulative % 68.332 84.698 Extraction Method: Principal Component Analysis.

由输出结果看到前面两个主成分y1,y2的方差和占全部方差的比例为84.7%。我们就选取y1为第一主成分,y2为第二主成分。且这两个主成分占全部方差的84.7%,即基本上保留了原来指标的信息,这样由原来的9个指标转化为2个新的指标,起到了降维的作用

2、spss软件得到主成分系数矩阵如下: Component Matrixa X1 X2 X3 X4 X5 X6 X7 X8 X9 Component 1 .931 .976 .931 .232 .433 .923 .897 .871 .899 2 -.315 .163 .322 .863 .596 -.200 -.274 -.064 -.154

Undefined error #11401 - Cannot open ss.e a. 2 components extracted. text file \Files\\SPSSInc\\Statistics17\\lang\\en\\sp

3、由以上结果得到前两个主成分的线性组合为

y1=0.931x1+0.976x2+0.931x30.232x4+0.433x5+0.923x6+0.897x7+0.871x8+0.899x9

y2=-0.315x1+0.163x2+0.322x3+0.863x4+0.596x5-0.2x6-0.274x7-0.064x8-0.154x9

4、对所选主成分做经济解释:第一主成分的线性组合中除了100元工业总产值实现利税和100元销售收入实现利税外,其余变量的系数相当所以第一主成分可以看成是x1,x2,x3,x6,x7,x8,x9的综合变量。可以解释为第一主成分反映了工业生产中投入的资金、劳动力所产生的效果,他是投入和产出之比。第一主成分所占信息总量为68.3%,在我国目前的工业企业中,经济效益首先反映在投入与产出之比上,其中固定资产所产生的经济效益更大一些。第二主成分是把工业生产中所得产量(即工业总产值和销售收入)与局部量(即利税)进行比较,反映了产出对国家所做的贡献。这样,在抓企业经济效益活动中,就应注重投入与产出之比和产出对国家所做的贡献,抓住了这两个方面,经济效益一定会提高

5、通常为了分析各样品在主成分所反映的经济意义方面的情况,还将标准化后的原始数据代入主成分表达式计算各样品的主成分得分 6.99 2.94 9.27 0.65 -1.21 -0.12 -5.01 0.47 -7.38 -0.89 -1.04 1.54 -4.00 -0.98 -2.58 0.84 17.45 1.67 9.78 -3.41 10.83 -2.21 0.18 -0.73 1.27 -0.63 -2.95 -1.52 2.44 -0.44 -2.55 0.12 0.88 -0.36 -0.11 0.47 4.51 -1.60

搜索更多关于: 多元统计分析课程设计 的文档
多元统计分析课程设计.doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
本文链接:https://www.diyifanwen.net/c724fh02tj60a6ri16zt6_2.html(转载请注明文章来源)
热门推荐
Copyright © 2012-2023 第一范文网 版权所有 免责声明 | 联系我们
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ:xxxxxx 邮箱:xxxxxx@qq.com
渝ICP备2023013149号
Top