Spss期末作业
关于我国城镇居民消费结构及趋势的数据分析
本次分析采用的数据来源于《中国统计年鉴—2011》,我选用的是其中的第十篇章—人民生活下的城镇居民家庭基本情况的相关数据,用以研究城镇居民消费结构及其趋势。 (附数据部分截图)
(A)下面是我对该数据做的相关分析。
表一给出的是基本的描述性统计图,表中显示各个变量的全部观测量的均值、标准差和观测值总数N,表2给出的是相关系数矩阵表,其中显示4个变量两两之间的pearson相关系数,以及关于相关关系等于零的假设的单侧显著性检验概率。
描述性统计量 食品 衣着 居住 家庭设备用品及服务 均值 2744.0660 775.8200 694.1920 488.2500 标准差 1802.80584 555.67616 565.48222 343.94006 N 5 5 5 5 表1 描述性统计表
相关性 食品 食品 Pearson 相关性 1 衣着 .998 **家庭设备用品及居住 .991 **服务 .995 **
显著性(单侧) 平方与叉积的和 协方差 N 衣着 Pearson 相关性 显著性(单侧) 平方与叉积的和 协方差 N 居住 Pearson 相关性 显著性(单侧) 平方与叉积的和 协方差 N 家庭设备用品及服务 Pearson 相关性 显著性(单侧) 平方与叉积的和 协方差 N **. 在 .01 水平(单侧)上显著相关。 1.300E7 3250108.892 5 .998 .000 4000739.197 1000184.799 5 .991 .001 4039135.855 1009783.964 5 .995 .000 2468266.142 617066.535 5 ******.000 4000739.197 1000184.799 5 1 .001 4039135.855 1009783.964 5 .985 .001 1238672.922 309668.230 5 1 **.000 2468266.142 617066.535 5 .994 .000 760246.419 190061.605 5 .996 .000 775005.410 193751.352 5 1 **** 1235103.975 308775.994 5 .985 .001 1238672.922 309668.230 5 .994 .000 760246.419 190061.605 5 **** 1279080.565 319770.141 5 .996 .000 775005.410 193751.352 5 ** 473179.063 118294.766 5 表2 相关系数矩阵
从表2中可以看出家庭设备用品及服务与食品、衣着之间相关系数分别为0.995、0.994,反映家庭设备用品及服务与食品、衣着之间存在显著的相关关系。说明食品与衣着对家庭设备用品及服务条件的好转有显著的作用,此外食品与衣着之间,食品与居住之间,居住与衣着之间的相关系数分别为0.998、0.991、0.985,这说明他们之间也存在着显著的相关关系。在这里还要提一下相关系数旁边的两个星号的意思,它表示显著性水平α为0.01时仍拒绝原假设,一个星号则表示显著性水平α为0.05时可拒绝原假设。因此,两个星号比一个星号拒绝原假设犯错误的可能性更小。
(B)下面是做的回归分析
表3给出了进入模型和被剔除的变量的信息。从表中我们可以看出所有3个自变量都进入模型,说明我们的解释变量都是显著并且是有解释力的。
表4给出了模型整体拟合效果的概述,模型的拟合优度系数为1.000,反映了因变量于自变量之间具有高度显著的线性关系。表里还显示了R平方以及经调整的R值估计标准误差
表5给出了方差分析表我们可以看到模型的设定检验F统计量的值为
411.727,显著性水平的P值为0.036。
表6给出了回归系数表和变量显著性检验的T值。我们发现变量“食品”的T值太小,没有达到显著性水平,因此我们要将这个变量剔除。从这里我们也可以看出模型虽然通过了设定检验,但很有可能不能通过变量的显著性检验。 输入/移去的变量 模型 1 输入的变量 居住, 衣着, 食品 a. 已输入所有请求的变量。 a移去的变量 方法 . 输入 表3 变量进入/剔除信息表 模型汇总 模型 1 R 1.000 aR 方 .999 调整 R 方 标准 估计的误差 .997 19.56464 a. 预测变量: (常量), 居住, 衣着, 食品。 表4 模型概述表 Anova 模型 1 回归 残差 总计 平方和 472796.288 382.775 473179.063 df 3 1 4 均方 157598.763 382.775 F 411.727 Sig. .036 ab a. 预测变量: (常量), 居住, 衣着, 食品。 b. 因变量: 家庭设备用品及服务 表5 方差分析表 系数 非标准化系数 模型 1 (常量) 食品 衣着 居住 B 86.022 -.160 .674 .458 标准 误差 42.902 .133 .349 .141 标准系数 试用版 t 2.005 -1.204 1.934 3.256 Sig. .295 .441 .304 .190 a -.838 1.090 .752 a. 因变量: 家庭设备用品及服务
表6 回归系数表 残差统计量 a 预测值 残差 标准 预测值 标准 残差 极小值 118.2242 -11.58816 -1.076 -.592 极大值 901.6300 7.57571 1.202 .387 均值 488.2500 .00000 .000 .000 标准 偏差 343.80092 9.78232 1.000 .500 N 5 5 5 5 a. 因变量: 家庭设备用品及服务 表7 残差统计表
表7给出了残差分析表,表中显示了预测值、残差、标准化预测值、标准化残差的最小值、最大值、均值、标准偏差及样本容量等数据。根据概率的3西格玛原则,标准化残差的绝对值最大为0.387,小于3,说明样本数据中没有奇异值。
表8 残差分布直方图
表8给出了模型的直方图。由于我们在模型中始终假设残差服从正态分布,因此我们可以从这张图中直观地看出回归后的实际残差是否符合我们的假设。从回归残差的直方图与附于图上的正态分布曲线相比较,可以认为残差的分布不是明显地服从正态分布。尽管这样也不能盲目的否定残差服从正态分布的假设,因为我们用了进行分析的样本太小,样本容量仅为5。 (C)spss参数检验分析(单样本t检验)
相关推荐: