第一范文网 - 专业文章范例文档资料分享平台

方差分析

来源:用户分享 时间:2025/5/22 3:30:23 本文由loading 分享 下载这篇文档手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:xxxxxxx或QQ:xxxxxx 处理(尽可能给您提供完整文档),感谢您的支持与谅解。

即总的变异可以分解为实验处理变异、区组变异和残差。同完全随机设计相同的是,F检验的分子是实验处理的均方,分母是残差的均方。随机区组设计与完全随机设计的区别就在于把区组效应(Block Effect)从误差项中剥离出来。这种方法会虽然会消耗误差自由度,但就把一部分变异变得可解释。因此误差变异就会变小,F检验就更容易得到显著的结果。回到最初说的一句话:Undetermined并不等于random。使用了随机区组设计之后,一些本来我们认为是随机的误差,就成为了区组效应。这其实就增大的实验的Power。因为你不能确定的东西越少,对自己的结论就更有信心,做出同样的处理也就能得到更显著的效果。

今天先提到这里。下次从随机区组设计的附加假设Sphericity和Additive入手,捎带讲当这两个假设不能满足时的解决方法。

插曲Jason Mraz的I am yours.

方差分析简介(七)

随机区组设计(RB-p)比起完全随机设计(CR-p)有着诸多优点,其中最大的优点是把区组变异从误差变异中剥离出来,增强的实验的控制水平。然而,随机区组设计的基本假设更加严格。其中一条是Sphericity,翻译过来就叫球形假设吧。完整的陈述是,对于所有可能的配对组,要求组间差异的方差齐性。在SPSS里那个检验叫Mauchly。看上去跟方差同质性检验Levene差不多,也是用F检验,只要不显著就没事了。如果显著的话,后果很严重。如果说Sphericity不能保证的话,α会受到很大影响。当然实际数据是什么样就是什么样,我们不能说结果出来再动数据。这里提一下老美做行为研究的一些死规矩。比如说在中国做心理学实验,被试要多少给多少,结果不显著就往上使劲加,做30个人不够就再加30个人。到写论文的时候就直接写招了60人。老美这边要先过IRB,就是传说中的伦理审核委员会的审查。在给IRB的申请中,要明确写清研究所需要的被试数,然后每招募使用一名被试,都要严格受到IRB的控制。再加上篡改数据这种事确实也没什么人敢做。所以如果数据不好,只能在统计上做补救了。比较常用的一个办法是用Greenhouse-Geisser法来调整自由度,这种方式会消耗一些Power,但可以保住α。在SPSS的Repeated Measures的统计结果中第一行是Sphericity满足的情况下的结果,第二行就是用Greenhouse-Geisser调整自由度之后的结果,如果报告Greenhouse-Geisser的结果的话,自由度该是多少就多少。如图所示:

Tests of Within-Subjects Effects Measure:MEASURE_1 Type III Sum of Source altim Squares Sphericity Assumed 49.000 Greenhouse-Geisser 49.000 Huynh-Feldt Lower-bound 49.000 49.000 df 3 1.859 2.503 1.000 21 13.010 17.520 7.000 Mean Square 16.333 26.365 19.578 49.000 1.405 2.268 1.684 4.214 F 11.627 11.627 11.627 11.627 Sig. .000 .001 .000 .011 Error(altim) Sphericity Assumed 29.500 Greenhouse-Geisser 29.500 Huynh-Feldt Lower-bound

29.500 29.500 另外一种方式就是做多因素方差分析MANOVA。MANOVA的假设中不要求Sphericity。

RB-p的第二条重要假设是Additive,翻译过来大概叫可加性吧。即实验处理效应与区组效应不存在交互作用。换句话说就是实验处理效应与区组效应相互独立,线性可加。如果满足当然好,不满足呢?依然有两种方法可以退而求其次。一是用二因素完全随机实验设计(Completedly Randomized Factor Design,CRF-pq)。把实验处理和区组效应看成两个自变量因素来分析,这种情况适用于二者相关系数r<0.4,并且数据类型属于分类变量时适合使用。二是用协方差分析(ANCOVA)。把区组效应看成实验的一个协变量(Covariable),这种情况适用于二者相关系数r>0.6,连续变量并且两者方差处于线性关系。

在重复测量(Repeated Measures)的随机区组设计(RB-p)中,一个很大的影响因素就是顺序效应(Carryover)。顺序效应大致分两类,一类是各个过程之间对称的相互影响。我们常说的有练习效应(Practice Effect)和疲劳效应(Fatigue Effect)。比如说做反应时的实验,由于重复同一个实验过程,有的被试会对实验越来越熟悉进而反应速度越来越快;同样,也有的被试会因为实验时间的增长而反应速度越来越慢,比如分心走神、打哈欠什么的。另一类是前者对后者不对称的影响。好比说我们先吃水果然后喝果汁,最后喝茶,我们可能对果汁的感受由于先吃水果的影响而发生改变,喝果汁又对喝茶的口味产生某种影响。为了消除这种顺序效应的影响,科学家想到了Carryover Design(CO-p)。就是对不同实验处理进行拉丁方平衡设计(Latin-Square)。我们在书上可能学过拉丁方设计。但之前讲得太基础。好比说一个4水平的重复测量随机设计,很容易想到如下的拉丁方: B1 B2 B3 B4

其中A是不同实验处理,B是不同区组。这样一种拉丁方设计可以消除疲劳效应和练习效应,但又说不清例如A对B的单向不对称的影响,因为A总是在B前面做。因此最好使用Digram拉丁方设计(实在没学过这个东西不知道怎么翻译): B1 B2 B3 B4 A1 A B C D A2 B D A C A3 C A D B A4 D C B A A1 A B C D A2 B C D A A3 C D A B A4 D A B C 在这个拉丁方设计中,我们可以发现,各种实验处理出现的顺序均被有效平衡。使用Digram拉丁方设计后,我们就可以从残差中进一步分解出顺序效应的影响。

即总的变异可以分解为实验处理变异、区组变异、时序变异和残差。我们可以发现,CO-p与RB-p的区别就在于CO-p把时间顺序的变异从RB-p的残差中再次剥离出来,进而让实验控制可以解释的变异进一步增大,无法确定变异来源的变异进一步减小。换句话说就是用更复杂的实验设计换取更精确的控制。

CO-p设计的方差分析仅仅用SPSS是不足够实现的,要配合Excel的使用。具体来说是这样:在SPSS中使用Repeated Measures先将实验处理作为自变量运行一次,确定实验处理变异、区组变异和残差。第二次再将时序作为自变量运行一次,确定时序变异的大小和自由度,再从原来残差中减去时序变异作为CO-p的残差作为误差项,同时调整自由度。我可以列个变异来源表来举例说明算法,我们假设实验处理有三个水平,然后有三种时序,15个被试的CO-p设计。 变异来源 总变异 实验处理 区组 时序 残差

使用CO-p设计后,对实验处理的F检验就变成了F(2,26)=110.77,p<0.001;而如果仅仅使用RB-p,其F检验实为F(2,28)=32.419,p<0.001。显然CO-p有着更高的Power。

那么CR-p,RB-p和CO-p哪种设计的效率最高呢?也不一定用最复杂的设计就最好。

平方和 14331.3 8040 2819.3 2528.4 943.6 自由度 44 2 14 2 26 均方 325.7114 4020 201.3786 1264.2 36.29231 F 110.77 3.94 p 0.000 0.031

方差分析简介(八)2011-04-22 13:19 | (分类:默认分类) 单因素实验设计的方差分析弄明白了,多因素的就不在话下。当然,这里的多因素还是局限在一般线性模型(General Linear Model)之下,更复杂的模型比如层次线性模型(Hieratical Linear Model)仅仅通过方差分析解决不了问题。当因素多了以后,就要产生因素与因素之间的交互作用。这样,变异的分解就更加复杂一些。这里我以二因素混合设计(Split File Factorial, SPF-pq)和三因素完全随机设计(CRF-pqr)为例简单讲一下在变异分解中所要注意的问题和结果分析的要素。

我先举一个二因素设计的例子。说想了解加工方式和间隔时间对GRE单词学习的影响。随机找18个心理系大三学生。单词加工水平有三种方式,分为呈现单词辅助读音,如Abandon,放弃,显示中英文的同时自动朗读一遍;呈现单词并中文呈现其语源,如Tortuous,告知这个词来自荷马史诗里的米诺陶迷宫;以及呈现单词并呈现中文“激情联想”记忆,如Asparagus,辅助“一次拔了根吃”。遗忘时间,即学习与测试的间隔,分为三个水平,立即测试、间隔1分钟测试,和间隔10分钟测试。测试方式为再认(recognition),给出英文要求从四个选项中选择中文含义。设计多项式检验。大家可以顺带思考一下线性关系和二次关系的本质,线性关系的本质就是3和1有显著差别,二次关系的本质就是2和1-3的均值有显著差别。 线性关系 二次关系

加工水平为组内变量,测试时间为组间变量。那么分3组,每组6个人,每个人采集3组数据点,一共54个数据点。变异分解见下表。

变异来源 总的变异 组间变异 时间间隔 时间间隔残差 组内变异 加工方式 时间间隔×加工方式 v/d 0min 1min 10min 朗读辅助 语源辅助 激情联想 D1+D2/2 9.40 2.52 7.67 5.72 3.23 6.75 5.43 4.15 4.65 7.42 3.34 6.16 D1-D2 3.97 -1.63 3.02 Df 53 17 2 15 36 2 4 SS MS f 11.625 p 0.000 0.000 1 -1 -1 2 0 2 3 1 -1 158.259 79.13 160.500 10.70 31.815 15.907 11.832 62.519 15.63 40.33 1.344 加工方式×时间间隔残差 30

搜索更多关于: 方差分析 的文档
方差分析.doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
本文链接:https://www.diyifanwen.net/c8au5t1hdnq9kfa251dv8_5.html(转载请注明文章来源)
热门推荐
Copyright © 2012-2023 第一范文网 版权所有 免责声明 | 联系我们
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ:xxxxxx 邮箱:xxxxxx@qq.com
渝ICP备2023013149号
Top