SA??ni(yi??y)2
i?1k(25.12)
将表示总差异的平方和进行分解:
ST???(yij?y)???(yij?yi??yi??y)22i?1j?1knii?1j?1kknikni???(yij?yi?)???(yi??y)?2??(yij?yi?)(yi??y)22i?1j?1knii?1j?1ki?1j?1nikni (25.13)
???(yij?yi?)??ni(yi??y)22i?1j?1i?1?Se?SA其中
?(yj?1niij?yi?)?0。证明了:总的差异=组内差异+组间差异。由于
11?2?(yj?1niij?yi?)?2?2?(?j?1niij??i?)2~?2(ni?1)
(25.14)
又由?2分布的可加性可知
?1????2i?1??2Sekk?2(yij?yi?)??~?(?(ni?1))??2(n?k) ?j?1i?1?ni2(25.15)
还可证明,在H0为真时,即各组效应ai都为0
SA?因此可采用统计量
2~?2(k?1)
(25.16)
F?来假设检验。
SA/(k?1)~F(k?1,n?k)
Se/(n?k)(25.17)
三、 多重比较
当k组均值比较,如果经过F检验拒绝原假设,表明因素A是显著的,即k个水平对应的指标均值不全相等,但不一定两两之间都有差异。在一些实际问题中,当方差分析的结论是因素A显著时,还需要我们进一步去确认哪些水平间是确有差异的,哪些水平间无显著差异。同时比较任意两个水平均值间有无显著性差异的问题称为多重比较,即要以显著性水平
?,同时检验以下Ck2个假设:
上海财经大学经济信息管理系IS/SHUFE
Page 5 of 30
ijH0:?i??ji?j,i,j?1,2,?,k
(25.18)
均值间的多重比较的方法从形式上可分为几类:临界值相对固定的两两比较、临界值不
固定的多级检验、全部处理组均值与一个对照组均值比较。每一种类型中,根据所控制误差的类型和大小不同,又有许多不同的具体方法。如T(成组比较t检验法)、Bon(Bonforroni t检验法)、Dunnett(与对照组均数比较)、SNK(Student-Newman-Keuls或称q检验法)、Tukey(学生化极差HSD或称最大显著差)、Duncan(新多极差检验法)、LSD(最小显著差)、SIDAK(Sidak不等式进行校正t检验法)、SCHEFFE(Scheffe的多重对比检验)、Waller-Duncan(k比率t检验)、GT2或SMM(学生化最大模数和Sidak不等式进行校正t检验法)、REGWF(多重F检验)、REGWQ(多重极差检验)。
在多重比较时,选用什么样的检验方法,首先要注意每种方法适用的试验设计条件,其次要关心所要控制的误差类型和大小。例如,某因素有10个水平,若采用通常的t检验进行
2多重比较,共需要比较的次数为C10?45次,即使每次比较时都把第一类错误?控制在0.05
水平上,但经过45次多重比较后,犯第一类错误的概率上升到:1?(1?0.05)45?0.90。从中我们可以看到选用t检验法进行多重比较,仅仅控制了每次比较的显著水平,但却大大增加了整体的显著水平。
下面是所要控制的几种误差类型和选用的检验方法: ? 第一类误差率——即犯第一类错误的概率?。 ? 比较误差率——即每一次单独比较时,所犯第一类错误的概率。可使用T法、LSD
法、DUNCAN法。
? 试验误差率——即完成全部比较后,整体所犯第一类错误的概率。
? 完全无效假设下的试验误差率——即在H0假设完全无效下的试验误差率。可使用
SNK法。
? 部分无效假设下的试验误差率——即在H0假设部分无效下的试验误差率。 ? 最大试验误差率——即在在H0假设完全或部分无效下,完成全部比较后所犯第一类错误的最大概率。可使用BON法、SIDAK法、SCHEFFE法、TUKEY法、GT2/SMM
法、GABRIEL法、REGWQ法、REGWF法、DUNNETT法。
1) T检验和Bonforroni检验
当因素有k个水平时,对任意两个水平均值间的差异的显著性检验,可用 t统计量
tij?yi??yj??Se??1?1??n?k??ninj?~t(n?k)
(25.19)
2两两比较的次数共有m?Ck=k(k?1)/2,因此,共有m个置信水平,每次比较的显著水平:
T检验的方法取?。完成所有比较后的整体显著水平等于
1?(1??)m
(25.21)
当比较次数m越大,试验误差就越大。而Bonforroni检验的方法取?/m。完成所有比较后
上海财经大学经济信息管理系IS/SHUFE
Page 6 of 30
的整体显著水平等于
1?(1??/m)m??
(25.22)
即最大试验误差率小于?。 2) LSD检验
既可以通过两两比较的显著水平的特定限制来控制最终的试验误差率,也可以通过两两比较的绝对差异界限来判别显著性。最容易想到的这个界限就是在两两比较中采用的t检验法而得到Fisher最小显著差(LSD)为
Se?11??LSDij?t?(n?k)??
?n?k?ninj?2?当yi??yj??LSDij时,则P??。
(25.23)
3) SNK检验和Duncan检验
SNK法和Duncan法都属于多级检验法中的一种,使用多级检验可以获得同时检验的更高效率。多级检验分为步长增加法和步长减少法,SAS系统采用步长减少法。当因素有k个水平时,即有k个均值需要比较,检验步骤为:
① 将均值由大到小排队,即y1??y2??,?,?yk?。
② 比较y1?与yk?是否有显著差异。此时跨度a?k。若两者之间无显著差异,说明
其他均值之差比它小的任何两个水平均值之间的差别也无显著性,所以停止一切比较;反之,则继续进行下一步。
③ 比较y1?与yk?1?,比较y2?与yk?是否有显著差异。此时这2个比较的跨度
a?k?1。若两者之间的比较无显著差异,则停止一切比较。如果每一步都有不
满足停止比较的对比组存在,最后应到达跨度为2的所有需要比较的相邻两水平均值间都作完比较时为止。
多级检验在作每一级比较时,通过控制比较误差率?a的显著水平来实现其最终要控制的试验误差率。要注意的是?a在每一级比较时可能是不同的,它是跨度a和整体试验误差率?的函数,即?a?f(a,?)。另外,要注意的是?a其实就是每一级比较时特定统计量分布的显著水平。常用的两种方法是SNK检验和Duncan检验。它们的检验统计量为q(也称学生化极差统计量),如下
qij?yi??yj??Se??1?1??2(n?k)??ninj?~q(a,n?k)
(25.24)
其中a是yi?和yj?之间的跨度值,q分布的自由度是a和n?k,显著水平为?a。SNK检验和Duncan检验的区别主要在于?a取值
上海财经大学经济信息管理系IS/SHUFE
Page 7 of 30
? SNK检验:?a??。注意,当比较次数很大时,最大试验误差率将趋向于1。 ? Duncan检验:?a?1?(1??)a?1。
四、 随机单位组设计的方差分析
随机单位组设计(randomized block design)又称随机区组设计或随机配伍组设计,它是两样本配对试验的扩大。欲比较因素A中的k个水平的各个均值,试验设计时,先将受试对象按性质相同或相近者组成单位组,每个单位组有k个受试对象,分别随机分配到因素A的k个水平上。这时每个水平的受试对象,不仅数量相同,而且性质也相同或相近,就能缩小误差,提高试验效率。这样的设计可将单位组看作一个因素,就成为两个因素的设计(因素与单位组),由于两个因素的各水平仅仅交叉1次,所以重复数为1,在这样的意义下,随机单位组设计可看作为两因素重复数为1的设计,一般这种设计不考虑交互影响。
设有因素A具有k个水平,受试对象按性质相同或相近者分成b个单位组,每个单位组有k个受试对象,分别随机分配到因素A的k个水平上。那么,随机单位组设计的方差分析表见表25.2所示:
表25.2 方差分析表形式
变异来源 source 因素A 单位组 误差Se 总变异ST 离差平方和 SS SSA SS单 SSe 自由度 df 均方 MS MSA= SSA/( k-1) MS单= SS单/( b-1) F统计量 F FA= MSA/ MSe F单= MS单/ MSe P概率值 P PA P单 PT k-1 b-1 bk-k-b+1 MSe= SSe/( bk-k-b+1) MST= SST/( bk-1) FT= MST/ MSe SST= SSA+ SS单+SSe bk-1
五、 析因设计的方差分析
析因设计(factorial design)是一种多因的设计。各因素在试验中所处的地位基本平等,而且因素之间存在一级(即2个因素之间)、二级(即3个因素之间)乃至更复杂的交互作用。例如,两个因素时,第1个因素有3个水平,第2个因素有2个水平,全部水平组合共有3×2=6种组合,每种组合都作试验时就是析因试验设计,也可称为3×2析因试验设计。同样3×4×2析因试验设计,则代表3个因素,分别有3,4,2个水平,全部试验后的水平组合为3×4×2=24种。在每一种组合下,适当重复几次,称为重复数。重复数可以不相等,一般地说,重复数相等时,效率最高。
析因设计能够检验每个因素的各水平间主要变量的平均值的统计差异,也能检验因素间的交互影响。当存在交互影响时,表示一个因素各水平间的差异会随着另一个因素的水平改变而不同;当不存在交互影响时,则各个因素独立,即一个因素的水平改变时不影响另一个因素的各个水平之效应。析因设计的方差分析因为能研究交互影响,所以能提供较多信息。但是,当有较高级(二级以上)的交互影响时,由于涉及多个因素,各有多个水平,情况将错综复杂,可能会引起解释上的困难。
析因设计的方差分析同样是从数据差异的总平方和开始分解。例如,对于A×B双因素方差分析,这个总差异能分解成:A因素的各个水平之间的差异,B因素的各个水平之间的差
上海财经大学经济信息管理系IS/SHUFE
Page 8 of 30
相关推荐: