2) contrast语句。
提供一种获得一般假设检验的技巧。其中,效应可以是截距,用字符intercept表示。通过规定L向量或M矩阵来构造一元假设检验L??0或多元假设检验L?M?0。例如,当发现某两个因素的交互作用项有显著性时,我们可用本语句来实现一个因素被控制在某水平上,对另一个因素的各水平间进行两两比较的目的。
设M因素有三个水平a、b、c,V因素有两个水平1、2,且M?V有显著性。如果我们要比较
?a?(?b??c)
的差异,那么有几种不同的比较方法:
① 在因素V的每一个水平上,分别比较因素M的三个水平a、b、c均值的之间的线
性关系假设是否显著。也即
12H0:?a1?0.5?b1?0.5?c1?0和H0:?a2?0.5?b2?0.5?c2?0。
② 在因素V平均的所有水平上,比较因素M的三个水平a、b、c均值的之间的线性
关系假设是否显著。也即
H0:0.5(?a1?0.5?b1?0.5?c1)?0.5(?a2?0.5?b2?0.5?c2)?0。
③ 在因素V平均的子集上,比较因素M的三个水平a、b、c均值的之间的线性关系
假设是否显著。也即
H0:(?a1?0.5?b1?0.5?c1)?(?a2?0.5?b2?0.5?c2)?0
glm模型为双因素试验设计的方差分析指定了下面的效应公式
?ij????i??j?(??)ij
(25.25)
其中?ij是因素Mi水平与因素Vj水平在ij单元上所有观察值的平均。?为总平均。?i是因素M在i水平上的主效应,?j是因素V在j水平上的主效应,(??)ij为因素M和因素V在ij水平上的交互效应。因此,对任一观察值有
yijk??ij??ijk????i??i?(??)ij??ijk (25.26)
因此,根据单元均值给出的线性组合可以转换成效应模型的合并参数形式,即L??0,如
?a1?0.5?b1?0.5?c1????a??1?(??)a1?0.5??0.5?b?0.5?1?0.5(??)b1 ?0.5??0.5?c?0.5?1?0.5(??)c1??a?0.5?b?0.5?c?(??)a1?0.5(??)b1?0.5(??)c1同理
?a2?0.5?b2?0.5?c2??a?0.5?b?0.5?c?(??)a2?0.5(??)b2?0.5(??)c2
上海财经大学经济信息管理系IS/SHUFE
Page 13 of 30
相应的glm过程的语句为
proc glm ;
class M V ; model Y=M V M*V;
contrast ‘a vs b,c in v1’M 1 -0.5 -0.5 M*V 1 0 -0.5 0 -0.5 0; contrast ‘a vs b,c in v1’M 1 -0.5 -0.5 M*V 0 1 0 -0.5 0 -0.5; run ;
Contrast语句中的可选项: e——打印整个L向量。
e=效应——规定模型中的某个效应作为误差项。过程将把这一效应作为单变量F检验的分母。如果缺省,过程把均方误差(MSE)作为误差项。
etype=n——指明e=效应的类型(1、2、3、4)。如果指明e=而没有指明etype=,则使用最高类型。
3) Estimate语句
可用来估计参数的线性函数,通过用参数的估计b乘以向量L来得到Lb。其中
b?(X?X)?X?Y。Estimate语句的使用格式同contrast语句。
estimate语句中的可选项: e——打印整个L向量。
divisor=数字——为简便地输入效应的系数而规定的一个值,用该值除以所有系数使得分数系数可以作为整数输入。例如
estimate ‘1/3(a+b)-2/3c’ M 1 1 -2 /divisor=3; 可替代
estimate ‘1/3(a+b)-2/3c’ M 0.33333 0.33333 -0.66667; 4) Lsmeans语句
计算列在语句中的每一效应的最小二乘均值(LSM)。最小二乘均值估计是针对非均衡数据设计的,而类和子类的算术平均值是针对均衡数据设计的。
lsmeans语句中的可选项:
cov——在选项out=指明的输出数据集中输出协方差。 e——打印用以计算最小二乘均值的可估函数。 e=效应——规定模型中的某个效应作为误差项。 etype=n——指明e=效应的类型(1、2、3、4)。
out=输出数据集名——产生一个包含LSM值、标准差及协方差的输出数据集。
pdiff——打印假设检验H0:LSM(i)?LSM(j)的所有可能的概率值。 stderr——打印LSM的标准差和H0:LSM?0的概率值。
tdiff——打印假设检验H0:LSM(i)?LSM(j)的t值和相应的概率值。
pdiff=all/control/conroll/controlu——打印最小二乘均值之差的概率值。
adjust=bon/dunnett/scheffe/sidak/smm/gt2/tukey/t——要求多重比较对最小二乘均值之差的概率值和置信限进行调整。缺省值为t。
slice=效应——通过规定的这个效应来分开交叉的LSM效应。例如,假定交叉项A*B是显著的,如果想对B的每个效应检验A的效应,使用下面语句:
上海财经大学经济信息管理系IS/SHUFE
Page 14 of 30
lsmeans A*B /slice=B;
八、 实例分析
1. 单因素试验设计的均值比较
例25.1 考虑在5种不同品牌的人工合成胶合板材料上进行磨损时间测试,每种品牌的材料做四次试验,且都是采用的同一种磨损措施,所有的试验都是在完全随机的顺序下在相同的机器上完成的。
程序如下:
data study.veneer;
input brand $ wear @@; cards;
ACME 2.3 ACME 2.1 ACME 2.4 ACME 2.5 CHAMP 2.2 CHAMP 2.3 CHAMP 2.4 CHAMP 2.6 AJAX 2.2 AJAX 2.0 AJAX 1.9 AJAX 2.1 TUFFY 2.4 TUFFY 2.7 TUFFY 2.6 TUFFY 2.7 XTRA 2.3 XTRA 2.5 XTRA 2.3 XTRA 2.4 ;
proc anova data=study.veneer;
class brand; model wear=brand; means brand;
means brand /hovtest;
run;
程序说明:因为数据仅仅是按照brand值分类,所以在class语句中这是仅有的一个变量。变量wear是被分析的因变量,故wear出现在model语句等号的左边。在方差分析表中,除了总方差和误差外,方差的来源仅仅是由于各种不同brand值的变异造成的,因此brand出现在model语句等号的右边。Means语句计算主效应brand不同水平所对应的因变量均值,选项hovtest计算不同品牌组方差齐性的假设检验。
输出的结果见表25.4所示:
上海财经大学经济信息管理系IS/SHUFE
Page 15 of 30
The SAS System Analysis of Variance Procedure Class Level Information Class Levels Values BRAND 5 ACME AJAX CHAMP TUFFY XTRA Number of observations in data set = 20 Analysis of Variance Procedure Dependent Variable: WEAR Source DF Sum of Squares Mean Square F Value Pr > F Model 4 0.61700000 0.15425000 7.40 0.0017 Error 15 0.31250000 0.02083333 Corrected Total 19 0.92950000 R-Square C.V. Root MSE WEAR Mean 0.663798 6.155120 0.14433757 2.34500000 Source DF Anova SS Mean Square F Value Pr > F BRAND 4 0.61700000 0.15425000 7.40 0.0017 Levene's Test for Equality of WEAR Variance ANOVA of Squared Deviations from Group Means Sum of Mean Source DF Squares Square F Value Pr > F BRAND 4 0.000659 0.000165 0.5310 0.7149 Error 15 0.00466 0.00031 Analysis of Variance Procedure 表25.4 单因素设计的方差分析结果
结果分析:anova过程总是输出两个基本的方差分析表。一个是总体模型的方差分析表,一个是包含模型中各个变量的方差分析。首先输出class语句中规定的每个变量(brand)、分类变量的取值数(5)、具体取值(ACME AJAX CHAMP TUFFY XTRA)以及数据集中的观察个数(20)。
接着anova过程对model语句中每个因变量输出方差分析表。包括:因变量的总平方和(0.9295)、属于模型部分的平方和(0.6170)、属于误差部分的平方和(0.3125)、自由度DF(4、5、19)、模型的均方MS(0.15425=0.617/4)、误差的均方MSE(0.02083333=0.3125/15)、模型的F值(7.40=0.15425000/0.02083333)、分布大于7.40的概率(0.0017)、R2(0.663798=0.617/0.9295)、变异系数CV(6.155120=100×0.0208333、因变量的/2.345)标准差(0.14433757=0.0208333)、因变量均值(2.345)。
对模型中的每个效应,anova过程还输出方差分析表。brand自由度DF(4)、平方和(0.617)、
上海财经大学经济信息管理系IS/SHUFE
Page 16 of 30
相关推荐: