方差分析
方差分析,Analysis of Variance(ANOVA),是一种用来对于两个以上等方差的正态总体均值之间的检验统计方法.方差分析的主要思想和理论是由费希尔提出的.
从定义来看,它是一种检验方法,是对水平之间差异化的一种论断.我们知道对一个问题的影响分析可以化为多个因素对这个问题的影响,而每一个因素的影响又是由多个水平具体影响的,每一个水平,由会因为随机差异影响最后的论断分析.正因为这样,才产生了第一类错误和第二类错误.错误来源于误差,同时来源于系统.
当深入接触到方差分析后,发现它和双正态分布的假设检验有很多的相似.双正态分布的假设检验问题主要是考虑两个正态分布之间的影响与作用.其实就是在考察这两个水平之间有没有明显的差异,如果没有,则期望相等,接受原假设,反之,则拒绝原假设.当然,这个过程主要的解决方案是构造一个合适的枢轴量,这个量,一般是由题目自身的未知量与可测量所确定的.比如知道了两个总体方差和两个样本均值,可构造U枢轴量服从标准正态分布进而确定差异的存在与否.又如知道了两个总体方差相等但不知道具体多少时,可以构造T分布确定差异存在性.总之,就是为了证明有没有差异!
在这一点上,方差分析同样具有相同的功效.因为它也是一种证明差异性的方法.但是虽然非常相近,但还是有差异!!方差分析重在方差!!它首先确定了三个基本假设,1.同一水平下样本的正态分布性.2.各个水平总体独立性.3.方差相等性.它是通过建立组内和组间的差异效果,进而确定以F为枢轴量的差异分析方法,更清楚地说,实际上是确定因素的影响是随机性大还是水平差异性大.组内差异的衡量在方差分析中被称做随机性方差,而组间则是水平之间的差异衡量.两者分别用SSA,SSE来表示.通过确定数值,来构造以SSE,SSA为两个X2分布,两者自由度相比的F分布,通过显著性水平来确定差异存在大小.
当涉及到双因素分析时,有必要和双正态分布联系起来.双因素方差分析中,需要进行两次假设检验,从而推断出两个影响分别产生的结果大小.当然这种分析的前提假设是无交互作用.唯一与双正态不同的是他们(双因素)的样本来源于一个大样本.而双正态来源与两个不同的样本,再分析.在我看来,双因素分析中更看中因素对于整个分析的影响,而假设检验更看中某一行为,或者动作是否有明显影响.就如比较新技术引进是否提高利润,那么用使用前后利润的样本进行假设检验就是最好.单如果是在分析到底不同颜色对于饮料销售量的影响就必须借助单因素方差分析,再面临颜色和销售地点的问题时,双因素分析就显得更方便一些.
再说到方差分析,如果此时去掉双因素方差分析的前提假设,即无交互作用时,当然这种情况是最符合实际情况的,那么显然,我们需要引进另一个量来确定这种交互作用的明显程度.这一点后续再说.
总之,假设检验与方差分析是紧密结合的,但是在不同的场合又有各自的优势,尤其是双正态分析与双因素分析,其中用法很值得推敲.
相关推荐: