学习必备 欢迎下载
P值的正确理解
P值是指在无效假设的前提下,得到观察到的量(或更极端的量)的概率。 P值越小说明无效假设越不可靠。或者说,P值越小就越有理由推翻无效假设。 至于P值是否属于“小”,一般根据事先确定的检验水准?来判断的。 P值的大小与观察到的量的大小之间没有必然的联系。 实际差别与统计学意义
? 统计学意义:如果总体均数相同,抽到这样大统计量的可能性很小,可以拒绝 H0。
但并不意味两总体均数差别很大。
? 样本量很大时,即使均数差别不大,统计学意义却显著。 ? 样本小时,即使均数差别很大,统计学意义却不显著。 u检验和t检验 两者比较:
u检验条件: 总体标准差已知,资料服从正态分布情况下(1)样本均数与总体均数比较(2)两大样本均数的比较;
t检验条件:用于样本量小、总体标准差未知时(1)样本与总体均数比较(2)配对设计资料比较(3)两样本均数比较(同时要求两样本的总体方差相同,服从正态分布) 配对资料:
配对设计:两样本中的观察值由于存在某种联系而一一对应结成对子(matching)的情况.
常用配对方式:
? 1、同一受试对象处理前后的比较:高血压治疗前后的血压值,或每一名病人有一
对数据;
? 2、同一对象身体不同部位测定值比较:如左右臂皮肤的敏感试验,测得红斑直径; ? 3、同一样品两种不同方法测定结果:两种仪器,两名化验员,两种条件等; ? 4、成对设计:动物配对后随机分到两组后的测定结果; 第六章 方差分析(一)
概念:方差分析是检验两个或两个以上样本均数间差别无统计意义的统计检验方法。 前提条件:各组总体均数为正态分布,方差齐。 方差分析的基本思想是:
将所有测量值间的总变异按照其变异的来源分解为多个部份,然后进行比较,评价由某种因素所引起的变异是否具有统计学意义。 方差分析主要用于:
1、均数差别的显著性检验 2、分离各有关因素并估计其对总变异的作用 3、分析因素间的交互作用,4、方差齐性检验。 优点:1、不受对比组数的限制; 2、可同时分析多个因素作用; 3、可分析因素间的相互作用; 4、灵敏度高; 5、结论较准确 均方:
变异程度除与离均差平方和的大小有关外,还与其自由度有关,由于各部分自由度不等,因此各部分离均差平方和不能直接比较,须将各部分离均差平方和除以相应自由度,其比值称为均方差,简称均方(mean square,MS)。
学习必备 欢迎下载
MS组内:组内均方,l组内/?组内 MS组间:组间均方, l组间/?组间 总变异(total variation):全部测量值Xij与总均数 间的差异 ?(xij-x)2,v=N-1=nk-1 组间变异( between group variation ):各组的均数Xi 与总均数间的差异 ? (xi-x n)2, v=k-1 组内变异(within group variation ):每组的每个测量值Xij与该组均数的差异?(xij-xi)2, v=k(n-1)
F值:F=MS组间/MS组内
F界值:F0.05(?1,?2) F? F0.05(?1,?2), p?0.05
公式是在H0成立的条件下进行的,即MS组间与MS组内差别应该很 小, F值应该接近于1。 均数间的相互比较
Student-Newman-Keuls(SNK-q 检验)法:适用于任意两组间进行比较 Dunnett-t 检验:适用于多个实验组与同一个对照组的比较
LSD-t 检验:称最小显著性差异t 检验,适用于对多组中某一对或几对在专业上有特殊意义的均数进行比较。
三种方法是一致的,但并非等价,实际应用中应根据设计选取,不可多种方法一起使用,然后选取有利的结果。 拉丁设计:
对于两个以上的标志进行方差分析,而且各种标志的水平数相同,采用拉丁方设计。其优点是可以从较少的实验数据,获取较多的信息。但设计要求各因素的水平数必须相等,在实际应用时有一定局限性。而且,当各因素间有交互作用时,该设计不合适。
拉丁方是以拉丁字母排列的方阵的简称。 方差齐性检验
多个方差齐性的Bartlett 法
此外,Levene 检验法对原数据是否为正态不灵敏,比较稳健,也常常采用。 方差分析中的数据转换: (1) 平方根转换
x′=? x 当x?10时, x′=? x +1 或x′=? x +1/2
常用于服从普哇松分布的资料(方差随均数而变;二项分布中方差随率变化) (2) 平方根反正弦转换
二项分布中率的比较, x′=arc sin ? x (3) 对数转换
对于均数与标准差呈正比关系的资料x′=lgx 或 x′=lg(x+1) (x?0) 方差分析(二)
当实验的处理是由两个或两个以上的因素,每个因素至少有两个水平的全面组合时,称之为析因实验。
一、2?2析因实验(factorial experiment)设计
两个因素,每个因素有两个水平的实验设计。
单独效应:是指其它因素的水平固定时,同一因素不同水平间的差别。 主效应:指某一因素各水平间的平均差别。
交互效应:某因素的各个单独效应随另一因素水平的变化而变化,且相互间的差别超出随机波动的范围时,称者两个因素间存在交互作用或效应。
如果AB两因素的联合效应不等于A与B的单独效应之和,则A,B存在交互效应,若大
学习必备 欢迎下载
于则有协同作用,若小于则为拮抗作用。 二、2×2×2析因设计
是指有三个因素,每个因素有两个水平的实验设计。 第七章 直线回归与相关
(1) 依存关系:应变量(dependent variable)Y随自变量(independent variable)X变
化而变化。 —— 回归分析
(2) 互依关系: 应变量Y与自变量 X间的彼此关系 ——— 相关分析 第一节 直线回归 ( linear regression 线性回归)
1.直线回归的概念:直线回归是分析两变量间线性依存变化的数量关系。 2. 函数关系与回归关系:前者是确定关系,后者是不确定关系 直线回归的任务:
就是找出一条最能描述变量间非确定性数量关系的一条直线,此直线为回归直线,相应的直线方程称为直线回归方程( linear regression equation)。 对资料的要求:
自变量 x :正态总体中的随机变量或指定变量 因变量 y :服从正态分布的随机变量
标准估计误差
各实际值Y与估计值 有一定的误差,称为估计误差。各实际点与回归线纵轴方向的离散程度,可以用类似求标准差的式子进行计算,即标准估计误差
a b的意义:
a 为回归直线在 y 轴上的截距,即与Y轴交点的纵坐标(X=0)。
b 为回归系数,即回归直线的斜率;其统计学意义是 x 增加(减)一个单 位,y 平均变动 b 个单位
b>0,Y随X的增大而增大(减少 而减少)—— 斜上; b<0,Y随X的增大而减小(减少 而增加)—— 斜下;
b=0,Y与X无直线关系 —— 水平。 |b|越大,表示Y随X变化越快,直线越陡峭。 3.直线回归方程参数的计算
?)的纵向最小二乘法原则 (least square method):使各实际散点(Y)到直线(Y?距离的平方和最小。即使??Y?Y?(残差或剩余值)最小
2残差(residual)或剩余值,即实测值Y与假定回归线上的估计值的纵向距离
Y?YY总情况(Y?Y)?)剩余部分(Y?Y??Y)回归部分(YX?Y?Y???Y?Y????Y??Y?
学习必备 欢迎下载
回归系数的检验方法: 方差分析法
SS回F?SS剩?回?剩=MS回;?回=1,?剩=n?2MS剩
SS总=?(Y?Y)2,Y的离均差平方和(total sum of squares), 未考虑X与Y的回归关系时Y的总变异。 ??n?1
?)2,为剩余平方和(residual sum of squares), SS剩=?(Y?YX对Y的线性影响之外的一切因素对Y的变异,即总变异中,
无法用X解释的部分。SS剩越小,回归效果越好。 ??n?2
??Y)2,为回归平方和(regression sum of squares), SS回=?(Y由于X与Y的直线关系而使Y变异减小的部分,即总变异中, 可以用X解释的部分。SS回越大,回归效果越好。 ??1
t检验法
| b -0 | bt = ————= ——,S b S b?= n -2S yx____________S b= ————————,_2??( x -x )
S b 为样本回归系数标准误;S yx 为剩余标准差
同一组资料作直线相关与回归时 tb 与 tr 等值 回归系数的标准误
S yx____________S b= ——————,_2??( x -x ) b为总体回归系数? 的估计值,其误差为Sb
决定系数:
回归平方和与总平方和之比,大小反映了回归贡献的相对程度,也就是在Y的总变异中回归关系所能解释的百分比。
总体回归线的95%置信带,即μ (x=xi)的可信区间
方差由Y 及 b (x - x)的方差两部分构成 个体Yi 值的范围预测
相关推荐: