问:95%的被试成绩低于哪个值? 解:(1)查正态表中较大部分低于0.95的对应的z值:
1.64<z<1.65, z≈1.645
(2)代入公式计算 z? 1.645?X?805?X?Xs?
得X?1.645?5?80?88.225
(3)答 95%的被试成绩低于88.225.
由于z分数存在正负数,又有小数,使得z分数在计算和解释实验结果、测验结果时有些不好理解,故将z分数转化为T分数,加一个常数以消除正负数,乘以一个常数以消除小数。 Y=m+k(z) Y为转化后的分数;m、k为常数。
T分数就是以平均数为50,标准差为10进行转换后的分数。T=50+10(z)。
第六章 数据间的相关
第一节 相关的变量
一、相关,是指变量之间存在着某种相互关系,统计上采用数量的方式对这种关系进行描述。 当两列变量有相关时,如果两变量变化的方向是一致的,它们的关系表现为正相关;
如果变量的变化方向是相反的,它们的关系表现为负相关。
散布图,是用来了解和表示两列变量之间相互关系的图,通过散布图上数据点的分布形态,可以确
定它们的关系是直线相关还是曲线相关。 部分的相关,是指散点图上的点不是落在一条直线上,而是散落在一条直线的两边,呈椭圆形。椭
圆形的短轴越短,显示相关程度越高;椭圆形的短轴越长,显示相关程度越低。
第二节 相关系数
一、相关系数,是用于表示相关性质和程度的指标。
积差相关系数,符号r。又称皮尔逊相关系数或称皮尔逊r。
等级相关系数,又称斯皮尔曼等级相关,符号rs。
第七章 推论统计
第一节 总体与样本
一、总体,研究对象的全部称为总体,总体是一个随机变量,常用X、Y表示。 样本,总体中抽出的部分称为样本。
二、误差主要有两种:
(1)是系统误差,系统误差是由于抽样不当造成的;
9
(2)是随机误差,也叫抽样误差,是在实验中随机出现的,是不可控制的因素造成的。
三、抽样方式:(1)简单随机抽样; (2)系统抽样; (3)分组抽样;
(4)分层抽样; (5)自愿报名被试
四、样本的标准差和方差的公式中采用了n-1的方式,n-1称为自由度,用df 表示。自由度是指在统
计推论时,能够独立变化的数据的数目。
第二节 样本分布
一、样本分布,从某一总体中有放回地随机抽取n相等的样本许多个,任何一个样本都可以计算出它的
样本平均数X。这样就得到许多个样本平均数,这些样本平均数在总体平均数上下波动,可以做出这些样本平均数的次数分布图。
统计量的样本分布, 样本分布是从总体中随机抽取许多n相等的样本,由这些样本各自的统计量
分别分别可以构成各个统计量的次数分布。 二、大样本和小样本的样本分布
样本的容量n≥30的样本,为大样本,接近于正态分布,服从正态分布;
样本的容量n<30的样本,为小样本,容量的变化对样本分布的影响较大,服从t分布。 样本容量n的大小决定着t分布曲线的不同形状。当n无限大时t分布与正态分布完全吻合; n越小t分布偏离正态分布的程度越大。t分布的极限是正态曲线。
三、根据标准误与样本大小的关系,平均数样本分布的标准误的计算公式为
SX?2?2n → SX??n → SX?Sn?1或SX?Sn
总体标准σ通常不知道,统计学上用样本标准差S代替,因样本标准差是总体标准差最好的估计值。
四、总体平均数的估计
在总体平均数未知时,利用样本分布,通过随机样本平均数就可以对总体平均数进行估计。 估计的方法有两种:点估计和区间估计。
点估计,是由随机样本的统计值去估计总体参数值。
点估计的可靠性是不知的,要满足无偏、有效、一致三个估计的标准。
区间估计,是利用一个区间去估计总体参数所落入的范围,并给出估计的可靠性。 区间估计最常用的的是.95置信区间、.99置信区间。.95、.99、称为置信度。
区间估计:若是大样本(n≥30),采用正态分布估计; 若是小样本(n<30),采用t分布进行估计。
当n≥30时,总体平均数μ有95%的可能性在X?1.96SX???X?1.96SX范围内 有99%的可能性在X?2.58SX???X?2.58SX范围内 例:已知全区测验数据为n=100 X=80 S=5
问:全区成绩的平均数有95%的可能性在哪个范围内?
10
—
解:(1)求标准误
SS5X?5
n?100?0. (2)求总体平均数μ95%的可能性在
X?1.96SX?80?1.96?0.5?80?0.98?79~81 (3)全区成绩的平均数有95%的可能性在79~81的范围内。
当n<30时,为小样本,服从t分布,要查t分布表,df(自由度)=n-1
计算:(1)先算 SSX?
n (2)求95%的可能性:??X?t.052(df)?SX
.05/1 单侧,查t分布表从下往上查;.05/2 双侧,查表从上往下查 例:已知n=16,X—
=80,S=5。求μ95%的可能性范围 解:(1)SS?5X?.25
n16?1 (2)df=n-1=16-1=15 (3)查t分布表 t.052(15)?2.131
(4)0.95的置信区间
??X?t.052(df)?SX?80?2.131?1.25=80±2.7
77.3≤μ≤82.7
(5)总体平均数95%的可能性在77.3 ~82.7的范围内 X男1?X女1?XD1 X男2?X女2?XD2
? ?
X男n?X女n?XDn X—
Dn构成样本平均数差异的分布
独立样本平均数差异分布的标准误: S21XD?SX1?S2SX2 SX1?n SX2?S21n
2相关样本平均数差异分布的标准误: S22XD?SX1?SX2?2rSX1SX2
独立样本来自于不同的被试群体 (组间设计)
11
相关样本来自于同一组被试的不同测试 (组内设计)
样本平均数的差值:XD?X1?X2 总体平均数的差值:?D??1??2
从样本平均数差异X—
D估计总体平均数差异μD : 1、 若n1、n2≥30时,为大样本,服从正态分布 ?D有95%的可能性在(XD?1.96SX)之内
D ?D有99%的可能性在(XD?2.58SX)之内
D ⑴ 若两样本为相关样本 S2XD?S2X1?SX2?2rSX1SX2
⑵ 若两样本为独立样本 SXD?S2X1?S2X2
SS1X1? SS2nX2? 1nXD?X1?X2 解题计算时倒推22、 若n1、n2<30,为小样本,服从t分布
?D有95%的可能性在(XD?t.052(df)SX)之内
D?D有99%的可能性在(XD?t.012(df)SX)之内
D⑴ 若两样本为独立样本 自由度 df=n1+n2-2
S22XD?SX1?SX2
⑵ 若两样本为相关样本 自由度 df=n-1 (n为相关样本人数) S22XD?SX1?SX2?2rSX1SX2
第三节 平均数差异的样本分布
书P87例题
解题:据题意:n__
__
1=9,X1=25,S1=5;n2=9,X2=16,S2=3 ⑴ 求 SX1 SX2 SX1?S1?5?1.67 SnX2?S2?3?1
19n29⑵ 求SXD
12
相关推荐: