①2?2列联表:列出的两个分类变量X和Y,它们的取值分别为{x,x}和{y,y}的样本频数表称
1212为2?2列联表1
分类 x1 x2 acy1 y2 总计 a?b b dc?d总计 a?cb?da?b?c?d 构造随机变量中n?a?b?c?d)
n(ad?bc)2K?(a?b)(c?d)(a?c)b?d)2(其
得到K的观察值k常与以下几个临界值加以
2比较: 如果
如果 如果
k?2.706,就有90的把握因为两分类
00变量X和Y是有关系;
k?3.841 就有95的把握因为两分类
00变量X和Y是有关系;
k?6.635 就有99的把握因为两分
00类变量X和Y是有关系;
如果低于k?2.706,就认为没有充分的证据
说明变量X和Y是有关系.
②三维柱形图:如果列联表1的三维柱形图如下图
由各小柱形表示的频数可见,对角线上的频数的积的差的绝对值
|ad?bc|较大,说明两分类变量X和Y是有关的,
否则的话是无关的.
重点:一方面考察对角线频数之差,更重要的一方面是提供了构造随机变量进行独立性检验的思路方法。
ac d b 图
③二维条形图(相应于上面的三维柱形图而画)
由深、浅染色的高可见两种情况下所占比
c例,由数据可知aa要比小得多,由于差距较?bc?d大,因此,说明两分类变量X和Y有关系的可能性较大,两个比值相差越大两分类变量X和Y有关的可能性也越的.否则是无关系的.
d
c
重点:通过图形以及所占比例直观地粗略地观察是否有关,更重要的一方面是提供了构造随机变量进行独立性检验的思想方法。 ④等高条形图(相应于上面的条形图而画) 由深、浅染色的高可见两种情况下的百分
图
b a
比;另一方面,数据
ag00a?bc要比c?g小得多,因此,说明两分类变d00量X和Y有关系的可能性较大, 否则是无关系的.
重点:直观地看出在两类分类变量频数相等的情况下,各部分所占的比例情况,是在图2的
图
cd b a
相关推荐: