第三章 统计案例
§3.1 独立性检验(1)
1. 某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515个成年人,其中吸烟者220人,
不吸烟者295人.调查结果是:吸烟的220人中有37人患呼吸道疾病(简称患病),183人未患呼吸道疾病(简称未患病);不吸烟的295人中有21人患病,274人未患病.
问题:根据这些数据能否断定“患呼吸道疾病与吸烟有关”?
为了研究这个问题,(1)引导学生将上述数据用下表来表示:
吸烟 不吸烟 合计 一.建构数学 1.独立性检验:
(1)假设H0:患病与吸烟没有关系.
若将表中“观测值”用字母表示,则得下表:
吸烟 不吸烟 合计 患病 未患病 合计 患病 37 21 58 未患病 183 274 457 合计 220 295 515 a c a?c b d b?d a?b c?d a?b?c?d 如果实际观测值与假设求得的估计值相差不大,就可以认为所给数据(观测值)不能否定假设H0.否则,应认为假设H0不能接受,即可作出与假设H0相反的结论. (2)卡方统计量:
为了消除样本对上式的影响,通常用卡方统计量(χ2?卡方χ2统计量公式:
?(观测值?预期值)2预期值)来进行估计.
n?ad?bc?χ2?(其中n?a?b?c?d)
a?bc?da?cb?d????????由此若H0成立,即患病与吸烟没有关系,则χ2的值应该很小.把a?37,b?183,c?21,dχ2?11.8634,统计学中有明确的结论,在H0成立的情况下,随机事件“?发生的概率约为0.01,即P(?222?274代入计算得
?6.635”
?6.635)?0.01,也就是说,在H0成立的情况下,对统计量χ2进行多次观测,
观测值超过6.635的频率约为0.01.由此,我们有99%的把握认为H0不成立,即有99%的把握认为“患病与吸烟有关系”.
象以上这种用?统计量研究吸烟与患呼吸道疾病是否有关等问题的方法称为独立性检验.
22.独立性检验的一般步骤:
一般地,对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值:类患呼吸道疾病与不患呼吸道疾病),得到如下表所示:
Ⅰ 类1 Ⅱ 类2 合计 A和类B(如吸烟与不吸烟),Ⅱ也有两类取值:类1和类2(如
A 类B 类合计 a c a?c b d b?d a?b c?d a?b?c?d 推断“Ⅰ和Ⅱ有关系”的步骤为:
第一步,提出假设H0:两个分类变量Ⅰ和Ⅱ没有关系; 第二步,根据2×2列联表和公式计算χ2统计量; 第三步,查对课本中临界值表,作出判断. 3.独立性检验与反证法:
反证法原理:在一个已知假设下,如果推出一个矛盾,就证明了这个假设不成立;
独立性检验(假设检验)原理:在一个已知假设下,如果一个与该假设矛盾的小概率事件发生,就推断这个假设不成立. 四.数学运用 1.例题:
例1.在500人身上试验某种血清预防感冒的作用,把他们一年中的感冒记录与另外500名未用血清的人的感冒记录作比较,结果如表所示.问:该种血清能否起到预防感冒的作用?
使用血清 未使用血清 合计 未感冒 258 216 474 感冒 242 284 526 合计 500 500 1000 分析:在使用该种血清的人中,有
242284?48.4%的人患过感冒;在没有使用该种血清的人中,有?56.8%的500500人患过感冒,使用过血清的人与没有使用过血清的人的患病率相差较大.从直观上来看,使用过血清的人与没有使用过血清的人的患感冒的可能性存在差异.
解:提出假设H0:感冒与是否使用该种血清没有关系.由列联表中的数据,求得
1000?(258?284?242?216)2???7.075
474?526?500?5002∵当H0成立时,?2?6.635的概率约为0.01,∴我们有99%的把握认为:该种血清能起到预防感冒的作用.
例2.为研究不同的给药方式(口服或注射)和药的效果(有效与无效)是否有关,进行了相应的抽样调查,调查结果如表所示.根据所选择的193个病人的数据,能否作出药的效果与给药方式有关的结论?
口服 注射 合计 有效 58 64 122 无效 40 31 71 合计 98 95 193 分析:在口服的病人中,有
5864?59%的人有效;在注射的病人中,有?67%的人有效.从直观上来看,口服9895与注射的病人的用药效果的有效率有一定的差异,能否认为用药效果与用药方式一定有关呢?下面用独立性检验的方法加以说明.
解:提出假设H0:药的效果与给药方式没有关系.由列联表中的数据,求得
193?(58?31?40?64)2???1.3896?2.072
122?71?98?952当H0成立时,?2?1.3896的概率大于15%,这个概率比较大,所以根据目前的调查数据,不能否定假设H0,
即不能作出药的效果与给药方式有关的结论. 说明:如果观测值?2?2.706,那么就认为没有充分的证据显示“Ⅰ与Ⅱ有关系”,但也不能作出结论“H0成立”,
即Ⅰ与Ⅱ没有关系.
§3.1 独立性检验(2)
二.数学运用 1.练习题:
1.在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人。女性中有43人主要的休闲方
式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动。
(1)根据以上数据建立一个2× 2列联表; (2)判断性别与休闲方式是否有关系。
例2.气管炎是一种常见的呼吸道疾病,医药研究人员对两种中草药治疗慢性气管炎的疗效进行对比,所得数据如表所示.问它们的疗效有无差异(可靠性不低于99%)?
复方江剪刀草 胆黄片 合计
例3.下表中给出了某周内中学生是否喝过酒的随机调查结果,若要使结论的可靠性不低于95%,根据所调查的数据,能否作出该周内中学生是否喝过酒与性别有关的结论?
男生 女生 合计 喝过酒 77 16 93 没喝过酒 404 122 526
合计 481 138 619
有效 184 91 275 无效 61 9 70 合计 245 100 345
相关推荐: