统计学简答汇总
第一章:绪论(无)
第二章:定量变量的统计描述
1.均数﹑几何均数和中位数的适用范围有何异同? 答:相同点,均表示计量资料集中趋势的指标。
不同点:表2-5.
表2-5 均数,几何均数和中位数的相异点 平 均 数 意 义 应用场合
均 数 平均数量水平 应用甚广,最适用于对称分布,特别是正态分布 几何均数 平均增减倍数 ①等比资料;②对数正态分布资料
中位数 位次居中的观 ①偏态资料;②分布不明资料;③分布一端或两
察值水平 端出现不确定值
2.中位数与百分位数在意义上﹑计算和应用上有何区别与联系? 答:
1) 意义:中位数是百分位中的第50分位数,常用于描述偏态分布资料的集中位置,反
映位次居中的观察值水平。百分位数是用于描述样本或总体观察值序列在某百分位置的水平,最常用的百分位是P50即中位数。多个百分位数结合使用,可更全面地描述总体或样本的分布特征。
(2)计算:中位数和百分位数均可用同一公式计算,即 Px=L+(i/fx)(n·x%-ΣfL)
可根据研究目的选择不同的百分位数代入公式进行计算分析。
(3)应用:中位数常用于描述偏态分布资料的集中趋势;百分位数常用于医学参考
值范围的确定。中位数常和其它分位数结合起来描述分布的特征,在实际工作中 更为常用。百分位数还可以用来描述变量值的离散趋势(四分位数间距)。 3.同一资料的标准差是否一定小于均数?
答:不一定。同一资料的标准差的大小与均数无关,主要与本资料的变异度有关。 变异大,标准差就大,有时比均数大;变异小,标准差小。
4.测得一组资料,如身高或体重等,从统计上讲,影响其标准差大小的因素有哪些? (1)样本含量的大小,样本含量越大,标准差越稳定。 (2)分组的多少
(3)分布形状的影响,偏态分布的标准差较近似正态分布大 (4)随机测量误差大小的影响
(5)研究总体中观察值之间变异程度大小 5.标准差与变异系数的异同点有哪些? 答:标准差:是以算数平均数为中心,反映各观测值离散程度的一个绝对指标.当需要对同一总体不同时期或对不同总体进行对比时,缺乏可比性.当总体平均水平不同或计量单位不同时,用标准差是无法实现两组数据离散程度大小对比的.
变异系数:标准差与平均数的比值称为变异系数,记为C·V.变异系数可以消除单位和(或)平均数不同对两个或多个资料变异程度比较的影响。 6.如何表达一批计量数据的基本特征?
答:从集中趋势和离散趋势两方面回答。
7. 描述计量资料离散程度(差别大小)的指标有哪些,各适用于什么情况?
答:常见的几种描述离散程度的指标:极差或全距,四分位数差距,方差与标准差,变异系
数。
极差适合:数据分布非对称的情形。
四分位数差距适合:数据分布非对称的情形。
方差与标准差适合:对称分布或近似正态分布资料,能充分利用全部个体的信息。
变异系数适用:当比较两资料的变异程度大小时,如果变量单位不同或均数差别较大时,直接比较 无可比性,适用变异系数比较。 8.标准差有何用途?
答:①描述正态分布的变异程度;②正态分布时,均数与标准差同时写出:X+S;③计算变异系数;④用标准差估计变量值的频数分布;⑤用标准差计算标准误。 9. 统计描述的基本方法有哪些,各自有何特点?
答:统计描述的基本方法:用表、图和数字的形式概括原始资料的主要信息。 表:详细、精确。图:直观。指标:综合性好。 10.简述变异系数的实用时机。
答:变异系数适用于变量单位不同或均数差别较大时,直接比较无可比性,适用变异系数比较。
11. 怎样正确描述一组计量资料?
答:(1).根据分布类型选择指标。(2).正态分布资料选用均数与标准差,对数正态分布资料选用几何均数,一般偏态分布资料选用中位数与四分位数间距。 12.原始数据单位变换后,对均数和方差有何影响? 答:均数和方差均改变。用实例说明。 13.列表的原则和基本要求是什么?
答:(1)列表的原则:重点突出,简单明了;主谓分明,层次清楚。 (2)列表的基本要求:
① 应有简明扼要说明统计表内容的标题。既不能过与简略,也不呢能过于繁琐或不
确切。
② 标目文字要简明,有单位的标目要注明,标目不宜过多,层次应清楚。 ③ 线条不宜过多。除顶线、底线、纵标目下与合计行上面的线条外,其他线条一般
均应省去。表的左上角不宜有斜线。
④ 表内数字小数位数保留应一致,位次应对齐,不宜留空格。暂缺或未记录用“?”
表示,无数字用“—”表示,数字是“0”则应填写“0”。 ⑤ 备注一般不列入表内,应用“*”号引出,写在表的下面。 14.常用的统计图有哪几种?他们的适用条件是什么?
答:常用的统计图有条图、百分条图、圆图、线图、半对数线图、直方图、散点图和统计地图等。
(1)直条图:用等宽直条的长短来表示相互独立的各项指标的数值大小,如发病率等。 (2)百分条图、圆图:用长条各段的面积、圆的扇形面积来表示事物内部各构成部分的分
布情况,即各构成比重的大小,如构成比。
(3)普通线图:用线段的升降来表示连续性资料随时间的变迁、某事物现象的动态及变化
趋势。
(4)半对数线图:用线段的升降来表示连续性资料随时间的变迁和某事物现象发展变化的
速度。
(5)直方图:用直方面积的大小表示数值变量资料频数分布的情况。 (6)散点图:用点的密集程度和趋势表示两变量间的相关关系。
(7)统计地图:用不同的纹线或颜色说明指标高低,描述某事物现象在行政区域上的分布
情况。
15.半对数线图的图形如何做分析?
答:用于表示事物的发展速度(相对比)。其横轴为算数尺度,纵轴为对数尺度,在比
较几组数据的变化速度(相对比)时,特别是两组数据相差悬殊时,宜用半对数线图。
第三章:定性变量的描述
1.为什么不能以构成比代率? 答:二者说明的问题不同。构成比只能说明某事物内部各组成部分在全体中所占的比重或分布,不能说明某现象发生的频率或强度。 2.简述相对数标准化的基本思想。
答:基本思想: 采用统一的标准人口年龄构成,以消除不同人口构成对两地死亡率的影响,使得到的 标准化死亡率具有可比性。
3.解释在何种情况下应选用率的直接标化法,何种情况选用间接标化法?
答: 率的直接标化法:已知各组的年龄别死亡率pi。间接标化法:已知各组的死亡总数和各年龄组人口数.
4.率的直接标化法,与间接标化法有何不同?
答: (1)适用条件不同(见第上题);(2)“标准”不同:前者选定一个“标准人口”或“标准人口构成” 。 后者选定一套“标准年龄别死亡率” 。 5.应用相对数时应注意哪些问题?
答:应用相对数指标的时候要注意:分母不宜过小;不要以比代率;资料的可比性;样本指标比较 时应做假设检验。
6.常用相对数指标有哪些? 它们的意义上有何不同?
答:常用相对数指标:率、构成比、比。率又称频率指标或强度相对数。说明某现象发生的频率或 强度。常用来表示某一事物发展的趋势或水平及特征。构成比又称构成指标或结构相对数。部分与全部之比,说明某事物内部各组成部分在全体中所占的比重或分布。常用来表示疾病或死亡的顺位、位次或所占比重。比(又称相对比)表示同类的或有联系的两个现象间的对比关系,常用倍数或百分数表示。
7.统计学上资料是否“具有可比性”指的是什么? 你能举出一些不可比的例子吗?
答:除研究因素外,其余重要影响因素应相同或相近。一般观察单位同质,研究方法相同,观察时 间相等,以及地区、民族等客观条件一致。例如内科和外科的治愈率就无可比性。 8.何谓人口老龄化?请简述其影响因素。
答 1:人口老龄化是指老年人口(65 岁及以上)在人口中所占的比重升高的现象。在没有迁移的 情况下,人口老龄化的进程主要受生育率和死亡率两种因素的影响。生育率下降,使低年龄人口的比重降低,高年龄人口的比重相应增加;死亡率(主要是中老年人口的死亡率)降低,使寿命延长,老年人口比重增加。一般来说,人口老龄化的速度和程度主要取决于生育率的下降速度。当生育率水平下降达到很低的水平且很难再有较大程度的降低时,中老年人口死亡率的降低对人口老龄化的影响才比较明显。 9.发病率、时点患病率、时期患病率的区别。
答:(1)发病率是指观察期内,可能发生某病的人群中新发病例的频率,其观察期多为年、
月、日等,急性常见病多计算发病率。
(2)时点患病率反映在检查或调查时点一定人群中某病的现患情况(包括该病的新旧病
例数)。观 察时点在理论上是无长度的,但实际上观察时间不宜过长,一般不超过个月。
(3)时期患病率反映在观察期间一定人群中存在或流行某病的频度,包括观察期间的新
发病例和现 患病例数,为慢性病的统计指标。 10.疾病统计的观察单位 “病人”和“病例”的区别。
答:(1)一个人每次患病都可作为一个病例。以病例为单位的疾病统计,可研究居民各种疾病的频度、疾病的种类及疾病的变动,以获得居民患病的基本规律。
(2)病人是指一个有病的人。在观察期间内,观察对象患有疾病即算作一个病人,不管其患病的种 类及患病次数的多少。以病人为单位的疾病统计,在一定程度上反映居民的患病频度,可找出具体 的患病人群,便于开展对病人个人的防治工作。 11.病死率和死亡率的区别。
答:(1)某病病死率表示在规定的观察期内,某病患者中因该病而死亡的频率。它是反映疾病的严重程度的指标。在用病死率进行比较时应注意病情轻重等内部构成不同的影响。计算公式为:观察期内因某病死亡的人数 某病病死率= 同期该病患者数 ×1000?
(2)某病死亡率表示在规定的观察期内,人群中因某病而死亡的频率。它可以反映不同地区或年代 某种疾病的死亡水平。计算公式为: 观察期内因某病死亡的人数 某病死亡率= 同期平均人口数 ×1000?
12.简述婴儿死亡率指标的实际意义。
答:婴儿死亡率指某地某年不满一周岁婴儿的死亡数与同期活产总数的比值。
婴儿死亡率= 某年不满周岁婴儿死亡数 ×1000? /同期活产数 婴儿死亡率的高低对平均寿命有重要的影响,它是反映社会卫生状况和婴儿保健工作的重要指 标,也是死亡统计指标中较为敏感的指标。婴儿死亡率不受年龄的影响,不同国家或地区之间可以相互比较。
13.请说明频率型指标与强度型指标的主要区别?
答:主要区别:指标的解释不同,频率型指标是表示事物内部某个组成部分所占的比重或分布,或指某现象发生的频率。强度型指标是指单位时间内某现象发生的频率。 14.标准化法的基本思想?
答:采用统一标准构成以消除某因素的内部构成不同对总率的影响,使通过标准化后的标准化率具有可比性。
15.请比较发病率和患病率的不同。
答:发病率表示一定时期内,在可能发生某病的一定人群活过的总人年中,新发生的某病病历数,其分子是新病历数,分母是总人年数;患病率,又称现患率,指某时点上受检人数中先患某种病的人数,通常用于描述病程较长或发病时间不易明确的疾病的患病情况,其分子包括新旧病例数,分母是受检总人数。在一定的人群和时间内,发病率和患病率有密切关系,两者与病程(D)的关系是:PR=IR×D。 16.请比较死亡率与病死率的不同。
答:死亡率与病死率的分子是一样的,均表示因某病死亡的人数,但死亡率的分母是总人年数,侧重反映发生的强度,或单位时间内死亡的概率;病死率的分母是患某病的人数,反映疾病死亡的概率。 17.应用相对数应注意的事项。
答:1.理解相对数的含义不可望文生义;2.频率型指标的解释要紧扣总体和属性;3.计算相对数时分母应有足够数量;4.正确地合并频率(强度)型指标;5.相对数间的比较要具备可比性;6.对相对数的统计推断。 18.应用标准化的注意事项。
答:1.标准化的应用范围很广,适用于“某事件的发生率”可以是治愈率,也可以是患病率,还可以是发病率、病死率等。当某个分类变量在两组中分布不同时,这个分类变
量就成为两组频率比较的混杂因素,标准化法的目的就是消除这个混杂因素的影响。 19.疾病统计有几类指标,各有什么意义?
答:发病率、时点患病率、期间患病率、治愈率、生存率、残疾患病率。前3种详见上述简答题。治愈率:表示受治病人中治愈的频率。有效率表示受治病人中治疗有效的频率。两个率主要用于对急性病危害或防治效果的评价。但治愈和有效的标准要有明确而具体的规定,只有在标准相同的情况下才可以相互比较。生存率:病人能活到某一时点的概率。常用于对慢性病及心血管病等的治疗效果评价和预后评估。
20.反映疾病的预防效果和治疗效果的指标有哪些?各有什么特点?
答:①发病率:疾病防治效果;②患病率:慢性病预防效果;③治愈率:急性病防治效果;④生存率:慢性病的治疗效果。各指标含义详见上述简答题。 21.测量生育水平有几个指标?各指标有什么不同?
答:①粗生育率;②总生育率;③年龄别生育率;④总和生育率。各指标含义详见教材P41。
22.测量人口再生育水平有几个指标?各指标有什么不同?
答:①自然增长率;②粗再生育率;③净再生育率。各指标含义详见教材P42。 23.人口统计应包括哪几个方面?
答:医学人口统计是从卫生保健的角度研究和描述人口数量、分布、结构、变动及其规律,研究人口与卫生事业发展的相互关系,是卫生统计学的重要组成部分。包括描述人口学特征的指标,生育和人口死亡的指标。详见书本P40-44。 24.人口金字塔有几种典型的形状?各说明什么?
答:人口金字塔直观地表示了人口的年龄、性别结构。每一层代表一个年龄组的人口,上部代表老年人,下部代表少年儿童,左半部代表男性,右半部代表女性,水平方向的长度表示男性和女性人口的数量各在总人口中所占的百分比。人口金字塔一共分3种类型:①年轻型:下宽上窄,呈真正的金字塔形,表明少年儿童人口占总人口的比重大,预示着未来人口的发展趋势是增长的。其人口增长模式一般为“高-低-高”模式,主要存在有发展中国家;②成年型:底部与中部的宽窄基本相近,出生率、死亡率差不多,预示着未来人口的发展趋势是稳定的。其人口增长模式一般为“低-低-低”模式;③老年型:上宽下窄,表明少年儿童人口的比重缩小,老年人口比重增大,是出生率长期下降的结果。这种类型的人口问题主要是育龄人口比重低,如果生育水平不变,预示着未来人口的发展趋势是负增长的。其人口增长模式一般为“低-低-低”模式,一般存在于发达国家。
第四章:常用概率分布
1.正态分布﹑标准正态分布与对数正态分布在概念上和应用上有何异同? 答:概念上:①相同点:正态分布、标准正态分布与对数正态分布都是变量的连续型分布。其特征是:分布曲线在横轴上方,略呈钟型,以均数为中心,两边对称,均数处最高,两边
2
逐渐减小,向外延伸,不与横轴相交。②相异点:表示方法不同,正态分布用N(μ,σ)
2
表示,标准正态分布用N(0,1)表示,对数正态分布N(μlgX,σlgX)表示。
(1) 应用上:①相同点:正态分布、对数正态分布都可以转换为标准正态分布。 ②相异点:标准正态分布是标准正态变量u的分布,标准正态曲线下的面积唯一的由u决定,给应用带来极大方便。对医学资料呈偏态分布的数据,有的经对数变换后服从正态分布。正态分布、对数正态分布可描述变量值的分布特征,可用于正常值范围估计和质量控制等。正态分布是很多统计方法的理论基础。 2.医学中参考值范围的含义是什么?确定的原则和方法是什么?
相关推荐: