中的分布一般也比较均匀,由此估计的误差通常要小于简单随机抽样。
整群抽样: ①含义:先将总体划分成若干群,然后以群作为抽样单位从中抽取部分群,再对抽中的各个群中所包含的所有元素进行观察。②特点:不需要有总体元素的具体名单而只要有群的名单就可以进行抽样。整群抽样时群内各元素比较集中,对样本进行调查比较方便,节约费用。在群内各元素存在差异时,整群抽样可以提供较好的结果,理想的情况是每一群都是整个总体的一个缩影。
3.重复抽样:从总体中抽取一个元素后,把这个元素放回到总体中再抽取第二个元素,直至抽取n个元素为止。
不重复抽样:一个元素被抽中后不再放回总体,然后再从所剩下的元素中抽取第二个元素,直到抽取n个元素为止。
4.抽样分布:重复选取容量为n的样本时,由每一个样本算出的统计量数值的相对频数分布或概率分布,称为样本统计量的抽样分布。
5.样本统计量的分布与总体分布的关系?
由于现实中我们不可能将所有的样本都抽出来,因此,统计量的抽样分布实际上是一种理论分布,但它与总体分布存在着密切的关系,以均值x的抽样分布为例,其抽样分布与原有总体的分布有关,如果原有总体是正态分布,那么,无论样本容量的大小,样本均值也服从正态分布。其分布的数学期望为总体均值,方差为总体方差的1/n,即00。如果原有总体的分布不是正态分布,就要看样本容量的大小了,当n为大样本时(n≥30),根据统计上的中心极限定理可知,当样本容量n增大时,不论原来的总体是否服从正态分布,样本均值的抽样分布都将趋于服从正态分布。其分布的数学期望为总体均值,方差为总体方差的1/n。
?6. Zα/2n的含义:是估计误差。Zα/2的值和样本量n共同确定
了估计误差的大小,一旦确定了置信水平1-α,Zα/2的值就确定了。对于给定的Zα/2的值和总体标准差σ。可以确定任一允许的估计误差所需要的样本量。
7.样本均值抽样分布的两个主要特征值: 与总体参数的关系:
1.理解原假设与备择假设的含义:原假设:通常将研究者想收集证据予以反对的假设称为原假设或零假设,用H0表示;备择假设:通常将研究者想收集证据予以支持的假设称为备择假设或研究假设,用H1表示。
2.统计检验量:根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量,称为检验统计量。 标准化检验统计量:是将统计检验量标准化,标准化的统计检验量=(点估计量-假设值)/点估计量的抽样标准差。
3.第Ⅰ类错误:当原假设为真时拒绝原假设,所犯的错误称为Ⅰ类错误。犯第Ⅰ类错误的概率通常记为α。
第Ⅱ类错误:当原假设为假时没有拒绝原假设,所犯的错误称为第Ⅱ类错误,又称取伪错误。犯第Ⅱ类错误的概率通常记为β。 它们发生概率之间的关系:在样本量不变的情况下,要减小α就会使β增大,而要增大α就会使β减小,这两类错误此消彼长。 4.显著性水平:假设检验中犯的第Ⅰ类错误的概率,称为显著性水平,记为α。
它对于假设检验决策的意义:显著性水平是人们事先制定的犯第Ⅰ类错误的概率α的最大允许值,在实际应用中,显著性水平往往是人们事先给出的一个值。
5.P值:在原假设为真的条件下,检验统计量的观察值大于或等于其计算值的概率,称为P值,也称为观察到的显著性水平。
利用P值决策的准则:如果P值<α,拒绝H0;如果P值>α,不拒绝H0.
6.单侧检验与双侧检验的区别:单侧检验中,P值位于抽样分布的一侧,而双侧检验P值位于分布的两侧,每一侧的P值为1/2. 7.大样本情形下总体均值左侧检验的拒绝域:Z<﹣Zα;右侧检验的拒绝域:Z>Z;双侧检验的拒绝域:|Z|>Zα/2。 8.小样本情形下总体均值检验应该构造的检验统计量t 应用前提:服从正态分布
9.小样本情形下总体均值左侧检验拒绝域:t<﹣tα(n-1);右侧检验拒绝域: t>tα(n-1);双侧检验的拒绝域:|t|>tα/2(n-1) 10.假设检验的一般步骤:①依照题意建立原假设H0与备择假设H1②判断样本大小并计算检验统计量③根据显著水平进行判断原假设是否成立。
1、相关关系:变量之间存在的不确定的数量关系。相关关系的特点:一个变量的取值不能由另一个变量唯一确定,当变量x取某个值时,变量y的取值可能有几个
2、相关系数的取值和意义:取值范围:—1≤r≤1。若0 4、回归模型:描述因变量y如何依赖于自变量x和误差项ε的方程。估计的回归方程:利用最小二乘法,根据样本数据求出的回归方程的估计。 回归方程:对变量之间统计关系进行定量描述的以后总数学表达式。指具有相关的随机变量和固定定量之间关系的方程。 5、参数最小二乘估计的基本原理:使因变量的观察值yi与估计值?yi之间的离差平方和达到最小来求得β0和β1的方法。 6、总平方和:对一个具体的观测值来说,变差的大小可以用实际观测值y与其均值?y之差(y—?y)来表示。而n次观测值的总变差可由这些离差的平方和来表示,称为总平方和。(143 反映了y的总变差中由于x与y之间的线性关系引起的y的变化部分,它是可以由回归直线来解释的yi变差部分,称回归平方和。 是各实际观测点与回归值的残差(yi_—?yi)的平方和,它反映除x对y的线性影响之外的其他因素对y变差的作用,是不能由回归直线来解释的yi变差部分,称为残差平方和。 总平方和=回归平方和+残差平方和 7、判定系数:回归平方和占总平方和的比例。作用: 8、在回归分析中,F检验和t检验各有什么作用 9、线性关系检验的步骤:第一步:提出假设。H0:β1=0 两个变量之间的线性关系不显著。第二步:计算检验统计量F。()F= 第三步:作出决策。确定显著水平α,并根据分子自由度df1=1和分母自由度df2=n—2查F分布表,找到相应的临界值Fα。若F>Fα,拒绝H0,表明两个变量之间的线性关系是显著的;若F 计算检验的统计量t (148)
相关推荐: