《抽样技术》第四版习题答案

来源：用户分享时间：2025/7/1 11:24:08 本文由

loading 分享下载这篇文档手机版

说明：文章内容仅供预览，部分内容可能不全，需要完整文档或者需要复制内容，请下载word后使用。下载word有问题请添加微信号:xxxxxxx或QQ：xxxxxx 处理（尽可能给您提供完整文档），感谢您的支持与谅解。

第2章

2.1 解：?1? 这种抽样方法是等概率的。在每次抽取样本单元时，尚未被抽中的编号

为1～64的这些单元中每一个单元被抽到的概率都是

1。 100?2?这种抽样方法不是等概率的。利用这种方法，在每次抽取样本单元时，尚未被抽中

的编号为1～35以及编号为64的这36个单元中每个单元的入样概率都是抽中的编号为36～63的每个单元的入样概率都是

2，而尚未被1001。 100?3?这种抽样方法是等概率的。在每次抽取样本单元时，尚未被抽中的编号为20 000～

21 000中的每个单元的入样概率都是

1，所以这种抽样是等概率的。 1000 不同之处 2.2解：项目相同之处定义都是根据从一个总体中抽样得到的样本，然后定义样本均值为1ny??yi。 ni?1_抽样理论中样本是从有限总体中按放回的抽样方法得到的，样本中的样本点不会重复；而数理统计中的样本是从无限总体中利用有放回的抽样方法得到的，样本点有可能是重复的。性质 (1) 样本均值的期望都等于总体均值，也就是抽样理论和数理统计中的样本均值都是无偏估计。 (2) 不论总体原来是何种分布，在样本量足够大的条件下，样本均值近似服从正态分布。 (1) 抽样理论中，各个样本之间是不独立的；而数理统计中的各个样本之间是相互独立的。 (2) 抽样理论中的样本均值的方差为_1?f21??2V?y??S，其中S?Yi?Y?。??nN?1??2在数理统计中，V?y??方差。 12?，其中?2为总体的n 2.3 解：首先估计该市居民日用电量的95%的置信区间。根据中心极限定理可知，在大

样本的条件下，间为?y?z?y?YV?y?_?y?E?y?V?y?近似服从标准正态分布， Y的1???95%的置信区

_?2V?y?,y?z?2V?y????y?1.96V?y?,y?1.96V?y??。

???1

而V?y??1?f2S中总体的方差S2是未知的，用样本方差s2来代替，置信区间n1?f1?fs,y?1.96nn_为?y?1.96???s?。 ?2由题意知道，y?9.5,s?206，而且样本量为n?300,N?50000，代入可以求得 _v(y)?1?f21?30050000s??206?0.6825。将它们代入上面的式子可得该市居民n300日用电量的95%置信区间为??7.8808,11.1192??。

下一步计算样本量。绝对误差限d和相对误差限r的关系为d?rY。根据置信区间的求解方法可知

_?__y?Y?_?__??P?y?Y?rY??1???P?????V?y????rY????1??

V?y????_?__?2_y?Y????rY???根据正态分布的分位数可以知道P?。?Z?2??1??，所以V?y?????z?V?y????2??????_?rY??11?2?n?1也就是???S???z?2??nN???_222??_????rY??1?????。

22?Nz??/2S????把y?9.5,s?206,r?10%,N?50000代入上式可得，n?861.75?862。所以样本量至少为862。

总体中参加培训班的比例为P，那么这次简单随机抽样得到的P的估计值p2.4 解：的方差V?p??p?P1?fNP?1?P?，利用中心极限定理可得在大样本的条件下近

nN?1V?p?似服从标准正态分布。在本题中，样本量足够大，从而可得P的1???95%的置信区间为

?p?z?2V?p?,p?z?2V?p??。

??而这里的V?p?是未知的，我们使用它的估计值

V?p??v?p???^1?f所以总体比例P的1???95%的置信区间p?1?p??9.652?10?5。

n?12可以写为?p?z?v?p?,p?z?2v?p??，将p?0.35,n?200,N?10000代入可得置

?信区间为??0.2844,0.4156??。

2.5 解：利用得到的样本，计算得到样本均值为y?2890/20?144.5，从而估计小

区的平均文化支出为144.5元。总体均值Y的1???95%的置信区间为

_?y?z?2V?y?,y?z?2V?y??，用v?y??1?fs2来估计样本均值的方差V?y?。 ??n1?f21?0.12计算得到s?826.0256，则v?y??s??826.0?256，37.172n20代入数值后计算可得总体均值的95%的置信区间为z?2V?y??1.96?37.172?11.95，

?132.55,156.45?。

2.6 解：根据样本信息估计可得每个乡的平均产量为1 120吨，该地区今年的粮食总

产量Y的估计值为Y?350y?350?1120?3.92?10（吨）。

^N2?1?f?2??总体总值估计值的方差为V?Y??总体总值的1???95%的置信区间S，n??^?^?^?^?^??52为?Y?z?2V?Y?,Y?z?2V?Y??，把Y?3.92?10,S?25600,n?50,N?350,

????????^_5f?n,z?2?1.96代入，可得粮食总产量的1???95%的置信区间为N??377629,406371??。

2.7 解：首先计算简单随机抽样条件下所需要的样本量，把?1d2?N?1000,d?2,1???95%,S?68带入公式n0?1??22?，最后可得

?Nz?/2S?2n0?61.3?62。

如果考虑到有效回答率的问题，在有效回答率为70%时，样本量应该最终确定为

n?n070%?88.57?89。

2.8 解：去年的化肥总产量和今年的总产量之间存在较强的相关性，而且这种相关关

系较为稳定，所以引入去年的化肥产量作为辅助变量。于是我们采用比率估计量的形式来估计今年的化肥总产量。去年化肥总产量为X?2135。利用去年的化肥总产量，今年的化肥

总产量的估计值为YR?RX?^^yx__X?2426.14吨。

1?f2s=37.17。 n2.9 解：本题中，简单估计量的方差的估计值为v?y??利用比率估计量进行估计时，我们引入了家庭的总支出作为辅助变量，记为X。文化支出属于总支出的一部分，这个主要变量与辅助变量之间存在较强的相关关系，而且它们之间的关系是比较稳定的，且全部家庭的总支出是已知的量。

文化支出的比率估计量为yR?RX?_^_^_yx__X，通过计算得到y?2890/20?144.5，而

___144.5。 x?1580，则R?_??0.0915，文化支出的比率估计量的值为yR?146.3（元）

x1580y_现在考虑比率估计量的方差，在样本量较大的条件下，

V?yR??MSE?yR??22x1?f2S?2R?S?Sx?R2Sx2?，通过计算可以得到两个变量的样?n4?10本方差为s?826,s?9.958，Y和X之间的相关系数的估计值为??0.974，

^?_?代入上面的公式，可以得到比率估计量的方差的估计值为v?yR??1.94。这个数值

??比简单估计量的方差估计值要小很多。全部家庭的平均文化支出的1???95%的置信区间为?yR?z??2v?yR?,yR?z?2v?yR????yR?1.96v?yR?,yR?1.96v?yR??，

???把具体的数值代入可得置信区间为?143.57,149.03?。

?_??_?V?yR?v?yR???????1.94?0.052，这是比估

接下来比较比估计和简单估计的效率，

V?y?v?y?37.17计的设计效应值，从这里可以看出比估计量比简单估计量的效率更高。

2利用简单估计量可得y??yin?1630/10?163，样本方差为s?212.222，2.10 解：

N?120，样本均值的方差估计值为v?y??1?f21?10/120s??212.222?19.4537。 n10利用回归估计的方法，在这里选取肉牛的原重量为辅助变量。选择原重量为辅助变量是

合理的，因为肉牛的原重量在很大程度上影响着肉牛的现在的重量，二者之间存在较强的相关性，相关系数的估计值为??0.971，而且这种相关关系是稳定的，这里肉牛的原重量的数值已经得到，所以选择肉牛的原重量为辅助变量。

回归估计量的精度最高的回归系数?的估计值为???^^^s14.568?0.971??1.368。sx10.3414

?__?现在可以得到肉牛现重量的回归估计量为ylr?y???X?x?，代入数值可以得到

??^_ylr?159.44。

?_??_?1?f2S?1??2?，方差的估计值为回归估计量ylr的方差为V?ylr??MSE?ylr??n????__2?_?1?f2?^?v?ylr??s?1???，代入相应的数值，

n????2?_?1?f2?^?v?ylr??s?1????1.112，显然

n?????_?有v?ylr??v?y?。在本题中，因为存在肉牛原重量这个较好的辅助变量，所以回归估计量

??的精度要好于简单估计量。

第3章

3.1 解：在分层随机抽样中，层标志的选择很重要。划分层的指标应该与抽样调查中最关心的调查变量存在较强的相关性，而且把总体划分为几个层之后，层应该满足：层内之间的差异尽可能小，层间差异尽可能大。这样才能使得最后获得的样本有很好的代表性。对几种分层方法的判断如下：

(1)选择性别作为分层变量，是不合适的。首先，性别这个变量与研究最关心的变量(不同职务，职称的人对分配制度改革的态度)没有很大的相关性；其次，用性别作为分层变量后，层内之间的差异仍然很大，相反，层之间的差异不是很大，因为男性和女性各自内部的职务，职称也存在很大的差别；最后，选择性别作为分层变量后，需要首先得到男性和女性的抽样框，这样会更加麻烦，也会使抽样会变得更加复杂。

(2)按照教师、行政管理人员和职工进行分层，是合适的。这种分层的指标与抽样调查研究中最关心的变量高度相关，而且按照这种方法分层后，可以看出层内对于分配制度改革的态度差异比较小，因为他们属于相同的阶层，而层之间的态度的差异是比较大的。这样选取出来的样本具有很好的代表性。

(3)按照职称（正高、副高、中级、初级和其他）分层，也是合理的。理由与（2）相同，这样进行分层的变量选择与调查最关心的变量是高度相关的，分层后的层满足分层的要求。所以，按照职称进行分层是合理的。

(4)按照部门进行分层，是合理的。因为学校有很多院、系或者所，直接进行简单随机抽样，有可能样本不能很好地代表各个院系，最关心的变量与部门也存在一定的相关性。这样分层后，每个层的总体数目和抽取的样本量都较小，最终的样本的分布比较均匀，比简单随机抽样更加方便实施。

3.2 解：设计的方案如下：

第一种方案：可以按照不同的专业进行分层，但是考虑到如果在每层都抽取，不能保证每个新生的入样概率相等，因为每个专业的人数比例未知，8个人的样本量无法在每个层之

搜索更多关于：《抽样技术》第四版习题答案的文档

《抽样技术》第四版习题答案.doc 将本文的Word文档下载到电脑，方便复制、编辑、收藏和打印

下载这篇word文档

本文链接：https://www.diyifanwen.net/c826152rl163fmdz9vdcj_1.html（转载请注明文章来源）