1
案例:数据特征展示与分析
-《初婚年龄性别匹配特征分析》
重庆工商大学 陈正伟
(参考答案)
一、案例数据背景与结构:
1.数据背景
随着中国性别比越来越大,人们对初婚者的年龄择偶意向问题越来越关注。但是,人们在对性别比例问题研究时,大多是从人口总量本身和简单的百分比来进行分析的。因而,缺乏统计意义上的规律和定量分析的说服力,难以达到对这些社会现象做出精确分析的目的。本文采用初婚年龄择偶意向分析法对中青年择偶和性别比例问题进行分析,以此进一步分析中国婚姻市场。
你想知道初婚夫妇男女一般年龄差是多少吗?你想知道全社会到底是男性多了还是女性多了吗?到底是那些年龄组的性别差较大?等等问题,如下分析可以帮助了提高认识的深度。 2.数据结构
从某地区某年的人口普查数据中,随机抽出4000对初婚年龄人口进行观察,同时扣除部分法定年龄以外的对数和女性33岁以上的人数后,得到该地区部分初婚年龄状况列联表抽样调查统计资料如表(1)。
表(1) 某地区初婚年龄配对调查资料
M年龄 22 W年龄 20 21 22 23 24 25 26 10 14 17 12 7 4 0 14 23 24 37 24 11 2 18 19 30 75 15 37 45 12 32 51 6 25 36 8 5 17 71 4 4 10 32 52 59 2 2 3 9 31 34 35 2 0 0 4 12 13 16 0 0 0 2 3 12 16 91 161 233 517 744 700 562 23 24 25 26 27 28 29 30 31 32 Mi 99 102 74 106 124 176 116 93 43 8 115 172 146 91 43 142 130 114 56 1
27 0 2 9 14 40 110 91 40 32 14 13 365 28 0 1 1 4 11 20 49 24 28 17 8 163 29 0 0 0 1 4 5 8 6 26 12 5 67 30 0 0 0 0 1 3 1 6 9 9 7 36 Mi 64 138 309 497 743 671 548 293 211 99 66 3639 资料来源:某地区、某年人口统计资料。
表中:W-代表女性;M-代表男性。
二、案例分析方向指导
1.根据上述数据能够反映什么数据特征? 2.根据上述数据的平均数分析说明什么? 3.根据上述数据的标准差分析说明什么? 4.每一行列的众数说明什么?
5.如何根据众数和平均数的关系判断各个行列的偏峰情况 6.各个行列的偏度系数说明什么? 7.各个行列的峰度系数说明什么? 8.根据上述数据如何得出理论分布模型? 9.根据上述数据如何进行初婚年龄性别匹配分析? 10.根据上述资料您能够分析得出一些什么结论?
2
2
3
三、案例分析参考答案-中国初婚年龄性别匹配分析-陈正伟
(一)引言
随着中国性别比越来越大,人们对初婚者的年龄择偶意向问题越来越关注。但是,人们在对性别比例问题研究时,大多是从人口总量本身和简单的百分比来进行分析的。因而,缺乏统计意义上的规律和定量分析的说服力,难以达到对这些社会现象做出精确分析的目的。本文采用初婚年龄择偶意向分析法对中青年择偶和性别比例问题进行分析,以此进一步分析中国婚姻市场。
择偶意向是指人们在一定时间和范围内,对婚姻配偶选择的年龄偏好分布的统计规律。一个人进入婚龄后,就会自觉或不自觉的置身于婚姻市场中,被纳入对配偶的供给和需求关系体系,在这个婚姻市场的供求关系中进行比较、选择和匹配,从而体现其择偶意向。
人们对配偶的选择除了受到婚龄期男女人数的多少以及性别平衡等人口学因素的影响外,更受到社会经济文化以及个人的婚姻条件等因素地影响与左右。因此,导致择偶难的原因很多。
根据上述资料,从男女已婚人数的多少以及婚龄期性别比等人口学因素的角度出发,用定量分析方法对于该地区青年的初婚年龄择偶倾向及婚姻状况的问题可以进行深入分析。
(二)分析方法提出
1.数据分析及模型参数
所谓年龄择偶意向是指一定时间,地区范围内,某一年龄组的女性或男性对其他各年龄组的男性或女性的亲合程度或吸引程度。择偶意向的分析,可以帮助我们能发现某一年龄组的女性或男性在其他各年龄上的分布规律,以揭示初婚年龄性别比的规律。
3
4
设Mi为第i年龄组的男性人数,i表示满了i周岁但不到i?1周岁的年龄组。
Wj为第j年
龄组的女性人数,j为满了j周岁但不到j?1周岁的年龄组。根据1980年我国婚姻法的规定男性始婚龄为22岁以上,女性始婚龄为20岁以上,故有i?22,j?20。而i、j的上限的确定应根据我们研究范围酌情处理。我们暂主观约定22?i?32,20?j?30。
根据表(1)中第一行,第一列中的数据表示年龄,M表示男性,W表示女性。其他各行,
i各行分别表示各年龄组不同性别配对的对数。行为男性年龄组,列为女性年龄组,分别记为??,
?j?。取出表(1)中的最后一列组成女性分布表,将表(1)中的资料简化成为两个表如下,
见表(2)(3)。
表(2),女性初婚年龄分布表:
j 20 91 21 161 22 233 23 24 25 700 26 562 27 365 28 163 29 67 30 36 Wj 517 744 百分比 0.03 0.04 0.06 0.14 0.2 0.19 0.15 0.1 0.04 0.02 0.01 表(3) 男性初婚年龄分布表
I 22 64 23 138 24 309 25 497 26 27 28 548 29 293 30 211 31 99 32 66 Mi 百分比 743 671 0.02 0.04 0.08 0.14 0.2 0.18 0.15 0.08 0.06 0.03 0.02 由表(1),表(2),表(3)中的数据可知,初婚择偶意向分布规律与正态分布模型很相似。(见图(一),图(二))
图(一)女性分布图800700600500400300200100020岁21岁22岁23岁24岁25岁26岁27岁28岁29岁91233161163673630岁517744700562女性80070060050036540030020010001386422岁23岁24岁25岁26岁27岁28岁29岁30岁3092932119931岁6632岁497男性743671548图(二)男性分布图
根据上述资料结构和散点图的分析研究,我们可以比较清楚地看出初婚年龄择偶意向模型应当选择正态分布模型。
4
相关推荐: