?Xi?Xj??X??2?相应的判别准则为:
?1??X?Xj?,i,j?1,2?k ?S2i? X?Gi, 当Wij?X??0时,对于一切j?i 待判, 若有一个Wij?X??0 (2)当S1?Sk不相等时 此时判别函数为
?1??1????Wji?X???X?X?j??S?X?X?X?Xj?j??i?Si?X?X?i??
相应的判别准则为:
X?Gi, 当Wij?X??0时,对于一切j?i 待判, 若有一个Wij?X??0 (二)费舍判别法
费舍判别法是1936年提出来的,该方法对总体分布未提出什么特定的要求。 1.基本思想
费舍判别法是基于统计上的费舍准则,即判别的结果应该使两组间区别最大,使每组内部离散性最小。在费舍准则意义下,确定线性判别函数:
y?c1x1?c2x2???cpxp
其中c1,c2?cp为待求的判别函数的系数。判别函数的系数的确定原则是使两组间区别最大,使每组内部离散性最小。有了判别函数后,对于一个新的样品,将p个指标的具体数值代入判别式中求出y值,然后与判别临界值进行比较,并判别其应属于哪一组。
2.两组判别分析 (1)方法原理
设有两组总体GA和GB,相应抽出样品个数为n1,n2(n1?n2)?n,每个样品观测p个指标得观测数据如下,
x11?A?x12?A??x1p?A?x21?A?x22?A??x2p?A? 总体GA的样本数据为:
????xn11?A?xn12?A??xn1p?A? 第1个总体的样本指标平均值为:x1?A?,x2?A??xp?A?
x11?B?x12?B??x1p?B?x21?B?x22?B??x2p?B? 总体GB的样本数据为:
????xn21?B?xn22?B??xn2p?B? 第2个总体的样本指标平均值为:x1?B?,x2?B??xp?B?
根据判别函数,用y?A???cx?A?表示Gkkk?1p以A组样品的重心,
2y?B???ckxk?B?表
k?1p示GB组样品的重心。则两组之间的离差用?y?A??y?B??来表示,GA、GB内部的离差程度分别用
??y?A??y?A??in?1pn12和
??y?B??y?B??in?1n22来表示,其中yi?A???ck?1pkxik?A?;
yi?B???ckxik?B?。
k?1根据费舍准则,要使判别的结果满足两组间区别最大,每组内部离散性最小。则判别函数的系数c1,c2?cp应该能够使:
I??y?A??y?B??222????????????yA?yA?yB?yB?i?ii?1i?1n1n2
取得最大值。
(2)判别系数的导出
令 Q??y?A??y?B??
2F???y?A??y?A??+??y?B??y?B??2iin?1n?1n1n22
I?Q F根据数学分析求极值的原理,对上式两边取对数:
LnI?LnQ?LnF
令
?LnI?LnQ?LnF???0?ck?ck?ck1?Q1?F??0
Q?ckF?ckF?Q?F ?Q?ck?ck1?Q?F ?I?ck?ckk?1,2?p
则
即
而 Q??y?A??y?B??2p?p??????cxA?cxB=??kk??kk?
k?1?k?1?22?p??????????cxA?xBk??kk?
?k?1?令 dk?x?A??x?B?
?p?cd有 Q????kk?? ?k?1?p?Q则有 ?2(?cldl)?dk
?ckl?1n1n22而 F???y?A??y?A??+??y?B??y?B??2iin?1n?122
2n2pp?p??p????????????cxA?cxA?cxB?cxB=????kkkk??kik????kik?
i?1?k?1k?1i?1?k?1k?1??n2?p??p????????????c(xA?xA)?c(xB?xB)=??kk??kik????kik?
i?1?k?1i?1?k?1??n122n1p?p??=??????????c(xA?xA)?c(xA?xA)?klill??kik?
i?1?k?1k?1?p?p?+????????????ck(xikB?xkB)??cl(xilB?xlB)?? i?1?k?1k?1?n2n1=
??cc[??x?A??x?A???x?A??x?A??
klikkillk?1l?1n2i?1ppn1+
??x?B??x?B???x?B??x?B??]
ikkilli?1n2killikkill令 Skl=
??x?A??x?A???x?A??x?A??+??x?B??x?B???x?B??x?B??
iki?1i?1n1有 F???ccSklk?1l?1ppkl
p?F则有 ?2?cl?Skl
?ckl?1p2p于是有 (?cldl)?dk?2?cl?Skl
Il?1l?1?1?p令 ???c?d?ll?? I??l?1??cl?1pl?Skl???dk?k?1,2?p?
?是一个常数因子,不依赖k,它对方程组的解只起到共同扩大?倍的作用,不影响
它的解c1,c2,?,cp之间的比例关系,因此也不会影响判别函数,所以,取??1,得方程组:
?cl?1pl?Skl?dk?k?1,2?p?
?S11c1?S12c2???S1pcp?d1?Sc?Sc???Sc?d?2112222pp2即 ?
????Sp1c1?Sp2c2???Sppcp?dp解此方程即得c1,c2,?,cp,进而得判别函数:
y?c1x1?c2x2???cpxp
(3)判别准则
由判别函数,可得两组总体GA和GB各自样品的重心:
y?A???ckxk?A?
k?1ppy?B???ckxk?B?
k?1对它们进行根据样本的容量进行加权得:
yAB?n1y?A??n2y?B?
n1?n2yAB称为两组判别的综合指标。据此可得判别准则为:
①如果y?A??yAB,则对于给定的新样品x1,x2,?xp,若有
??y?c1x1?c2x2???cpxp?yAB
则将该样品判属于GA组,若y?yAB,则判其属于GB组;
②如果y?B??yAB,则对于给定的新样品x1,x2,?xp,若有
??y?c1x1?c2x2???cpxp?yAB
则将该样品判属于GB组,若y?yAB,则判其属于GA组。
(4)两组判别分析的检验
由于判别分析是假设两组样品是取自不同总体,如果两个总体的均值向量在统计上差异不显著,则进行判别分析意义不大。所以,两组判别分析的检验,实际就是要检验两个正态总体的均值向量是否相等,为此,检验的统计量为:
F??n1?n2?2??p?1T2~F?p,n?n?p?1?
12?n1?n2?2?p????n1n2?nn12?S?1?? 其中:T2??n1?n2?2??????X(A)?X(B)X(A)?X(B)?n?n??n?n?22?1??1? S?SA?SB,
给定检验水平,查F分布表使?F?F????,可得出F?,再由样本值计算F,若
F?F?,则否定原假设,认为两个总体的均值向量在统计上差异显著,判别函数有效,可
用;否则两个总体的均值向量在统计上差异不显著,判别函数无效不可用。
搜索“diyifanwen.net”或“第一范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,第一范文网,提供最新幼儿教育判别分析的基本原理 (2)全文阅读和word下载服务。
相关推荐: