第一范文网 - 专业文章范例文档资料分享平台

2.3数据的无量纲化处理及示例 - 图文 

来源:用户分享 时间:2025/6/1 11:32:29 本文由loading 分享 下载这篇文档手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:xxxxxxx或QQ:xxxxxx 处理(尽可能给您提供完整文档),感谢您的支持与谅解。

数据的无量纲处理方法及示例

在对实际问题建模过程中,特别是在建立指标评价体系时,常常会面临不同类型的数据处理及融合。而各个指标之间由于计量单位和数量级的不尽相同,从而使得各指标间不具有可比性。在数据分析之前,通常需要先将数据标准化,利用标准化后的数据进行分析。数据标准化处理主要包括同趋化处理和无量纲化处理两个方面。数据的同趋化处理主要解决不同性质的数据问题,对不同性质指标直接累加不能正确反应不同作用力的综合结果,须先考虑改变逆指标数据性质,使所有指标对评价体系的作用力同趋化。数据无量纲化主要解决数据的不可比性,在此处主要介绍几种数据的无量纲化的处理方式。

(1)极值化方法

可以选择如下的三种方式:

(A)xi'ximaxminximinmaxminxi Rximin R即每一个变量除以该变量取值的全距,标准化后的每个变量的取值范围限于[-1,1]。 (B) xi'即每一个变量与变量最小值之差除以该变量取值的全距,标准化后各变量的取值范围限于[0,1]。

(C) xi值为1。

采用极值化方法对变量数据无量纲化是通过变量取值的最大值和最小值将原始数据转换为界于某一特定范围的数据,从而消除量纲和数量级的影响。由于极值化方法对变量无量纲化过程中仅仅对该变量的最大值和最小值这两个极端值有关,而与其他取值无关,这使得该方法在改变各变量权重时过分依赖两个极端取值。

(2)标准化方法 利用xi''xi,即每一个变量值除以该变量取值的最大值,标准化后使变量的最大取maxxix来计算,即每一个变量值与其平均值之差除以该变量的标准差,无量

纲化后各变量的平均值为0,标准差为1,从而消除量纲和数量级的影响。虽然该方法在无量纲化过程中利用了所有的数据信息,但是该方法在无量纲化后不仅使得转换后的各变量均值相同,且标准差也相同,即无量纲化的同时还消除了各变量在变异程度上的差异。

(3)均值化方法 计算公式为:xi异程度上的信息。

(4)标准差化方法 计算公式为:xi''xi,该方法在消除量纲和数量级影响的同时,保留了各变量取值差xixi。该方法是标准化方法的基础上的一种变形,两者的差别仅在无

量纲化后各变量的均值上,标准化方法处理后各变量的均值为0,而标准差化方法处理后各变量均值为原始变量均值与标准差的比值。

综上所述,针对不同类型的数据,可以选择相应的无量纲化方法。如下的示例就是一个典型的评价体系中无量纲化的范例。

示例:近年来我国淡水湖水质富营养化的污染日益严重,如何对湖泊水质的富营养化进行综合评价与治理是摆在我们面前的任务,下面两个表格分别为我国5个湖泊的实测数据和湖泊水质评价标准。

表2-2 全国五个主要湖泊评价参数的实测数据

杭州西湖 武汉东湖 青海湖 巢湖 滇池 表2-3 湖泊水质评价标准

评价参数 极贫营养 总磷 耗氧量 透明度 总氨

要求:(1)试用以上数据,分析总磷,耗氧量,透明度,总氨这4个指标对湖泊水质评价富营养化的作用。

(2)对这5个湖泊的水质综合评价,确定水质等级。

在进行综合评价之前,首先要对评价的指标进行分析。通常评价指标分成效益型,成本型和固定型指标。效益型指标是指那些数值越大影响力越大的统计指标(也称正向型指标);成本型指标是指数值越小越好的指标(也称逆向型指标);而固定型指标是指数值越接近于某个常数越好的指标(也称适度型指标)。如果每个评价指标的属性不一样,则在综合评价时就容易发生偏差,必须先对各评价指标统一属性。

建模步骤

(ⅰ)建立无量纲化实测数据矩阵和评价标准矩阵,其中实测数据矩阵和等级标准矩阵如下,

<1 < >37 < 贫营养 4 12 中营养 富营养 极富营养 23 110 >660 > < > 总磷(mg/L) 130 105 20 30 20 耗氧量(mg/L) 透明度(m) 总氨(mg/L) 13010.30.352.76X10510.7201.40.44.52.00.22,Y137412231.82.4110660,

0.090.367.1027.10.550.171.24.6306.260.251.672010.130.50.230.020.060.31然后建立无量纲化实测数据矩阵A和无量纲化等级标准矩阵B,其中

xij/maxxijaij得到

jjj33 bktykt/maxyktkkk33

minxij/xijjminykt/yktk1.00000.96260.71431.0000A0.80771.00000.62500.72460.15380.13080.05560.0797, 0.23080.58501.00000.60510.15380.94670.50000.08330.00150.00610.03480.16671.0000B0.00330.01330.06640.26201.00000.00460.01420.07080.30911.00000.00430.01300.06740.26091.0000(ⅱ)计算各评价指标的权重

计算矩阵B的各行向量的均值和标准差,

5。

i155(bijbij,sij1i)2,i1,2,3,4

j14然后计算变异系数

wisi/i,

最后对变异系数归一化得到各指标的权重为

w0.27670.24440.23470.2442

(ⅲ)建立各湖泊水质的综合评价模型

通常可以利用向量之间的距离来衡量两个向量之间的接近程度,在Matlab中,有以下的函数命令来计算向量之间的距离;

dist(w,p): 计算w中的每个行向量和p中每个列向量之间的欧式距离; mandist(w,p): 绝对值距离。

计算A中各行向量到B中各列向量之间的欧氏距离,

4dijk1(aikbik) 2若dik1j5min{dij},则第i个湖泊属于第k级。

1.84721.83121.59591.5798d0.21850.20451.32011.30381.07931.0650于富营养水质。

1.73741.48590.13671.20820.98671.37691.12710.33830.83920.73280.28810.50341.7917 0.95911.3450这说明杭州西湖,武汉东湖都属于极富营养水质,青海湖属于中营养水质,而巢湖和滇池属

同时也可以计算A中各行向量到B中各列向量之间的绝对值距离

4Diji1|aikbik|,

若Dik1j5min{Dij},则第i个湖泊属于第k级。

3.66313.63033.14363.1108D0.40620.37342.40712.37431.67011.63743.43742.91780.21102.18141.44442.67832.15870.57871.42231.06600.32310.84273.5800 1.57912.3161其评价结果与利用欧氏距离得到的评价结果完全一样。

所以,从上面的计算可以看出,尽管欧氏距离和绝对值距离的意义完全不一样,但对湖泊水质的评价等级是一样的,这表明了方法的稳定性。

程序:

X=[130 ; 105 2; 20 30 ; 20 ];

Y=[1 4 23 100 660; ; 37 12 ; ];

B1=Y(1,:)./660; B2=Y(2,:)./; B3=./Y(3,:); B4=Y(4,:)./;

B=[B1;B2;B3;B4];

A1=X(:,1)./130; A2=X(:,1)./; A3=./X(:,3); A4=X(:,4)./;

A=[A1 A2 A3 A4]; B=B’;

t=std(b)./mean(b); w=t/sum(t); jd=dist(A,B);

mjd=mandist(A,B) 精心搜集整理,只为你的需要

2.3数据的无量纲化处理及示例 - 图文 .doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
本文链接:https://www.diyifanwen.net/c9bvot8tqk73z01x0bvw21wxgu8k8be00ni2_1.html(转载请注明文章来源)
热门推荐
Copyright © 2012-2023 第一范文网 版权所有 免责声明 | 联系我们
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ:xxxxxx 邮箱:xxxxxx@qq.com
渝ICP备2023013149号
Top