第一范文网 - 专业文章范例文档资料分享平台

数学建模大赛论文葡萄酒质量分析 - 图文

来源:用户分享 时间:2025/9/11 15:11:40 本文由loading 分享 下载这篇文档手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:xxxxxxx或QQ:xxxxxx 处理(尽可能给您提供完整文档),感谢您的支持与谅解。

葡萄酒

基于数据驱动的葡萄酒质量评定

摘要:如何在当今复杂的社会中让我们国家能对葡萄酒的好坏进行准确的鉴定,如何对酒产品的质量严格把关成为人们最关切的问题,也是政府要解决的当务之急.对于显著性差异我们运用基于成对数据的检验(t检验),对于可信度分析我们运用各组样品中10位人员的方差,再对27组数据方差求均值。对应进行比较得出那组更可信。对于第二个问题我们运用了主成分析,聚众分析对葡萄进行分级。然后利用典型性相关分析对酿酒葡萄与葡萄酒理化指标之间的联系。最后利用了数据拟合以及多元线性回归分析出酿酒葡萄与葡萄酒的理化指标对葡萄酒质量的影响。 关键词:葡萄酒 酿酒葡萄 基于成对数据检验 理化指标 主成分析 聚类分析 典型相关分析

1

一、问题重述

确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。

根据酿酒葡萄和葡萄酒的理化指标与成分数据讨论下述4个问题 1. 两组评酒员的评价结果有无显著性差异,哪一组结果更可信? 2. 据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。

4. 分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?

5. 关于哪一组更可信我们不能简单地求每一组各个平均值的中整体纵向方差,因为其不是等重复性试验 我们可以看做同一个人做每件事的方差,我们可以对27组方差求均值进行比较他们的稳定性 这样做起来可以避免酒样好坏的评分结果对方差的影响 我们利用此种模型可以解决那组更可信的问题

5.要对酿酒葡萄进行分级,我们要假设葡萄酒的质量以及酿酒葡萄的理化指标与葡萄酒的级别存在一定的关系

6.我们首先要假设它们存在一定的模型关系,然后利典型相关分析进行处理得到一定的关系 然后我们总结这些关系给问题下一个结论

7.假设他们之间存在一定的线性关系,我们对数据进行拟合与多元线性回归分析

2

二、模型的假设与符号说明

1.假设把一二组关于同一样本。同一样本所得两个结果看成一对数据。 2.数据差仅由品酒人员不同所致,不考虑其它因素

3.di服从正态分布 N(μ,σ^2 ) i=(1 2 3…n)n=27或28 其中 (μ,σ^2)

未知。

4.符号说明及名词定义

? 是两组内十位评酒员对每一样酒评分平均值

di 两组平均值对应的差值 α给定显著性水平 2 方差 sdn 酒样数 sd 标准差

X1.,X2,。。XN和Y1,Y2。。。YN是来自样品酒平均分

问题分析

①两组评酒员的评价结果有无显著性差异我们需要利用基于成对数据的t检验 ,我们要对各组酒员的每位酒员数据求和,然后对每个样品十位酒员的评分求均值 先假定两组值服从正态分布 试在显著水平α=0.05下检验两组评酒员有无显著性差异, 接下来运用成对数据t检验进行。然后再由一组十位评酒员求出方差 有27,28个样本我们求27,28个方差 所得的数据求平均值 二组同样计算 然后两组方差的平均值比较小的更可靠。我们这样做而不选择评酒员平均分的纵向方差是因为葡萄酒好坏的评分结果对波动性干扰比较大。而我们在这里先求每组10名员波动性再求27,28试样的波动性的均值这样检验出来的结果更有可信性

②分析酿酒葡萄理化指标和葡萄酒质量对酿酒葡萄分级。由于所给的理化指标信息量特别打 直接计算起来困难比较大。所以比我们先要对数据进行主成分析简化数据。然后运用到聚类分析然后对葡萄酒进行分级这里我们用到了sas软件进行了操作

③对于第三问的酿酒葡萄与葡萄酒理化指标之间关系 我们首先要对数据进行筛选出去二级指标然后再对剩下的数据进行多元线性回归检验 确立有无关系然后进行进一步的综合分析。

④对于第四问我们可以先假设酿酒葡萄和葡萄酒的理化指标对葡萄酒又怎样的影响 然后我们可以用数据进行验证分系他们之间的具体关系 如若不能判断我们可以将酚类介入其中考虑。

3

三、模型建立与求解

问题分析

①两组评酒员的评价结果有无显著性差异我们需要利用基于成对数据的t检验 ,我们要对各组酒员的每位酒员数据求和,然后对每个样品十位酒员的评分求均值 先假定两组值服从正态分布 试在显著水平α=0.05下检验两组评酒员有无显著性差异, 接下来运用成对数据t检验进行。然后再由一组十位评酒员求出方差 有27,28个样本我们求27,28个方差 所得的数据求平均值 二组同样计算 然后两组方差的平均值比较小的更可靠。我们这样做而不选择评酒员平均分的纵向方差是因为葡萄酒好坏的评分结果对波动性干扰比较大。而我们在这里先求每组10名员波动性再求27,28试样的波动性的均值这样检验出来的结果更有可信性

②分析酿酒葡萄理化指标和葡萄酒质量对酿酒葡萄分级。由于所给的理化指标信息量特别打 直接计算起来困难比较大。所以比我们先要对数据进行主成分析简化数据。然后运用到聚类分析然后对葡萄酒进行分级这里我们用到了sas软件进行了操作

③对于第三问的酿酒葡萄与葡萄酒理化指标之间关系 我们首先要对数据进行筛选出去二级指标然后再对剩下的数据进行多元线性回归检验 确立有无关系然后进行进一步的综合分析。

④对于第四问我们可以先假设酿酒葡萄和葡萄酒的理化指标对葡萄酒又怎样的影响 然后我们可以用数据进行验证分系他们之间的具体关系 如若不能判断我们可以将酚类介入其中考虑。

3.1问题1

我们运用到基于成对数据的t检验,假设来自两个正态总体样不是相互独立的。两个正态总体的样本是来自统一总体上的重复测量,它们是成对出现的且相关的。但由于样品酒的不同,这n组数据不能看成来自统一正态总体的样本对于这样的数据,采取消除误差的方式对数据进行处理。

检验评价结果有无显著性差异就归于为检验若下假设: di为服从正态分布 N(μ,σ^2 )。

H0:μ=0←→H1:μ≠0,运用t检验得出结果,其拒绝域为:

?Sd?dntn?1(α/2)

d??di/n

S??(di?2Di?1nd)/(n-1)

?

首先计算评酒员对每一种样品酒的总分,再计算每一酒品样的十位评酒员评分平均值,然后再将两组评酒员所求得的平均值对应相减这样我们得出一组新的数据di。这样就消除了酒样不同的干扰。从而我们可以把d(看成正态分布N(μ,σ^2 )ii=1,2,3...n)的样本,其中μ是酒样的平均水平。

表1 评酒员的总分的均值 样品酒1 样品酒2 样品酒3 样品酒4 样品酒5

第1组白数据第2组白数据均值 均值 82 77.9 74.2 75.8 78.3 75.6 79.4 76.9 71 81.5 4

第1组红数据均值 68.1 74 74.6 71.2 72.1 第2组红数据均值 62.7 80.3 80.4 68.6 73.3

数学建模大赛论文葡萄酒质量分析 - 图文.doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
本文链接:https://www.diyifanwen.net/c9r68a4as6j1xep136oel_1.html(转载请注明文章来源)
热门推荐
Copyright © 2012-2023 第一范文网 版权所有 免责声明 | 联系我们
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ:xxxxxx 邮箱:xxxxxx@qq.com
渝ICP备2023013149号
Top