摘 要
葡萄酒的质量是葡萄酒的一种特性,它是表示葡萄酒优秀的程度。复杂性和协调性构成了葡萄酒质量的主要属性。影响葡萄酒质量的因素有:品种及其与之相适应的生态条件、酿酒工艺、陈酿条件等;对葡萄酒的质量进行评价是通过感官指标和理化指标来实现的;葡萄酒成分的分析是通过化学法和仪器法,而葡萄酒的感官指标则是通过感官指标和理化指标来实现的;葡萄酒成分的分析是通过化学法和仪器法,而葡萄酒的感官指标则是通过视觉、嗅觉、味觉即感官分析来实现的;葡萄酒的感官分析可鉴别葡萄酒的品种、特性、产地,葡萄酒是否掺假等。
本文提出了一种可视化的方法评价葡萄酒质量。葡萄酒数据来自于评酒员的评价结果和认证阶段的物理化学分析。在WPS文档中运用公式编辑器和概率论中求期望和方差的方法,建立对应的评价模型.采用了 54个红葡萄酒样本和个56白葡萄酒样本用于口味质量评价。提出了多元数据图表示来可视化分类葡萄酒的新方法。实验结果证明图表示方法不仅分类效果好而且具有可视化的特点。结果表明该方法的效果优于传统的神经网络和支持向量机方法并且具有可视化的优点。这对于改进酿酒品酒评价和葡萄酒生产都有重要意义,并且对根据消费者口味细分目标市场也很有帮助。 关键词:
一、问题重述
葡萄酒是一种成分复杂的酒精饮料不同产地、年份和品种的葡萄酒成分不同。成分与葡萄酒的质量关系密切基于以下四个因素外观、香气、风味、总体质量或潜力是划分葡萄酒等级的重要依据。国内外普遍的是采用近红外光谱 和三维荧光光谱 等技术它的缺点是需要复杂的化学计量学知识而且解释困难。而通过测量葡萄酒的物理化学性质进而评估其质量应该是最有效的方法。理化实验室检验包括葡萄酒的酒精含量和PH值而质量评价主要依靠专家的感官。应该强调指出味道是最难理解的一种感官。因此葡萄酒质量分类是一项艰巨的任务。信息技术的进展使得搜集、存储和处理数据成为可能。数据挖掘、神经网络、模式识别、机器学习等技术都能在葡萄酒分类中应用。复杂的模型容易过拟合导致泛化能力减弱模型。神经网络、支持向量机两种方法均有参数可以调整,能获得令人满意的效果 1问题背景
在元代,葡萄酒深入千家万户之中,成为人们设宴聚会、迎宾馈礼以及日常品饮中不可缺置的饮料。许多史料中都有记载。需要说明的是,元代酿造葡萄酒的办法与前代不同。以前中原地区酿造葡萄酒,用的是粮食和葡萄混酿的办法,元代则是把葡萄捣碎入瓮,利用葡萄皮上带着的天然酵母菌,自然发酵成葡萄酒,葡萄酒是人类文明的结晶,它为全人类提供了一种神奇而浪漫的饮料,也为人类社会的生存和发展提供了幸福的源泉。至于葡萄酒的起源,这是个留待史学家们继续去挖掘和研究的学术问题。对于现代人来说最重要的是饮用葡萄酒是一种美好的享受。1.中国葡萄酒文化的背景以及重要性中国葡萄酒文化的背景以及重要性中国葡萄酒文化的背景以及重要性中国葡萄酒文化的背景以及重要性 构建有“中国印记”的葡萄酒文化“文化”应该是一个民族过去、现在和未来都一直有的,而其他民族却没有的东西,如本尼迪克特《文化模式》这本书的前言就讲,所谓文化就是一个民族不同于其他民族的东西。① 文化也可以说是围绕某种持续性的、坚持性的价值观念或者秩序的一种继承和不断充实,因此,文化也可以理解为是一个民族或者特定人群在精神层面的价值维护和追求。谈到酒,必谈酒文化。中华民族的酒文化可谓源远流长,起初酒与祭祀相关,发展到后来,节日庆典、出师祝捷、升迁、寿筵、结婚生子、接风离别,一直到现在的企业上市等场合,都少不了酒的影子。也就是说,酒已经不光作为一种有益健康的饮品出现,而更为重要的是它已经成为一种载体,起到以酒助兴、烘托气氛的作用。因此,酒也已演变成为了一种深具文化功能的饮品。中国传统酒文化中的酒“基因”(例如饮酒器皿、诗文词曲、酒史、
酒俗、酒礼、酒德等)无不体现出人们对于大到维护国家和民族自尊心,小到追求家庭和事业成功的传统价值观念,只不过酒作为载体被赋予了特殊的意义,因此可以说,在某种程度上,中国传统酒文化也正是中华民族传统价值观念的一种外延和体现。 葡萄酒文化是指以葡萄酒作为文化的载体,而使葡萄酒具有了文化内涵,主要指葡萄酒的生产技术、人们的心理意识和行为规范的总和,包括葡萄酒的酿造、斟饮方式与人体健康的关系等一系列葡萄酒科学知识,政府有关政策,营销战略、战术、葡萄酒文化交流以及与葡萄酒有关的文艺作品等。② 从广义上讲,葡萄酒文化包括几千年来不断改进和提高的葡萄栽培管理技术、葡萄酒酿造技术,法律制度,酒俗酒礼,饮酒器皿以及文人墨客所创作的与葡萄酒相关的书画、诗文词句等,狭义上的葡萄酒文化则仅是指葡萄酒品饮的礼节、风俗、佚闻等。如果把葡萄酒文化作为西方文化的“专利”,那么要问:中国有无葡萄酒及葡萄酒文化? 这个问题无论从典籍上还是事实上的答案都是肯定的,中国具有几千年栽培、种植葡萄和酿造酒的历史,从这个意义上,葡萄酒文化并非是西方文化的专利,它与中国酒文化是分不开的,需要指出的是它们经历的是一个既交织又脱离的历史进程, 进而形成了中国独特的葡萄酒文化现象。 中国酒文化是中国传统文化的重要组成部分,而作为中国酒文化重要组成部分的中国葡萄酒文化同样源远流长,博大精深,具有丰富的内涵,只是由于社会、政治、经济及中西文化交流等原因影响,中国的葡萄酒文化在近现代表现出一种特殊的文化现象,无论是葡萄酒的饮食和价值观念还是对葡萄酒的礼仪和服务观念方面,似乎都给我们以不洋不土、不雅不俗、不华不实、不创不传的感觉。 2问题提出 模型假设:
假设1、品尝的地点应满足以下要求:
(1). 适宜的光线充足、均匀的散射光;人工光源用日光灯类; (2). 无噪音:品尝场所应远离噪声源,最好是隔音的;
(3). 清洁卫生无异味:品尝场所应便于通风或排气,无任何异味;
(4). 保持使人舒适稳定的温度与湿度;
假设2、 葡萄酒品尝杯无色、透明、含铅量为9%左右的结晶玻璃制成;无任何印痕和气泡。 假设3、红葡萄酒最佳品尝温度14-18℃,白葡萄酒最佳品尝温度10-12℃; 模型建立
1据葡萄酒品尝数据利用概率论中期望和偏方差的知识可以解决第一个问题;
葡萄酒数据包括54个的红葡萄酒样本和56个的白葡萄酒样本。每位专家的葡萄酒质量分级介于极坏的 和非常优秀。 葡萄酒评价指标
区分好坏葡萄酒没有具体的绝对的量化标准.目前权威的葡萄酒评分系统主要是美国著名的葡萄酒评论家罗伯特·帕克帕克推崇的是葡萄酒100分制评分体系.以及大家俗称的3W1D也是世界葡萄酒评分系统中的权威。 帕克的100分制给葡萄酒的打分范围是50-100基于以下四个因素:外观、香气、风味、总体质量和潜力。极好的和极差的葡萄酒的样本都是少数的,评价为中间的葡萄酒样本最多。
一般帕克的评分系统会给每一款酒一个基础的分数50分。在50分的基础上按酒的质量特点加分。萄酒的颜色和外观值5分,应该澄亮透明、深颜色的酒可以不透明、有光泽、其颜色与酒的名称相符、色泽自然、悦目。然后酒香值15分取决于香气的浓度、复杂度和纯粹感香,气应该是葡萄的果香;比如赤霞珠的黑醋栗香气、黑比诺的樱桃香气、霞多丽的热带水果香气、发 酵的酒香、陈酿的醇香\\橡木桶陈酿及瓶内陈酿组成的香气、主要包括花香、果香、辛香料香、动物香、矿物香、动物香、焙烤香等香气类型这些香气应该平衡、协调、融
为一体、香气幽雅、令人愉快. 酒的口感和后味值20分好的葡萄酒其口感应该是舒畅愉悦的,各种香味应细腻、柔和酒、体丰满完整有层次感和结构感,果味、单宁、酒精、酸度、甘油、糖分均衡、余味绵长、最后酒的总体质量水平或者演化进步的潜力也就是说陈化的潜力值10分。
质量评估方法神经网络采用常见的神经网络方法目前比较优秀的分类方法。相对于传统分类方法的主要优点是的解总是全局最优的并且避免训练过程的局部最小值和过拟合问题。基本思想是首先将输入矢量通过核函数映射到高维空间然后寻找线性的最优分类面。它分为线性 广义线性 和非线性 三种基本形式。 的核心问题是惩罚因子和核函数参数。图表示可视化分类方法星点图又称雷达图或蜘蛛图是目前应用最广泛的对多元数据进行作图的方法 。由于星点图是将正交坐标轴重新安排为非正交的坐标轴即相交于圆心的径向坐标轴因此可以在二维平面上同时显示多维数据。从星点图的图表示可以看出特征排序很重要外相邻维之间的角度的作用也重要。星点图之所以能可视化就是因为星点图要求所有相邻维之间的角度的总和等于。多维数据进行多元图表示存在一个问题多维数据不同排列顺序对多元图表达的非唯一性。即对同一个多维数据一种特征排序会产生一种多元图不同的特征排序会产生不同的多元图。不同的多元图会产生不同的图形特征不同的图形特征分类性能必然有差别。因此固定某种特征排序再研究多元数据图表示问题更有意义。
质量评估方法。训练方法采用最小二乘法的算法,它速度快效果好。支持向量机是基于维理论和结构风险最小化提出的目前比较优秀的分类方法。相对于传统分类方法的主要优点是的解总是全局最优的并且避免训练过程的局部最小值和过拟合问题。基本思想是首先将输入矢量通过核函数映射到高维空间然后寻找线性的最优分类面。它分为线性 广义线性 和非线性 三种基本形式。 的核心问题是惩罚因子和核函数参数。惩罚因子控制最大间隔和最小训练错误率之间的平衡用于核空间上非线性可分的数据。常用的核函数包括线性核、多项式核、径向基函数核、核等核函数中的核函数参数应该正确设置。实验证明径向基核函数的分类结果较优实验时只选择它。训练时必须给出超参数惩罚因子和径向基函数核函数参数。图表示可视化分类方法星点图又称雷达图或蜘蛛图是目前应用最广泛的对多元数据进行作图的方法 。由于星点图是将正交坐标轴重新安排为非正交的坐标轴即相交于圆心的径向坐标轴因此可以在二维平面上同时显示多维数据。从星点图的图表示可以看出特征排序很重要外相邻维之间的角度的作用也重要。星点图之所以能可视化就是因为星点图要求所有相邻维之间的角度的总和等于。多维数据进行多元图表示存在一个问题线性判别分析的原因。由于需要估计的参数少而且没有超参数它广泛用于分类中并取得了很好的效果。此时测试样本被分类到具有最大后验概率的类别中即误分类的概率最小。应用贝叶斯理论这个规则表述如下如果所有的 那么指定属于类。这里是类概率密度函数 是类的先验概率。一般是未知的需要从训练样本中估计。假定数据分布是多元正态分布并且各类都有同样的协方差矩阵。排序分类器上述种分类方法都可以修改为回归方法。那么第个样本得到的结果就是一个回归值一般这个回归值和那个类别标签距离近第个样本就属于哪个类别。提出一种新的方法如下对于第个样本利用分类方法得到一个类别标签利用回归方法得到一个排序的预测值如果和 的绝对值小于阈值那么样本属于类否则样本属于距离预测值最近的类。例如第个样本的分类标签排序的预测值那么第个样本属于类别第个样本的分类标签排序的预测值那么第个样本属于类别。仿真实例红葡萄酒个理化性质可视化平行坐标图如图所示。红葡萄酒的主成分可视化图如图所示其中 分别表示第类到第类。。从图看出这几类数据的在很多理化
性质上几乎相同只有第个变量游离二氧化硫和第个变量总二氧化硫不同这说明这两个理化性质大大影响口味。从输入变量分析第个变量硫酸盐的增加可能与发酵营养有关在改善酒的香味上这是非常重要的第个变量酒精度的增加倾向于导致更好的质量评价第个变量挥发酸有负面影响。从主成分可视化图上看出各类大大混叠在一起。从图和图可看出葡萄酒质量评价是个非常困难的分类任务
为了确保分类性能公平比较并避免训练集和测试集的依赖指标分类器错误率的估计采用交叉验证取次独立实验的平均结果。即红、白葡萄酒数据各进行了次实验。整个系统采用软件编程实现设计思想。实验结果如表所示。表葡萄酒质量评价结果质量评估方法平均错误率方差红葡萄酒白葡萄酒神经网络支持向量机图表示可视化分类排序分类器从表中可以看出提出的排序分类器获得了最好的分类结果。白葡萄酒数据的分类难度大于红葡萄酒支持向量机的分类效果优于神经网络。红葡萄酒的神经网络、支持向量机和图表示可视化分类方法的耗时分别为 和白葡萄酒的神经网络、支持向量机和图表示可视化分类方法的耗时分别为 和 。提出的图表示分类器无论效率和效果都优于支持向量机和神经网络。结束语目前的质量评估方法基于专家的经验和知识偏于主观。提出的方法是基于客观数据驱动的可考虑集成到一个决策支持系统中。只有在专家的质量评价大大偏离系统预测值时可再度品尝评价。一旦挖掘出某些变量和质量评价的关系就能够在葡萄酒生产阶段对某些变量加以控制以使口味更好。
相关推荐: