题目。学院。
专业。班级。
姓名。学号。
指导教师。实验日期。
摘要。本文针对葡萄酒的质量分析与评价问题,以置信区间、优势矩阵、逐步回归分析等方法和方差分析理论为基础,首先分别构建了以评酒员和样酒为组别的方差数据序列,通过进行双向显著性检验,接着通过置信区间法处理的数据进行了方差分析,并确定可信的评价组别。然后以评酒员感官评价为主、葡萄酒的理化指标为辅,采用回归分析、聚类分析、判别分析法建立葡萄分级模型,继而使用相关系数矩阵确立葡萄酒与葡萄理化指标中具有较大相关性的指标,实现对葡萄理化指标的初步筛选,进行等级划分。
再利用逐步回归的方法拟合酿葡萄酒理化指标与葡萄理化指标间一对多的函数关系得出二者之间的联系。最后通过上文函数关系,同时提取对香气与口感评分相关度较大的芳香物质,建立芳香物质与葡萄酒质量的函数关系,论证葡萄和葡萄酒的理化指标只在一定程度上对葡萄酒的质量有影响。
关键字:双向显著性检验;方差分析;置信区间;聚类分析;标准化;
一、问题重述。
确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的一级理化指标会在一定程度上反映葡萄酒和葡萄的质量。
附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:
1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?
2. 根据酿酒葡萄的一级理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4.分析酿酒葡萄和葡萄酒的一级理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的一级理化指标来评价葡萄酒的质量?
附件1:葡萄酒品尝评分表(含4个**)
附件2:葡萄和葡萄酒的一级理化指标(含2个**)
附件3:葡萄和葡萄酒的芳香物质(含4个**)
二、问题分析。
问题一的分析。
根据题意,葡萄酒的质量评价是通过评酒员的品评进行评分从而得到评价的,考虑到评酒员之间可能存在个人评酒风格等主观差异因素,若不同评酒员之间的主观因素差异过大,可能导致不同评酒员对于同一葡萄酒样的评价差异悬殊,影响酒样的质量鉴定,因此,需要对主观因素的影响程度进行检验。可采用方差分析对数据序列进行处理,通过将方差分析中的检验量与显著性水平f的检验值相比较从而验证差异性是否显著。
针对问题二。
首先我们结合问题一的结论(第二组的的的评价结果比较可靠),所以葡萄酒质量的评价结果就直接引用第二组,再结合酿酒葡萄的一级理化指标,进行主成分分析,得到十种主成分。然后通过聚类分析的原理,在spss实现对酿酒葡萄的分类。
针对问题三。
首先,我们分析酿酒葡萄与葡萄酒一级理化指标的数据发现一级理化指标基本相同,于是把相同的一级理化指标挑选出来。由于酿酒葡萄的一级理化指标远和葡萄酒的一级理化指标的单位不一致,我们可以通过matlab对所选出的一级理化指标进行标准化。然后在excel中对选出的标准化的一级理化指标之间进行数据分析。
从而得出葡萄酒一级理化指标与酿酒葡萄的一级理化指标图形,分析图形可得出葡萄酒一级理化指标与酿酒葡萄的一级理化指标的联系。
针对问题四。
首先我们知道,葡萄酒的一级理化指标若理想,葡萄酒的质量就较高;但葡萄的一级理化指标理想,葡萄酒的质量不一定高。因此我们在matlab中,运用相关分析,分别计算出葡萄酒的一级理化指标与葡萄酒质量的相关系数、葡萄的一级理化指标与葡萄酒质量的相关系数。然后通过对相关系数的比较,分析葡萄和葡萄酒的一级理化指标对葡萄酒质量的影响。
从而论证葡萄和葡萄酒的一级理化指标能否评价葡萄就的质量。
三、符号的假设。
表示评酒员对酒样的评价得分。
表示第i位评酒员对全部酒样评分的平均值。
表示第i位评酒员对全部酒样评分的标准差。
表示编号为j的酒样得分的平均值。
表示编号为j的酒样得分的标准差。
;表示评酒员对酒样的评分的标准化。
四、模型的建立与求解。
问题一的模型。
依据问题分折,考虑到评酒员间存在主观困素的差异,可能导致不同评酒员对于同一酒样的评价差异悬殊,影响酒样的质量鉴定,从而难以准确反映不同酒样间差异的显著性。
基于此,首先对评价结果的原始数据进行方差分析,验证对主观因素的假设分析;再分别应用标准化处理法和置信区间法,对两组评酒员的评价结果进行数据处理,以真实反映酒样间质量的差异,并据此比较两种处理方法的优劣。
1、基于原始数据显著性差异分析。
分别对4组数据进行双向方差分析,以此减少误差方差,同时分析不同评酒员之间是否存在显著的主观性评分差异。利用excel软件处理数据得到结果如表1所示。
表1中,ss表示误差平方和;df表示自由度;ms表示均方差;f表示显著性统计量;f-crit表示基于显著性水平为0.01的f统计量值。
差异源中“行”表示以评酒员为“区组”,元素为单个酒样的评分方差数据序列;“列”表示以酒样为“区组”.元索为单个评酒员对全部酒样的评分方差数据序列。
分析上表四组显著性检验数据,基于“行”与“列”的双向显著性差异检验中,八组数据序列的f统计量均大于基于显著性水平为0.01的f-crit,表示其差异性极显著。进一步比较数据大小可知,除第一组红葡萄酒评分的双向差异检验中“行区组”与“列区组”的差异性较为接近,另外三组的双向差异检验结果均表示“行区组”的差异性显著高于“列区组”,说明相较于各酒样之间质量造成的评价差异,评酒员之间因为主管因素在成的评价差异更显著。
2、基于标准化处理的显著性差异分析。
公式1)利用matlab软件对原始数据进行标准化处理,再对所得结果分别针对4组数据再次进行双向方差分析,所得结果如表2所示。
分析表2数据得到,对于四组“行”序列评价的数据序列,其求解到的f统计量均接近于0,远小于基于显著性水平为0.01的f-crit,剩余四组“列”序列评价的数据序列的f统计量仍保持大于基于显著性水平为0.01的f-crit,表示差异性仍属于极显著。
从数据层面上分析,相较于直接对原始数据进行方差分析得到的各序列的f统汁量,标准化处理后进行分析得到的“行”序列的f统计量显著减小另一方面“列”序列列应的f统计量数值上基本没有发生变化,数值上表示评酒员之间主观因素造成的评价差异已显著降低,而酒样之间质最差异的显著性则受影响不大。
3、基于置信区间法的显著性差异分析。
置信区间法通过确定指标的置信区间,并对不隶属置信区间内的值进行逐步调整,进而使得同类别的数据最终均处于置信区间内。
置信区间m =
公式2)利用matlab软件对数据进行处理。然后基于所得结果分别针对4组数据再次进行双向方差分析,所得结果如表3所示。
根据3结果可知,八组数据序列的f统计量均大于基于显著性水平为0.01的f-crit,表示其差异性极显著。相较于直接对原始数据进行方差分析得到的各序列的f统计量,基于置信区间法处理进行分析得到的“行”序列的f统计量整体上显著减小,同时“列”序列的f统计最整体上显著增大,数值上表示评酒员之间主观因素造成的评价差异已显著降低。
同时酒样之间质量导致的评价差异则显著提高。相较于标准化处理后的个序列的f统计量,基于置信区法处理的各组数据序列的f统计量均通过了显著性检验,且数据处理上没有出现标准化处理导致的数值错误问题。
数学建模课程设计
高速公路修建费用问题。摘要。本文研究了高速公路修建费用问题。在建设高速公路时,要求建造费用最小,这是个关于最优化求解的问题。根据不同地貌上建造成本的不同,找出a b两地高速路的最低建造成本路线。以确定最便宜的路线为目标建立了非线性规划模型来确定在各个地貌交界处的汇合点。建造总费用为各个地貌中建造公路...
数学建模课程设计
题目 服务机构劳务安排的优化设计。服务机构劳务安排的优化设计。摘要。生活中,我们会接触到各种各样的服务机构,就服务机构自身而言,不同的时间段内需要的服务量和需求量有显著的不同,而且不同时段对劳务的支付工资也有不同。本文主要站在管理者的角度,考虑在既要满足需要,又要尽量节约劳务开支的基础上如何设计才能...
数学建模课程设计
0840503220 苏阳。0840503224 张明。0840503226 郑景旻。影院座位设计。问题回顾 影院座位的满意程度主要取决于视角和仰角,视角是观众眼睛到屏幕上下边缘的视线的夹角,越大越好 仰角是观众眼睛到屏幕上边缘视线与水平线的夹角,太大使人的头部过分上仰,引起不适,一般要求仰角不超过...