摘要。对于问题一,我们首先对数据进行预处理,分别求出了第。
一、二组的评酒员对红白葡萄酒品尝评分的平均值,然后把问题转换成两独立样本的参数检验问题。考虑到两个独立样本分布形态不确定,我们采用非参数检验中的wilcoxon秩和检验判断样本是否有显著性差异,结果显示两组双侧渐近显著值分别为0.044,0.
022,均小于0.05,即两组评酒员的评价结果有显著性差异。对于可信度,我们是通过标准差来评判,标准差能反映一个数据集的离散程度。
计算得到的标准差值如表5.1.2.
3所示,第一组的标准差值均大于第二组,所以可信度比第一组要高。
对于问题二,我们通过spss软件运用聚类分析,将酿酒葡萄大致分为了四类,结果以表5.2.7,表5.
2.8显示。除此之外,我们根据主成分分析法,得到酿酒葡萄的主成分和权重,再计算出综合主成分值,进而对样品进行等级分类。
相比较而言,主成分分析法的等级分类更精确。
对于问题三,酿酒葡萄包含多个理化指标,我们首先根据问题二中主成分分析的成分矩阵表,对其简化得到了相关的主要指标。然后对酿酒葡萄的理化指标和葡萄酒的理化指标进行双变量相关性分析,得出二者的相关性关系如表5.3.
1,表5.3.2所示。
对于问题四,我们将附件一中的平均评分高低视为葡萄酒***坏,直接将酿酒葡萄和葡萄酒的理化指标的数据导入spss中,分别进行双变量分析,得出了理化指标与葡萄酒评分的相关性联系,如附录3 所示。结果发现,在影响白葡萄酒的质量上,白葡萄与白葡萄酒的理化指标皆对其影响不大,没有一个相关系数超过了0.5。
红葡萄酒的影响情况与白葡萄酒一样,但是红葡萄的ph值、果酸、褐变度与多酚化氧活力,这些指标对红葡萄的评分的影响较高,相关系数皆高于了0.5.所以,相对于酿酒葡萄而言,红葡萄的理化指标影响比白葡萄要大,因而不能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
关键词:非参数检验聚类分析主成分分析双变量相关性分析 spss
1问题重述。
葡萄酒的生产有着非常久远的历史,可上溯至几千年前,它是一种世界通畅性酒种,有着广泛交流的基础,现已发展成最主要的酒种之一。葡萄酒的感官分析又叫品酒、评酒,是指评酒员通过眼、鼻、口等感觉器官对葡萄酒的外观、香气、滋味及典型性等感官特性进行分析评定的一种分析方法。一方面,评酒员必须要抛开个人的喜好,排除时间、地点、环境和情绪等的影响,像一台精密的仪器一样进行感官分析;另一方面,因为葡萄酒的复杂多样及变化性,评酒员又必须充分发挥主观能动性,将获得的感觉与大脑中贮存的感官质量标准进行比较分析。
只有兼顾以上两个方面,才能保证结果的精确性。同时各个评酒员之间还必须保证分析结果的一致性。一致性和精确性是正确性的保证。
确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:
1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?
2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?
2问题分析。
问题一属于差异性和可信度的分析的数学问题。品酒员对每个葡萄酒样品打的分数不尽相。要想知道两组评酒员的评价结果有无显著差异,即可以通过观察两组评酒员这一因素对葡萄酒样品的评分的影响是否显著来达到目的。
为了更好地综合四个评分因素的差异性,增强结果的可信度,应首先对附件1数据进行处理,关于缺陷数据(附件一第一组红葡萄酒20),我们选取前后平均数补全。分别求出第。
一、二组的评酒员对红白葡萄酒品尝评分的平均值,然后把问题转换成两独立样本的参数检验问题。考虑到两个独立样本分布形态和方差值不确定,我们采用非参数检验中的wilcoxon秩和检验来判断样本是否有显著性差异。对于可信度,通过标准差来评判,标准差能反映一个数据集的离散程度,标准差越小,表明数据越聚集;标准差越大,表明数据越离散。
问题二中需要对葡萄进行分级,考虑到酿酒葡萄的多种理化性质和葡萄酒的综合评价指标,可以通过spss软件进行聚类分析得出酿酒葡萄大致分类,也可以用主成分分析法,得到酿酒葡萄的主成分和权重,再计算出葡萄样品的综合主成分值,进而对样品进行分类。通过比较两种方法的优劣,选择最佳分级方式。
对于问题三,酿酒葡萄包含多个理化指标,首先应对其简化得到相关的主要指标,建立一个多元对应模型。然后对酿酒葡萄的理化指标和葡萄酒的理化指标进行相关性分析,得出二者的相关性关系。
对于问题四,评酒员对葡萄酒的评价和葡萄酒的感官指标在一定程度上反应了葡萄酒的质量,利用spss软件进行双变量相关性分析,求出这些因素与葡萄酒质量的相关性,从而就可以得到他们之间的影响程度。
3 模型假设。
1.假设题目所给的数据真实可靠。
2.假设评酒员在评分时不受其他主观因素的影响。
3.假设红、白葡萄样品和红、白葡萄酒样品的选取是随机的,且其理化指标数据是服从正态分布的。
4.假设酿酒葡萄和葡萄酒的理化指标在一定时间内不发生改变。
5.假设两组评酒员是随机分配的。
6.假设酿造葡萄酒的环境是相同的。
4符号假设。
5模型的建立与求解。
5.1 问题一。
5.1.1数据预处理。
从附件一观察出,品酒员从葡萄酒样品的外观、香气、口感、平衡四个方面对葡萄酒进行评分。品酒员对每个葡萄酒样品打的分数不尽相。要想知道两组评酒员的评价结果有无显著差异,即可以通过观察两组评酒员这一因素对葡萄酒样品的评分的影响是否显著来达到目的。
为了更好地综合四个评分因素的差异性,增强结果的可信度,我们分别求出第一组、第二组的评酒员对红葡萄、白葡萄的平均值,处理的数据见表5.1.1,表5.
1.2,表5.1.
3,表5.1.4.
表5.1.1 第一组白葡萄酒。
表5.1.2第二组白葡萄酒。
表5.1.3第一组红葡萄酒。
表5.1.4第二组红葡萄酒。
5.1.2模型求解。
每一组评酒员对红葡萄、白葡萄的打分情况,可以将两组不同的打分情况视为两个独立样本,即可以把问题转换成两独立样本的参数检验问题。
观察两个总体是否存在显著性差异,有参数检验和非参数检验两种方式,但是t检验要求两个独立样本符合正态分布,且方差相同。相比较而言,非参数检验的适用范围更广,在此,我们采用非参数检验中的wilcoxon秩和检验,并给出该检验方法的结果。
5.1.2.1 wilcoxon秩和检验。
wilcoxon秩和检验是一种典型的非参数检验方式,对配对资料的差值采用符号秩方式来检验。它的检验步骤为:
a 提出原假设:两组评酒员的评价结果无显著性差异。
b 计算u统计量的p值。
c 作出判断:若p<,则拒绝原假设,即认为两个独立样本之间存在显著差异;若p>,则不能拒绝原假设,即认为两独立样品间不存在显著性差异。
分别将表1.1.1和1.
1.2,表1.1.
3和1.1.4导入sps中运用wilcoxon秩和检验得到u统计量的p值,如表5.
1.2.1(两组白葡萄酒),表5.
1.2.2(两组红葡萄酒)所示:
表5.1.2.1
表5.1.2.2
根据两表中的双侧渐近显著性(p)得前者为0.044,后者为0.022,均小于0.05,所以拒绝原假设,即两组评酒员的评价结果有显著性差异。
5.1.2.2可信度分析。
可信度的分析,即比较两组的样本数据的波动程度,在此,我们引入标准差这个指标来评判。标准差是量化数据离散程度的比较精确的指标。标准差值越小,该组别的数据波动程度越小,葡萄酒的评价解果趋向稳定,可信度越高;标准差值越大,该组别的数据波动程度越大,葡萄酒的评价结果差异越大,可信度越低。
我们计算了表5.1.1,表5.1.2,表5.1.3,表5.1.4的标准差值,结果如下表5.1.2.3
表5.1.2.3
由表5.1.2.3可得,第一组的标准差值均大于第二组,所以第二组的数据较稳定,可信度比第一组要高。
2023年进口葡萄酒累计
2012年进口葡萄酒累计4.3亿升。据海关统计,2012年我国累计进口葡萄酒4.3亿升,比上年 下同 增加8.9 价值25.7亿美元,增长18.1 进口平均 为每升6美元,8.5 2012年中国葡萄酒进口量显著提升。2012年我国进口葡萄酒商已由几年前的800家大幅增加至4000多家 据业内测算当前...
2023年葡萄酒展会串烧
2000年以来,我国会展业已渗透到各个经济领域,从机械 电子 汽车 建筑,到纺织 花卉 食品 家具,各行各业都有自己的国际专业展。近年来我国会展业总规模保持近20 的增长速度,展会数量由1000多个增加到5000多个。2007年,全国展览总面积近600万平方米。展览项目,1997年我国首次突破100...
2023年葡萄酒行业分析报告
2016年3月。目录。一 价值回归市场复苏 4 1 进口葡萄酒更加 亲民 蚕食国产酒份额 41 进口葡萄酒迅猛增长,更加亲民 4 2 蚕食国产酒市场份额 11 主流消费者发生了变化 12 海外直采和 零关税 政策导致进口葡萄酒的 走低 性价比凸显 132 国产葡萄酒回暖,巨头海外整合 15 1 国产...