多元统计分析方法在白酒香型识别中的应用

白酒是世界主要蒸馏酒品种之一,中国白酒历史悠久,是宝贵的民族遗产[1]。白酒分析手段目前进入新的发展阶段,获得了令人瞩目的成果,包括常规检测技术、谱技术等在内的众多分析检测手段,以揭示白酒的风味与白酒中微量成分及其量比的联系。白酒风味物质研究已成为行业研究的大趋势[2]。
经研究证明,白酒风味组成极其复杂,组分种类很多,迄今为止从白酒中检测到的微量风味化合物有1 000余种[3]。白酒中的微量成分十分丰富,不同产品中的香气种类和含量差异很大,这也是决定白酒香气、口感和风格的关键所在[4],但受研究条件的限制,对全部微量成分进行准确的定量或定性尚有一定困难。多变量统计分析作为一种数理统计分析手段,已经越来越多的应用于酒类风味特征的研究中[5]。目前,所涉及的统计分析软件最为广泛的是SPSS软件。该软件在酒类风味特征研究中的应用方法主要有:主成分分析、聚类分析和判别分析等。
1 分析方法
1.1 主成分分析
主成分分析是在空间数据中出几个能够控制所有变量的主成分,将数据从高维空间降至低维,从而使数据处理更为简便[6]。一般提取特征值大于1或累计方差贡献率大于80%的因子为主成分,故提取出来的主成分包含了原始数据的大部分信息[7]。在对数据进行主成分分析后,以主成分的得分做图即可得到所有样本的二维或三维PCA投影图,样本间的关系即可较好的表现出来,进而实现样本的
分类[7]。
1.2 聚类分析
简便且直观,广泛应用于指纹图
谱研究。其基本原理是按照一定准则
将具有相同或相似性的物质聚为一类,
例如采用欧式距离计算相似度后,通
过ward最小方差法进行系统聚类等;
聚类分析在白酒香型、风格等的归类
和区分上有很好的应用[8]。
1.3 判别分析
是根据事物特点的特征值及其所
属的类按照一定的准则求出判别函数,
根据判别函数对事物进行分类的一种
分析方法[9]。
2 研究内容
本文以酱香型白酒、浓香型白酒
及清香型白酒为研究对象,采用气相
谱分析技术对白酒微量风味组分进
行有效检测,谱数据以多元统计学
为基础,通过主成分分析(PCA)、聚
类分析、判别分析等方法对三种不同
香型白酒成分间的复杂量比关系进行
分析,建立了一种主流白酒香型评判
模型。
2.1 白酒香味组分的气相谱分析
采用气相谱技术对3种主流香
型白酒进行关键组分剖析,探索主流
香型白酒微量风味特征之间的差异性,
查相关数据库以及相关应用文献报
告的方式,到主流香型白酒差异性
特征标识,为主流香型白酒分类提供
数据理论支撑。
2.1.1 材料与方法
2.1.1.1 仪器
气相谱仪,氢火焰离子化检测
器;谱柱:DNP-土温谱柱。
2.1.1.2试验样品
从市场中取不同香型的白酒样品,
主要香型数量为,酱香型白酒12个,
清香型白酒3个,以及浓香型白酒17
个,其他香型1种,共计33个样品。
2.1.1.3 溶液配制
(1)内标溶液。取一定质量的叔戊
醇、乙酸正戊酯等,以体积分数60%
的乙醇溶液定容于50 mL容量瓶中,
备用。
(2)样品处理。准确吸取一定量样
品于10 mL比管中,加入一定量内
标溶液,混合均匀后,进样分析。
(3)仪器条件设定。谱柱温度:
初温40 ℃:分流比:20∶1;进样量:
1 μL;进样口温度250 ℃;检测器温
度230 ℃;载气流速1 mL/min;保持
1 min,然后以4 ℃/min升温至130 ℃,
再以20 ℃/min升温至200 ℃,并保
持5 min。
2.1.2 数据处理方法
利用计算机IBM SPSS Statistics
2.0软件对数据进行主成分分析、聚类
分析、判别分析并进行交叉验证。
2.2 主成分分析
主成分分析(Principal Component
Analysis,PCA)也称主分量分析,
旨在利用降维的思想,把多指标转
化为少数几个综合指标[11]。将33种
白酒香味组分分析数据导入SPSS软
件,对原始数据进行标准化处理即可
得到主成分分析结果。一般来说,由
协方差矩阵出发求解主成分分析所
得结果与由相关矩阵出发求解主成
分所得结果有很大不同。对于度量
单位不同的指标或取值范围彼此差异
非常大的指标,不能直接由协方差矩
多元统计分析方法在白酒香型识别中的应用
□ 王允中 罗安来 王淑军 中国食品发酵工业研究院有限公司国家食品质量监督检验中心
摘 要:通过气相谱法分析33种不同香型白酒中己酸乙酯、乙酸乙酯、乳酸乙酯等14种主体香气成分的含量,利用SPSS软件对数据进行主成分分析、聚类分析以及判别分析,共提取3个白酒风味主成分,累计方法贡献率达到82.437%;通过对白酒主要成分进行聚类分析、判别分析,建立了3个典型的
判别函数,通过交叉验证,可以实现对抽取不同香型白酒样品的100%正确判别,该方法为白酒香型划分以及白酒真伪鉴别提供了借鉴。
关键词:白酒香型;主成分分析;聚类分析;判别分析
阵出发进行主成分分析,而应该考虑将数据标准化,即从相关矩阵出发求解。对于同度量单位或取值范围在同量级的数据还是直接从协方差矩阵 求解。
2.2.1 数据验证
通过KMO检验法和Bartlett球
型检验验证法进行因子分析的适用
性检验。由表1可知,KMO值等于
0.736>0.6,说明指标间存在一定
的相关性。Bartlett球型检验结果为
513.394,Sig值为0.000<0.05,说
明各个指标变量之间是相关的,两项
结果检验均表明了该数据适用因子分
析法。
由原来的14个指标变量通过正交变换,产生14个新变量,每个新变量可以解释的原始变量的总方差比100%。由表2可知,前3个主成分解
释了全部方差的82.437%,说明提取
的3个主成分能够代表原来14个白酒
主成分评价白酒风味物质有一定的说
服力。提取的3个主成分分别定义为:
Y1,Y2,Y3。
2 解释的总方差
由表2可知主成分1的特征值为:5.954,开根号后结果为:2.440 819;主成分2的特征值为:3.986,开根号后结 1.602,开根号后结果为:1.265 701 3;
通过计算可得各主成分权重系数如表3。
根据表3中的数据,可得出以下方程。
Y=42.527Y123
Y1=0.360X1+0.302X2+0.363X3+
0.338X4+0.023X5+0.202X6+0.361X7+
0.097X8-0.075X9-0.194X10+0.249X11-
表3 主成分权重系数
主成分
各成分的权重系数
X3X7X1X13X4X14X2X11X12X9X8X10X5X6
Y10.3630.3610.3600.3580.338-0.3130.3020.249-0.144-0.0750.097-0.1940.0230.202 Y2-0.0570.1240.090-0.1300.0910.2530.1390.2590.4480.4230.4140.3370.2830.232 Y30.0510.020-0.19-0.1100.268-0.2080.0530.198-0.055-0.187-0.220.3060.619-0.48
0.144X12+0358X13-0.313X14
Y2=0.09X1+0.139X2-0.057X3+0.091X4+ 0.283X5+0.232X6+0.124X7+0.414X8-0.423X9+0.337X10+0.259X11+0.448X12-0.13X13+0.253X14桥梁博士
Y3=-0.19X1+0.053X2+0.051X3-
0.208X4+0.619X5-0.48X6+0.02X7-
0.22X8-0.187X9+0.306X10+0.198X11-
0.055X12-0.11X13-0.208X14
由碎石图图1可以得出,特征值
高于1的上面有3个特征点,说明有
3个主成分。
图1 主成分分析碎石图
由表4及公式得出,乙酸乙酯、乙缩醛、乙醛、乳酸己酯、正丙醇、己酸乙酯、甲醇、异戊醇8个指标的系数绝对值大于其他指标系数绝对值,说明这些醇酯质是白酒的第一主成分。
第二主成分Y2中,戊酸乙酯、正丁醇、
异丁醇、丁酸乙酯4个指标系数绝对
值大于其他指标系数绝对值,说明这
些综合性风味物质指标反映了白酒风
味的其他特征。主成分Y3中,仲丁醇、
异戊醛2个指标系数绝对值大于其他
指标系数绝对值,为第三次要主成分。
表4 14种风味物质的成分矩阵
序号风味物质成分矩阵
123 1乙酸乙酯0.885-0.1130.064 2乙缩醛0.8800.2470.025 3乙醛0.8790.179-0.231 4乳酸乙酯0.874-0.259-0.139 5正丙醇0.8260.1810.339 6己酸乙酯-0.7640.504-0.263 7甲醇0.7360.2780.067 8异戊醇0.6090.5170.251 9戊酸乙酯-0.3510.895-0.070 10正丁醇-0.1830.845-0.237 11异丁醇0.2370.827-0.277 12丁酸乙酯-0.4730.6720.388 13仲丁醇0.0570.5640.784 14异戊醛0.4920.463-0.608
2.2.4 主成分得分和综合得分
公称抗拉强度
表5是根据主成分方程计算的主成分得分和以各个主成分方差贡献率占3个主成分总方差贡献率的比率为
权重计算的综合得分,从主成分得分和综合得分来看:主成分1综合得分
比较高的是酱香型白酒、其次是清香
型白酒、浓香型白酒最低。说明酱香型白酒中主成分1中的风味物质含量较为丰富。主成分2综合得分比较高
的是浓香型白酒,说明浓香型白酒中主成分2中的风味物质含量较为丰富。主成分3综合得分相对较高的是清香
型白酒,但3种香型白酒在主成分3
表5 主流香型白酒主成分得分和综合得分
白酒香型
主成分1综合得分主成分2综合得分主成分3综合得分综合得分均值排名酱香型白酒
合肥五里墩立交桥2.938
-0.306-0.13
114.85
1浓香型白酒
-2.1560.394
-0.23-82.7852
清香型白酒
0.013-2.393-0.007-67.7867
风险投资论文3
表6 聚类分析表
序号风味物质成分矩阵1
2
3
1
乙醛
54.20
15.4045.602甲醇
32.00
8.6012.303乙酸乙酯240.90193.2066.804正丙醇220.1011.9027.105
仲丁醇
6.300.50  3.606异戊醛  3.70
0.50  4.90
7
乙缩醛
54.1011.5037.608异丁醇17.408.4037.509
正丁醇7.500.5015.7010丁酸乙酯7.30
0.50
20.60
11
异戊醇
46.8028.7043.3012戊酸乙酯0.50
0.50
11.8013乳酸乙酯137.80145.1067.6014己酸乙酯
2.800.50245.90中的综合得分均不高,因此说明主成分3中的风味物质在3种香型白酒中含量均较少。从综合得分来看,酱香型白酒为正值,且远远高于浓香型白酒及清香型白酒,综合说明酱香型白酒具有多种风味物质成分,这为白酒香型鉴别提供了依据。
2.3 K -均值聚类分析及系统聚类 分析
通过K -均值聚类分析结果(表6
和图2)发现,聚类数量为3类时,风味物质成分能够明显区分出来,第一类别:乙酸乙酯、正丙醇、乳
酸乙酯含量较高,己酸乙酯含量较低,符合酱香型白酒风味特点;第二类别:乙酸乙酯、乳酸乙酯含量较高,正丙醇、乙酸乙酯含量较低,符合清香型白酒风味特点;第三类
别:己酸乙酯含量较高,乙酸乙酯、正丙醇、乳酸乙酯含量均较低,符合浓香型白酒风味特点。通过系统聚类分析结果发现,系统聚类分析可以明显区分酱香型白酒、浓香型白酒、清香型白酒。其中小部分浓香型白酒被系统聚类为单独体,可能原因是不同浓香型白酒品牌差异较大,风味物质含量具有明显性差异,数据样本量本身较少,因此系统聚类存在一定
误差。
重新调整距离聚类合并
酱香    28
酱香    30酱香    27酱香    29酱香      4酱香      5酱香      2酱香      1酱香    33酱香    26酱香    25酱香    31清香      7清香    24清香      8浓香    15浓香    16浓香    14浓香    17浓香    11浓香    12浓香    23浓香    32浓香      9浓香      9浓香    20复合    22浓香    13浓香      6浓香    10浓香      3浓香    18董香    21
使用平均联接(组间)的树状图
图2 聚类分析树状图
查阅相关文献得出乙酸乙酯易挥
发,有水果香,是清香型白酒的主体香气成分,丁酸乙酯在感官特征上呈现泥味,较高的己酸乙酯含量,可以赋予白酒醇甜甘冽的特点,提高适口性,适当的乳酸乙酯含量可以增加白酒的浓厚感,消除水味[12]。
2.4 线性判别分析(LDA )
以主成分y 1、y 2、y 3为原始变量,
利用SPSS 进行判别分析,得到3个典型判别函数(见表7),根据3个判
别函数与质心的距离,与某一类白酒香型的质心最近,就判定该样品为该香型。
表7 Fisher 的线性判别式函数
主成分分组函数系数组1
组2
组3
Y 1
Y 2Y 3
55.191-44.09216.066-20.47916.592-7.134-10.061
7.925-4.295常量-34.480-22.449
-5.318
表8 分类结果交叉验证
分组
1
2
彩视错觉3
合计初始
计数
1
1000
102
0150
15
3
0022未分组的案例
2
11
4百分比
11000
010*******
1003
0100100未分组的案例
502525100交叉验证
计数
110001020150
15
3
02中国继续教育联合学院
2%
11000010020100
1003
0100
100
由图3可知,来自3种不同香型
的28个样品可以根据判别函数划分为
不同的区域,分组1(蓝)代表酱香
型白酒,分组2(黄)代表浓香型白
酒,分组3(绿)与质心(黑)重合,代表清香型白酒,四个红未分组案例依据三种不同质心的距离,明显划分类别。
图3 判别分析分组图
2.5 判别结果验证
将酱香型白酒提取2种样品假定
为香型未知,将浓香和清香型白酒各
提取1种样品假定为香型未知,利用
上述主成分分析方法及判别函数模型
进行该样品香型验证,结果如下表8。
利用上述模型可知,28个白酒样品,依据不同香型全部正确溯源,4个未知香型白酒,判别结果正确,交叉验证正确率100%。
3 结论
本文利用SPSS 2.0统计软件对33
个不同香型白酒14种风味指标进行主成分分析,共提取3个白酒风味主成分,
累计方法贡献率达到82.437%;通过对白酒主要成分进行聚类分析、判别分析,建立了3个典型的判别函数,通过交叉验证,可以实现对不同香型
白酒样品的100%正确判别,为白酒香型划分提供了借鉴方法。参考文献
[1]汪梦琼.基于品牌战略的白酒企业投资价值分析[D].上海:华东理工大学,2013:1-25.
[2]范文来,徐岩.中国白酒风味物质研究的现状与展望[J].酿酒,2007,34(4):31-37.
[3]郭兆阳,刘明,钟其顶,等.主成分分析OAV 值评价白酒风味组分的研究[J].食品工业,2011(7):79-83.
[4]侯利刚.对中国白酒微量香味成分的研究[J].中小企业管理与科技(下旬刊),2012(1):319.
[5]周全.几种多元统计分析方法及其在生活中的应用[D].荆州:长江大学,2012:10-16.
[6]郎江涛.面向高维数据的PCA-Hub 聚类方法研究[D].重庆:重庆大学,2017:5-16.
[7]明红梅,董瑞丽,许德富,等.主成分分析法在大曲质量评价体系中的应用[J].中国酿造,2010(8):120-123.
[8]汤丹剑,黄晓春,娄永江.聚类分析在白酒鉴别中的应用[J].宁波大学学报:理工版,1998(4):22-26.
[9]霍丹,张苗苗,侯长军,等.基于主成分分析和判别分析的白酒品牌鉴别方法[J].农业工程学报,2011,27(14):297-301.
[10]王超.指纹图谱质量评价系统[D].成都:四川大学,2005:3-15.
[11]尹建军,饶静.多变量统计分析技术在白酒风味特征研究中的应用[J].酿酒科技,2010(11):57-60.
[12]陈华,郁志勇,朱国斌.中国白酒香型的化学模式识别(Ⅰ)——主成分分析和因子分析[J].食品科学,2000(7):42-47.
作者简介:王允中(1990—),男,汉族,湖南汨罗人,硕士,工程师。研究方向:食品加工与安全、数据分析。
通信作者:罗安来(1989—),女,满族,辽宁台安人,硕士,工程师。研究方向:营养与食品安全。

本文发布于:2024-09-21 14:49:13,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/376191.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:白酒   成分   风味   香型   研究
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议