CN106560696A - 联合近红外和稳定同位素检验的武夷岩茶产地鉴别方法 - Google Patents
联合近红外和稳定同位素检验的武夷岩茶产地鉴别方法 Download PDFInfo
- Publication number
- CN106560696A CN106560696A CN201610915253.0A CN201610915253A CN106560696A CN 106560696 A CN106560696 A CN 106560696A CN 201610915253 A CN201610915253 A CN 201610915253A CN 106560696 A CN106560696 A CN 106560696A
- Authority
- CN
- China
- Prior art keywords
- data
- sample
- stable isotope
- tea
- origin
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/359—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/3563—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing solids; Preparation of samples therefor
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N27/00—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N27/00—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
- G01N27/62—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating the ionisation of gases, e.g. aerosols; by investigating electric discharges, e.g. emission of cathode
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2132—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on discrimination criteria, e.g. discriminant analysis
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/02—Agriculture; Fishing; Forestry; Mining
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Immunology (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Pathology (AREA)
- Analytical Chemistry (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Business, Economics & Management (AREA)
- Electrochemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Human Resources & Organizations (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Computer Hardware Design (AREA)
- Strategic Management (AREA)
- Geometry (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- Economics (AREA)
- Mining & Mineral Resources (AREA)
- Marine Sciences & Fisheries (AREA)
- Animal Husbandry (AREA)
- Agronomy & Crop Science (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明涉及联合近红外和稳定同位素检验的武夷岩茶产地鉴别方法,属于地理标志产品真实性识别技术领域,其目的在于解决单种检测数据无法代表产地溯源全部关键信息和不同类型检测数据在计量学方法中联合使用的数据匹配等问题。本发明基于偏最小二乘判别模型,将不同产地岩茶(包括地理标志产地内和产地外岩茶)近红外特征光谱数据、稳定同位素数据以及二者联合数据,按相同方法建立分析模型,提取试样后利用模型客观、准确的判定岩茶产地,二者融合数据所建的模型,其识别率最高,达100.0%,远高于单种数据建立的PLSDA判别结果,且对盲样的识别率达100%,具有较好应用前景,可作为武夷岩茶产地溯源识别技术方法。
Description
(一)技术领域
本发明涉及联合近红外和稳定同位素检验的武夷岩茶产地鉴别方法,属于地理标志产品真实性识别技术领域。
(二)背景技术
根据GB/T 17924-2008的定义,地理标志产品是指利用产自特定地域的原材料,按照传统工艺在特定地域内所生产的,质量、特色或者声誉在本质上取决于其原产地域地理特征,并按法定程序经审核批准以原产地域名称命名的产品。茶叶具有明显的地域特色和品质特征,品质、口感与其产地的地理条件、气候因素、环境等因素密切相关,市场认可度和消费者喜爱程度也各有不同,是典型的地理标志保护产品。国家质检总局对特定区域内的茶叶进行原产地域产品的地理标识,如武夷岩茶、安溪铁观音、大红袍、永春佛手、西湖龙井、安吉白茶、祁门红茶、普洱茶、碧螺春茶等近50种地理标志产品茶叶。
目前,国内外已开展成品茶产地识别鉴定研究,仪器检测结合化学计量学分析方法为最主要产地识别方法,仪器检测方法主要有近红外光谱、同位素质谱、液相色谱、传感器等;常用计量学方法包括偏最小二乘、主成分分析、人工神经网络、支持向量机等。
近红外光谱检测技术广泛应用茶叶原产地检测中,Zhou等利用近红外光谱仪对25个西湖龙井和70个浙江龙井样品进行检测并建立费氏判别函数模型,训练集合、交叉验证集合和测试集合的识别准确率分别96.7%、95.3%和96.7%。周健等对4个龙井茶品种(龙井43、群体种、迎霜和乌牛早)进行近红外检测,并采用PLS建立模型,其对定标集的559个样本的识别准确率分别为89.8%、90.9%、96.1%和99.5%,而对验证集的279个未知样本的识别准确率分别为87.1%、84.2%、96.1%和97.5%。占茉莉等采用近红外光谱仪扫描10份西湖龙井和18份浙江龙井茶叶样品,聚类分析表明,西湖龙井茶具有独特特征而自成一类,缙云和新昌表现出类似光谱特征存在交叉,富阳产的也自成一类。赵杰文等采用近红外光谱仪对龙井、碧螺春、毛峰和铁观音(各30份)进行检测,并采用主成分建立预测模型,校正集和预测集的鉴别准确率分别为98.75%和95.0%,但龙井样品易误判为碧螺春。陈全胜等采用近红外光谱对龙井、碧螺春、铁观音和祁门红茶进行检测,并建立SIMCA(基于主成分分析的一种分类方法)判别模型,龙井、碧螺春、祁门红茶和铁观音的识别准确率分别为90%、80%、100%和100%;李晓丽等对西湖龙井、浙江龙井、羊岩勾青、雪水云绿和庐山云雾茶(各30份)进行近红外检测,并采用主成分分析法建立模型,除西湖龙井和浙江龙井存在部分重叠外,其余均能很好的区分。
同位素是所有生物的一个自然标签,与生物的生长环境密切相关,因此同位素质谱(IRMS)为茶叶原产地识别提供科学的、可靠的鉴别方法。IRMS目前已经广泛应用在各种农产品的原产地检测中,Tamara等测定了43份印度、23份斯里兰卡和12份中国茶叶中稳定同位素,非线性分析表明茶叶原产地的判定易受判别函数的影响,很好的区分不同国家产区的茶叶。等利用同位素质谱和核磁共振光谱,结合主成分分析,能够理想地鉴别斯洛文尼亚三个不同地区的红酒。Brescia等利用IRMS测定牛奶中的δ13C、δ15N和Ba元素含量,区分了不同原产地的牛奶,证明了IRMS适用于乳制品。Martinelli等对来自美国、南美、欧洲和澳大利亚的气泡葡萄酒进行同位素检测,发现具有显著差异。
从上述例子可以看出,国内外对地理标志产品的鉴别方法已有很多,但是很多研究尚有不足之处,如采样不充分样品数量少,无法保证样品的准确性和代表性;样品空间选择跨度大,往往选自不同国家、不同地区,本身就具有很大的区别;再加之甚至选择了不同品种样品进行比较,不同品种间本身差异较大,因此这类鉴别方法对小范围的地理标志产品产地判别借鉴意义不大;建模方法采用单种检测数据结合计量学方法进行,单种检测数据无法代表产地溯源的全部信息,导致产地识别率较低,上述这些严重影响了地理标志产品保护技术的创新和突破。针对如上情况,有必要建立联合近红外和稳定同位素检验方法的武夷岩茶产地鉴别方法,所述方法结合近红外特征光谱检测方法和稳定同位素检测方法二种检验方法,将近红外特征光谱数据和稳定同位素特征变量数据联合在一起,并采用偏最小二乘PLSDA模型对其进行分析,建立具有高识别率的武夷岩茶产地识别模型。
(三)发明内容
本发明目的在于解决单种检测数据无法代表产地溯源的全部关键信息以及不同类型检测数据在计量学方法中的联合使用所存在的数据匹配等问题,提供一种联合近红外光谱数据和稳定同位素数据的武夷岩茶产地识别模型鉴别方法,该方法基于偏最小二乘判别模型,将不同产地岩茶(包括地理标志产地内和产地外岩茶)近红外特征光谱数据和稳定同位素数据融合在一起,建立分析模型,提取试样后利用模型客观、准确的判定岩茶产地。
本发明采用的技术方案是:
联合近红外和稳定同位素检验的武夷岩茶产地鉴别方法,所述方法包括:
(A)采集不同产地岩茶样品:
武夷岩茶产区外样品数>100份,且产区周边50公里范围内样品占比>50%;武夷岩茶产区内样品数为产区外样品的2~3倍,采样范围覆盖主要产区各生产企业,且每家企业应不少于3个样品;
(B)测定不同产地岩茶样品的近红外特征光谱数据:
近红外检测参数:64次扫描,特征光谱条带为64次扫描的平均值,扫描范围为12000-4000cm-1,数据点的间隔为1.928cm-1,采集时室温控制在25℃,湿度保持稳定,每个样本的光谱采集1次;本发明近红外检测仪器采用的是德国布鲁克TENSOR37,所有样品采用无损检测,无需采用粉碎等前处理,采用相同加料方法、加料量(目测),加料完毕即可进行检测。
(C)测定不同产地岩茶样品的氢、氧、氮、碳四种稳定同位素质谱数据:
δ13C、δ15N、δ18O、δ2H、δ86Sr等稳定同位素含量测定,每个样品至少重复分析3次以上,取平均值作为最终结果。
通过SVM-RFE(支持向量机回归特征消去法)对武夷岩茶稳定同位素数据进行训练和预测,随机重复100次,并对各变量的模型特征进行排序,筛选出岩茶原产地的同位素特征变量,其排序顺序为氢、氧、氮、碳、锶。并利用预测集计算模型的灵敏度、分辨率、识别率,均按重复计算100次平均结果,氢、氧、氮、碳四种数据组成的模型,其识别率最高,达93.93%,因此建模只需要选择氢、氧、氮、碳四种数据,无需对锶等其他稳定同位素含量进行检测。
(D)联合近红外和稳定同位素建立不同产地岩茶鉴别数据库:
(1)将每条近红外数据(Y轴数据)拼接在Excel数据表格中,每行所有列数据组成每条近红外数据;
(2)将每个样品的稳定同位素数据按氢、氧、氮、碳顺序拼接在近红外数据后,武夷岩茶产区内样品组成的Excel数据表,以data1命名;武夷岩茶产区外样品组成的Excel数据表,以data2命名;
(3)运行MATLAB软件中的edit功能,打开data1.xls、data2.xls,以Mat文件格式保存,文件名对应为data1.mat、data2.mat;
(4)数据分割:参考R.W.Kennard和L.A.Stone在Computer aided design ofexperiments中的方法,随机选取武夷岩茶产区内总数的65~70%作为原产地内模型数A1,随机取武夷岩茶产区外65~70%作为原产地外模型数A2,建立kenstone分割程序,其设计思路为:首先计算两两样本之间距离,选择距离最大的两个样品;然后分别计算剩余的样本与已选择的两个样本之间的距离;对于每个剩余样本而言,其与已选样品之间的最短距离被选择,然后选择这些最短距离中相对最长的距离所对应的样本,作为第三个样品;重复上述步骤,直至所选的样品的个数等于事先确定的数目为止。
(5)蒙特卡洛交叉验证(Monte Carlo cross vali-dation,MCCV)是筛选奇异样本的方法,用于解决复杂统计模型和矩阵高维问题,其核心是对样本的抽取,从给定的目标函数分布中进行高效抽样为其关键;随机选取一定的校正集建立偏最小二乘模型,剩余的样本作预测集对模型进行验证,经过多次循环后能够得到一组预测残差,通过预测残差计算出预测残差的均值与方差,判断异常样本并验证剔除异常样本对模型精度提高作用,可有效检出光谱阵和性质阵方向的奇异点。
(6)偏最小二乘法鉴别模型的建立:对步骤(4)和(5)分割后的近红外及稳定同位素数据,采用偏最小二乘法分析并建立PLSDA模型;
(E)取待测未知产地样品按照步骤B和C测定近红外特征光谱数据和稳定同位素质谱数据,将测得数据代入上述PLSDA模型,若预测结果小于0,则判断待测样品为武夷岩茶产地外样品;若预测结果大于0,则判断待测样品为武夷岩茶产地内样品。
具体的,所述步骤(D)中分割程序分别为:[model1,test1]=kenstone(data1,A1)和[model2,test2]=kenstone(data2,A2),得到model1、test1、model2、test2。
偏最小二乘法的建模思路:能够在自变量存在严重多重相关性的条件下进行回归建模,在偏最小二乘回归模型中,设法去掉不太重要的相关性变量,剩余的自变量回归系数将更容易解释,且更易于辨识系统信息与噪声,避免将本应保留的系统信息舍弃。具体的,所述步骤(D)中偏最小二乘法鉴别模型的建立过程如下:
(a)合并训练集:xxxc=[data1(model1,:);data2(model2,:)];
(b)合并预测集:xxxp=[data1(test1,:);data2(test2,:)];
(c)求训练集平均光谱:mx=mean(xxxc);
(d)训练集减去平均光谱:xxxc=xxxc-ones(A,1)*mx;
A为:A1+A2;
(e)预测集减去平均光谱:xxxp=xxxp-ones(B,1)*mx;
B为:原产地内测试集数B1与原产地外测试集数B2之和;
(f)响应变量:yyc=-ones(A,2);yyc(1:A1,1)=1;yyc(A1+1:A,2)=1;
A1与B1之和为原产地内样品总数C1;
A2与B2之和为原产地外样品总数C2;
(g)最大隐变量数:lvm=20;
(h)分二列学习,用蒙特卡罗交互验证确定隐变量lvp:
[epmccv1,lvp1]=mccvforpls(xxxc,yyc(:,1),lvm);
[epmccv2,lvp2]=mccvforpls(xxxc,yyc(:,2),lvm);
(i)建模过程:
[betattt,www,BETAPLS1]=plsbasetotal(xxxc,yyc(:,1),lvp1);
[betattt,www,BETAPLS2]=plsbasetotal(xxxc,yyc(:,2),lvp2);
cy=[xxxc*BETAPLS1(:,lvp1),xxxc*BETAPLS2(:,lvp2)];
py=[xxxp*BETAPLS1(:,lvp1),xxxp*BETAPLS2(:,lvp2)];
[rrt,cyy]=max(cy′);
[rwwrt,pyy]=max(py′);
(j)计算训练过程中模型的灵敏度和分辨率:
err01=length(find(cyy(1:A1)=1))/A1;
err02=length(find(cyy(A1+1:A1+A2)=2))/110;
(k)计算预测未知样品过程中模型的灵敏度和分辨率:
err1a=length(find(pyy(1:B1)=1))/B1;
err1b=1-length(find(pyy(B1+1:B1+B2)=1))/B2;
(l)保存预测结果:save cyy cyy;save pyy pyy;
(m)py的第一列即为预测结果。
可画图给出详细结果:
bar(cy(:,1));
figure
bar(py(:,1))
其中kenstone程序如下所示:
其中mccvforpls程序如下所示:
其中plsbasetotal程序如下所示:
本发明的有益效果主要体现在:本发明基于偏最小二乘判别模型,将不同产地岩茶(包括地理标志产地内和产地外岩茶)近红外特征光谱数据和稳定同位素数据联合在同一数据表格中,建立分析模型,提取试样后利用模型客观、准确的判定岩茶产地,其识别率高,达100.0%,远高于单种数据PLSDA结果。
(四)具体实施方式
下面结合具体实施例对本发明进行进一步描述,但本发明的保护范围并不仅限于此:
实施例1:
A、采集不同产地岩茶样品
国标(GB/T 18745-2006)中规定了武夷岩茶的地理保护范围,即福建省武夷山市行政区划内,本发明在武夷岩茶地理标志保护区武夷街道、崇安街道、上梅、星村、五夫、岚谷、新丰街道、洋庄、兴田、下梅、吴屯11个行政区域内进行样品采集,每个行政区域内随机选择3个取样点(以A、B、C进行标示),共33个取样点,取样范围基本涵盖主要产区,每个采样点取样15份(以A-1、A-2......A-15标示),获得495份地理标志保护区武夷岩茶样品,另在福建省除武夷山市外其他县市(建阳、建瓯、漳州、泉州、松溪、政和),以及广西、贵州、江西(婺源、赣州)等11个地点收集保护区外岩茶样品,每个地点取样15份(分别以1、2......15进行标示),获得165个非地理标志保护区岩茶样品。地理标志产地内样品数与地理标志产地外样品数之比为3∶1。
B、不同产地岩茶近红外特征光谱数据
本发明近红外检测仪器采用的是德国布鲁克TENSOR37,所有样品采用无损检测,无需采用粉碎等前处理,采用相同加料方法、加料量(目测),加料完毕即可进行检测,光谱为64次扫描的平均值,扫描范围为12000-4000cm-1,数据点的间隔为1.928cm-1,采集时室温控制在25℃,湿度保持稳定,每个样本的光谱采集1次。表1为15个上梅A样品部分近红外数据表,其中x轴为波长范围,Y轴为吸光度。
表1:15个上梅A样品部分近红外数据表
C、不同产地岩茶氢、氧、氮、碳四种稳定同位素质谱数据
δ13C、δ15N、δ18O、δ2H、δ86Sr由Thermo Fisher MAT253稳定同位素质谱仪测定,每个样品至少重复分析3次以上,取平均值作为最终结果。地理标志产区内、外部分岩茶样品同位素比率见表2。
表2:部分岩茶样品同位素比率统计表
通过SVM对武夷岩茶稳定同位素数据进行训练和预测,随机重复100次,并对各变量的模型特征进行排序,筛选出岩茶原产地的同位素特征变量,各稳定同位素对于原产地特征的贡献率从高到低分别为氢、氧、氮、碳、锶,同位素氢的识别率增维最高,其次为氧、氮、碳、锶。并通过预测集计算每一维变量累加之后的模型增维精度。同位素数据特征增维精度(包括分辨率,灵敏度,识别率),均按重复计算100次平均结果,得到表3同位素特征变量组合结果情况。
表3:同位素特征变量组合结果情况
由表3可知,当氢和氧的同位素数据进行组合后,模型识别率下降,说明氧和氢对原产地特征的贡献具有较强的相关性;而加入碳和氮同位素数据后,模型识别率上升,达到93.93%,说明氮和碳具有较好的互补,因此建模只需选择氢、氧、氮、碳四种数据,建模中无需增加锶的数据,在实际检测中,同位素锶的含量无需检测。
D、联合近红外和稳定同位素建立不同产地岩茶鉴别数据库
(1)将每条近红外数据拼接在Excel数据表格中,每行所有列数据组成每条近红外数据。
(2)将每个样品的稳定同位素数据按氢、氧、氮、碳顺序拼接在近红外数据中,地理标志产区内样品组成495行、4152列(近红外Y轴数据共4148列,增加4列依次为氢、氧、氮、碳稳定同位素数据)的Excel数据表,以data1命名;地理标志产区外样品组成165行、4152列的Excel数据表,以data2命名。
(3)运行MATLAB软件中的edit功能,打开data1.xls、data2.xls,以Mat文件格式保存,文件名对应为data1.mat、data2.mat;
(4)数据分割:参考R.W.Kennard和L.A.Stone在Computer aided design ofexperiments上所述方法,原产地内随机取330(A1)个样品作为模型,原产地外随机取110(A2)个样品作为模型,建立kenstone分割程序,[model1,test1]=kenstone(data1,330)和[model2,test2]=kenstone(data2,110),得到model1、test1、model2、test2。
(5)偏最小二乘法鉴别模型的建立:对步骤(4)数据分割后的融合近红外和稳定同位素的数据,采用偏最小二乘法分析并建立PLSDA模型。
E、取待测未知产地样品按照上述步骤B和C,测定近红外特征光谱数据和稳定同位素质谱数据,将测得数据代入上述PLSDA模型,若预测结果小于0,则判断待测样品为武夷岩茶产地外样品;若预测结果大于0,则判断待测样品为武夷岩茶产地内样品。
具体的,所述步骤(D)中分割程序分别为:[model1,test1]=kenstone(data1,A1)和[model2,test2]=kenstone(data2,A2),得到model1、test1、model2、test2。
偏最小二乘法的建模思路:能够在自变量存在严重多重相关性的条件下进行回归建模,在偏最小二乘回归模型中,设法去掉不太重要的相关性变量,剩余的自变量回归系数将更容易解释,且更易于辨识系统信息与噪声,避免将本应保留的系统信息舍弃。具体的,所述步骤(D)中偏最小二乘法鉴别模型的建立过程如下:
①合并训练集:xxxc=[data1(model1,:);data2(model2,:)];
②合并预测集:xxxp=[data1(test1,:);data2(test2,:)];
③求训练集平均光谱:mx=mean(xxxc);
④训练集减去平均光谱:xxxc=xxxc-ones(440,1)*mx;
⑤预测集减去平均光谱:xxxp=xxxp-ones(220,1)*mx;
⑥响应变量:yyc=-ones(440,2);yyc(1:330,1)=1;yyc(331:440,2)=1;
⑦最大隐变量数:lvm=20;
⑧分二列学习,用蒙特卡罗交互验证确定隐变量lvp:
[epmccv1,lvp1]=mccvforpls(xxxc,yyc(:,1),lvm);
[epmccv2,lvp2]=mccvforpls(xxxc,yyc(:,2),lvm);
⑨建模过程:[betattt,www,BETAPLS1]=plsbasetotal(xxxc,yyc(:,1),lvp1);
[betattt,www,BETAPLS2]=plsbasetotal(xxxc,yyc(:,2),lvp2);
cy=[xxxc*BETAPLS1(:,lvp1),xxxc*BETAPLS2(:,lvp2)];
py=[xxxp*BETAPLS1(:,lvp1),xxxp*BETAPLS2(:,lvp2)];
[rrt,cyy]=max(cy′);
[rwwrt,pyy]=max(py′);
⑩计算训练过程中模型的灵敏度和分辨率:
err01=length(find(cyy(1:330)=1))/330;
err02=length(find(cyy(331:440)=2))/110;
计算预测未知样品过程中模型的灵敏度和分辨率:
err1a=length(find(pyy(1:165)=1))/165;
err1b=1-length(find(pyy(166:220)=1))/55;
保存预测结果:save cyy cyy;save pyy pyy;
py的第一列为预测结果,小于0为原产地外样品,大于0为原产地内样品,画图给出详细结果:
bar(cy(:,1));
figure
bar(py(:,1));
F、PLSDA模型识别率
按上述建模方法分别对近红外光谱、稳定同位素以及二者融合数据进行建模分析,其结果见表4。
表4:PLSDA分类模型判别结果汇总
各特征指标之间具有互补性,采用本发明PLSDA建模方法分别对近红外光谱、稳定同位素以及二者融合数据进行分析,其识别率不同,近红外和稳定同位素二者融合数据的识别率最高,达100.0%,远高于单种数据PLSDA结果。
实施例2:
盲样检测:盲样监督小组从武夷岩茶农户处购买岩茶样品,监控晒青、做青、杀青等步骤,确保岩茶样品的原产地域属性,上述样品作为盲样中的地理标志产区内样品;从建阳、建瓯、婺源等地购买岩茶,作为盲样中的地理标志产区外样品,上述盲样与建模岩茶样品出自不同的厂家。分析检测人员事先未能得知待测盲样的产地属性,随机选取若干份,检测,再按本发明方法对盲样产地属性进行判断,并与盲样监督小组进行核对,确定盲样识别率。
分别选取20、60、100个盲样,按照上述实施例1步骤B和C方法获得的盲样数据代入上述PLSDA模型,判断其地理标志属性,其判别识别率均达到100.0%。
实施例3:
采用与实施例1相同的建模方法,数据分割用Kenstone分割程序,用蒙特卡洛交互验证,分别建立偏最小二乘(PLSDA)、神经网络ELM和最小二乘支持向量机(LS-SVM)模型,近红外数据不变,稳定同位素按照氢、氧、氮、碳、锶拼接在近红外数据后,其模型识别率分别为97.3%、90.7%、82.3%。
实施例4:
采用与实施例1相同的建模方法,数据分割用Kenstone分割程序,用蒙特卡洛交互验证,分别建立PLSDA、神经网络ELM和最小二乘支持向量机(LS-SVM)模型,近红外数据不变,稳定同位素按照氢、氧、氮、碳拼接在近红外数据后,其模型识别率分别为100.0%、86.3%、80.3%。
实施例5~9:
实施例5-9中所述的岩茶样品、稳定同位素数据与实施例1相同,但采用不同的分析方法;实施例5-6采用本发明权利保护范围外的情况;实施例7-9分别采用现有发明专利CN103630528A(申请号201210307144.2)、CN102455320A(申请号201010526790.9)、CN103245713A(申请号201310095950.2)所述方法进行鉴别,比较情况见表5。
表5:实施例1与实施例5~9比较情况表
从上述比较结果可以得出,采用本发明方法,其盲样检测率达100.0%,可作为武夷岩茶产地溯源识别技术方法。
Claims (4)
1.联合近红外和稳定同位素检验的武夷岩茶产地鉴别方法,所述方法包括:
(A)采集不同产地岩茶样品:
武夷岩茶产区外样品数>100份,且产区周边50公里范围内样品占比>50%;武夷岩茶产区内样品数为产区外样品的2~3倍,采样范围覆盖主要产区各生产企业,且每家企业应不少于3个样品;
(B)测定不同产地岩茶样品的近红外特征光谱数据:
近红外检测参数:64次扫描,特征光谱条带为64次扫描的平均值,扫描范围为12000-4000cm-1,数据点的间隔为1.928cm-1,采集时室温控制在25℃,湿度保持稳定,每个样本的光谱采集1次;
(C)测定不同产地岩茶样品的氢、氧、氮、碳四种稳定同位素质谱数据:
δ13C、δ15N、δ18O、δ2H、δ86Sr等稳定同位素含量测定,每个样品至少重复分析3次以上,取平均值作为最终结果;
通过SVM-RFE(支持向量机回归特征消去法)对武夷岩茶稳定同位素数据进行训练和预测,随机重复100次,并对各变量的模型特征进行排序,筛选出岩茶原产地的同位素特征变量,其排序顺序为氢、氧、氮、碳、锶;并利用预测集计算模型的灵敏度、分辨率、识别率,均按重复计算100次平均结果,氢、氧、氮、碳四种数据组成的模型,其识别率最高,达93.93%,因此建模只需选择氢、氧、氮、碳四种数据,无需对锶等其他稳定同位素含量进行检测;
(D)联合近红外光谱数据和稳定同位素建立不同产地岩茶鉴别数据库:
(1)将每条近红外数据拼接在Excel数据表格中,每行所有列数据组成每条近红外数据;
(2)将每个样品的稳定同位素数据按氢、氧、氮、碳顺序拼接在近红外数据中,武夷岩茶产区内样品组成的Excel数据表,以data1命名;武夷岩茶产区外样品组成的Excel数据表,以data2命名;
(3)运行MATLAB软件中的edit功能,打开data1.xls、data2.xls,以Mat文件格式保存,文件名对应为data1.mat、data2.mat;
(4)数据分割:随机选取武夷岩茶产区内总数的65~70%作为原产地内模型数A1,随机取武夷岩茶产区外65~70%作为原产地外模型数A2,建立kenstone分割程序;
(5)最小偏二乘法鉴别模型的建立:对步骤(4)数据分割后的近红外及稳定同位素数据,采用偏最小二乘法分析并建立PLSDA模型;
(E)取待测未知产地样品按照步骤B和C测定近红外特征光谱数据和稳定同位素质谱数据,将测得数据代入上述PLSDA模型,若预测结果小于0,则判断待测样品为武夷岩茶产地外样品;若预测结果大于0,则判断待测样品为武夷岩茶产地内样品。
2.如权利要求1所述的方法,其特征在于所述步骤(D)中分割程序分别为:[model1,test1]=kenstone(data1,A1)和[model2,test2]=kenstone(data2,A2),得到model1、test1、model2、test2。
3.如权利要求1所述的方法,其特征在于所述步骤(D)中偏最小二乘法鉴别模型的建立过程如下:
(a)合并训练集:xxxc=[data1(model1,:);data2(model2,:)];
(b)合并预测集:xxxp=[data1(test1,:);data2(test2,:)];
(c)求训练集平均光谱:mx=mean(xxxc);
(d)训练集减去平均光谱:xxxc=xxxc-ones(A,1)*mx;
A为:A1+A2;
(e)预测集减去平均光谱:xxxp=xxxp-ones(B,1)*mx;
B为:原产地内测试集数B1与原产地外测试集数B2之和;
(f)响应变量:yyc=-ones(A,2);yyc(1:A1,1)=1;yyc(A1+1:A,2)=1;
A1与B1之和为原产地内样品总数C1;
A2与B2之和为原产地外样品总数C2;
(g)最大隐变量数:lvm=20;
(h)分二列学习,用蒙特卡罗交互验证确定隐变量lvp:
[epmccv1,lvp1]=mccvforpls(xxxc,yyc(:,1),lvm);
[epmccv2,lvp2]=mccvforpls(xxxc,yyc(:,2),lvm);
(i)建模过程:
[betattt,www,BETAPLS1]=plsbasetotal(xxxc,yyc(:,1),lvp1);
[betattt,www,BETAPLS2]=plsbasetotal(xxxc,yyc(:,2),lvp2);
cy=[xxxc*BETAPLS1(:,lvp1),xxxc*BETAPLS2(:,lvp2)];
py=[xxxp*BETAPLS1(:,lvp1),xxxp*BETAPLS2(:,lvp2)];
[rrt,cyy]=max(cy′);
[rwwrt,pyy]=max(py′);
(j)计算训练过程中模型的灵敏度和分辨率:
err01=length(find(cyy(1:A1)==1))/A1;
err02=length(find(cyy(A1+1:A1+A2)==2))/110;
(k)计算预测未知样品过程中模型的灵敏度和分辨率:
err1a=length(find(pyy(1:B1)==1))/B1;
err1b=1-length(find(pyy(B1+1:B1+B2)==1))/B2;
(l)保存预测结果:save cyy cyy;save pyy pyy;
(m)py的第一列即为预测结果。
4.如权利要求1所述的方法,其特征在于本发明所述偏最小二乘PLSDA建模方法对近红外和稳定同位素的二者融合数据进行建模分析,模型识别率最高,达100.0%,远高于单种数据PLSDA判别结果;针对20、60、100个盲样,检测识别率均达100.0%,本发明方法可作为武夷岩茶产地溯源识别技术方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201610915253.0A CN106560696A (zh) | 2016-10-20 | 2016-10-20 | 联合近红外和稳定同位素检验的武夷岩茶产地鉴别方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201610915253.0A CN106560696A (zh) | 2016-10-20 | 2016-10-20 | 联合近红外和稳定同位素检验的武夷岩茶产地鉴别方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN106560696A true CN106560696A (zh) | 2017-04-12 |
Family
ID=58485787
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201610915253.0A Pending CN106560696A (zh) | 2016-10-20 | 2016-10-20 | 联合近红外和稳定同位素检验的武夷岩茶产地鉴别方法 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN106560696A (zh) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN107357805A (zh) * | 2017-05-25 | 2017-11-17 | 广州讯动网络科技有限公司 | 基于相似度判别法的近红外光谱物质含量索引方法、设备及介质 |
| CN110907369A (zh) * | 2019-12-04 | 2020-03-24 | 中国计量大学 | 一种融合不同检测方法特征变量的武夷岩茶产地鉴别方法 |
| CN111024802A (zh) * | 2019-12-26 | 2020-04-17 | 中国水产科学研究院黄海水产研究所 | 基于铅Pb稳定同位素的刺参产地溯源模型构建及鉴别方法 |
| CN119474983A (zh) * | 2024-11-11 | 2025-02-18 | 清华大学 | 基于多模态的茶叶做青程度检测方法、装置、设备及介质 |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN101303296A (zh) * | 2008-06-20 | 2008-11-12 | 中国农业科学院茶叶研究所 | 地理标志保护的西湖龙井的真伪鉴别方法 |
| US20120109758A1 (en) * | 2007-07-16 | 2012-05-03 | Vanessa Murdock | Method For Matching Electronic Advertisements To Surrounding Context Based On Their Advertisement Content |
| CN103630528A (zh) * | 2012-08-27 | 2014-03-12 | 深圳出入境检验检疫局食品检验检疫技术中心 | 一种利用茶叶中元素含量鉴别茶叶产地的方法 |
| CN104450698A (zh) * | 2014-12-11 | 2015-03-25 | 中国计量学院 | 一种蜘蛛线粒体nd4基因全序列扩增引物及鉴定方法 |
-
2016
- 2016-10-20 CN CN201610915253.0A patent/CN106560696A/zh active Pending
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20120109758A1 (en) * | 2007-07-16 | 2012-05-03 | Vanessa Murdock | Method For Matching Electronic Advertisements To Surrounding Context Based On Their Advertisement Content |
| CN101303296A (zh) * | 2008-06-20 | 2008-11-12 | 中国农业科学院茶叶研究所 | 地理标志保护的西湖龙井的真伪鉴别方法 |
| CN103630528A (zh) * | 2012-08-27 | 2014-03-12 | 深圳出入境检验检疫局食品检验检疫技术中心 | 一种利用茶叶中元素含量鉴别茶叶产地的方法 |
| CN104450698A (zh) * | 2014-12-11 | 2015-03-25 | 中国计量学院 | 一种蜘蛛线粒体nd4基因全序列扩增引物及鉴定方法 |
Non-Patent Citations (2)
| Title |
|---|
| ANNA KUTYLA-OLESIUK 等: "Evaluation of organoleptic and texture properties of dried apples by hybrid electronic tongue", 《SENSORS AND ACTUATORS B:CHEMICAL》 * |
| 言思敏: "地理标志产品武夷岩茶的产地识别技术研究", 《中国优秀硕士学位论文全文数据库农业科技辑》 * |
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN107357805A (zh) * | 2017-05-25 | 2017-11-17 | 广州讯动网络科技有限公司 | 基于相似度判别法的近红外光谱物质含量索引方法、设备及介质 |
| CN107357805B (zh) * | 2017-05-25 | 2020-07-17 | 广州讯动网络科技有限公司 | 基于相似度判别法的近红外光谱物质含量索引方法及装置 |
| CN110907369A (zh) * | 2019-12-04 | 2020-03-24 | 中国计量大学 | 一种融合不同检测方法特征变量的武夷岩茶产地鉴别方法 |
| CN111024802A (zh) * | 2019-12-26 | 2020-04-17 | 中国水产科学研究院黄海水产研究所 | 基于铅Pb稳定同位素的刺参产地溯源模型构建及鉴别方法 |
| CN119474983A (zh) * | 2024-11-11 | 2025-02-18 | 清华大学 | 基于多模态的茶叶做青程度检测方法、装置、设备及介质 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN106560698A (zh) | 基于多种检测技术的植物产地鉴别方法 | |
| CN106560692A (zh) | 联合四种检验技术的武夷岩茶产地鉴别方法 | |
| CN106560700A (zh) | 能自动鉴别武夷岩茶产地的机器学习方法 | |
| CN106560693A (zh) | 基于偏最小二乘判别的武夷岩茶产地鉴别方法 | |
| CN106560697A (zh) | 联合近红外光谱和微量元素的武夷岩茶产地鉴别方法 | |
| CN106560691A (zh) | 具有深度学习功能的武夷岩茶产地鉴别方法 | |
| Chen et al. | Rapid measurement of total acid content (TAC) in vinegar using near infrared spectroscopy based on efficient variables selection algorithm and nonlinear regression tools | |
| CN106560699A (zh) | 用于武夷岩茶产地鉴别的联合检测方法 | |
| CN103033486B (zh) | 陈皮及广陈皮药材质量的近红外光谱监控方法 | |
| CN106560694A (zh) | 基于多种检验技术的武夷岩茶产地智能鉴别方法 | |
| CN101975788B (zh) | 低场核磁共振鉴别食用油品质的方法 | |
| CN106560695A (zh) | 联合三种检测方法的武夷岩茶产地鉴别方法 | |
| CN106560704A (zh) | 联合同位素和微量元素检验的武夷岩茶产地鉴别方法 | |
| CN104020129A (zh) | 一种基于近红外光谱结合氨基酸分析技术的工夫红茶发酵质量的判别方法 | |
| CN104062259B (zh) | 一种采用近红外光谱快速测定复方阿胶浆中总皂苷含量的方法 | |
| CN106560841A (zh) | 基于深度学习的武夷岩茶产地鉴别方法 | |
| CN103091274B (zh) | 近红外漫反射光谱测定注射用丹参多酚酸水分含量的方法 | |
| CN101995389A (zh) | 一种由近红外光谱快速识别原油种类的方法 | |
| CN106560696A (zh) | 联合近红外和稳定同位素检验的武夷岩茶产地鉴别方法 | |
| CN106932463A (zh) | 一种快速、无损的茶叶产地鉴定方法 | |
| CN105740898A (zh) | 一种利用光谱特征向量结合主成分分析建立分类模型的方法 | |
| CN105717066B (zh) | 一种基于加权相关系数的近红外光谱识别模型 | |
| CN105372200A (zh) | Sbs改性沥青改性剂含量快速检测方法 | |
| CN101957316B (zh) | 一种用近红外光谱技术鉴别响水大米的方法 | |
| CN106560701A (zh) | 基于五隐藏层的武夷岩茶产地深度学习系统 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20170412 |
|
| WD01 | Invention patent application deemed withdrawn after publication |