推荐厂家
暂无
暂无
[b][size=18px][font=宋体]1[/font][font=宋体]、背景介绍[/font][/size][/b][font=宋体] 随着微机电技术的发展,近几年,便携式[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱仪[/color][/url]被广泛应用于食品、饮料、医药、煤炭等各个领域,相较于传统的大型傅里叶变换光谱分析系统,其具有结构简单、成本低廉、携带方便、结果实时可见等优势,目前已成为光谱领域的热门产品。但是便携式[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱仪[/color][/url]易受光源、检测器、使用方法、环境条件等影响,使得采集的光谱数据稳定性差,精度低,进而造成预测结果不稳定、预测准确率低等问题。[/font][font=宋体] 为了解决上述问题,提升便携式[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]分析结果的稳定性及准确性,目前行业内[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]数据建模优化工作,主要集中于数据源筛选、预处理算法优化、模型筛选算法优化等基于PLS算法的单模型建模优化工作,此类建模算法主要适用于高精度的傅里叶[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱仪[/color][/url]。对于自身硬件分辨率较低的便携式[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱仪[/color][/url],适用性较差。因此本帖在基于PLS算法建模的基础上,提出多模型加权预测的方法,以特定准则选取相对稳定、准确率较高的若干个光谱模型,结合模型自身系数进行加权预测的方式来提升便携式[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱仪[/color][/url]整体性能,进而提升便携式[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱仪[/color][/url]的预测稳定性及准确率。[/font][b][size=18px][font=宋体]2[/font][font=宋体]、方法解析[/font][/size][font=宋体]2.1[/font][font=宋体]样本集合划分[/font][/b][font=宋体] 使用便携式[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱仪[/color][/url]采集400个待测样品,采用Kennard Stone(K-S)算法对样本进行划分,将样本划分为训练集(200个)、验证集(100个)、盲测集(100个)、避免人为划分样本的主观性。[/font][b][font=宋体]2.2[/font][font=宋体]光谱预处理[/font][/b][font=宋体] 便携式[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱仪[/color][/url]采用常规的单一预处理方式效果不佳,本贴采用双预处理嵌套的方式对样品进行处理,其中第一级、第二级预处理均可设置不同的预处理参数,通过不同预处理方式,预处理参数的设置可以获取多种预处理结果。[/font][align=center][img=双预处理嵌套,690,325]https://ng1.17img.cn/bbsfiles/images/2023/09/202309042103332831_7122_5075516_3.png!w690x325.jpg[/img][/align][b][font=宋体]2.3[/font][font=宋体]光谱建模[/font][/b][font=宋体] [url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]定量分析建模方法包括多元线性回归([/font][font='Times New Roman',serif]MLR[/font][font=宋体])、主成分回归([/font][font='Times New Roman',serif][url=https://insevent.instrument.com.cn/t/jp][color=#3333ff]PCR[/color][/url][/font][font=宋体])、偏最小二乘回归([/font][font='Times New Roman',serif]PLS[/font][font=宋体])、人工神经网络([/font][font='Times New Roman',serif]ANN[/font][font=宋体])和支持向量机([/font][font='Times New Roman',serif]SVM[/font][font=宋体])等。其中,[/font][font='Times New Roman',serif]PLS[/font][font=宋体]算法应用最为广泛,选用[/font][font='Times New Roman',serif]PLS[/font][font=宋体]算法进行建模。通过多种预处理结果、不同[/font][font='Times New Roman',serif]PLS[/font][font=宋体]主成分数选择组合建立多个光谱定量分析模型,若设定一级预处理为[/font][font='Times New Roman',serif]M[/font][font=宋体]种,二级预处理为[/font][font='Times New Roman',serif]N[/font][font=宋体]种,[/font][font='Times New Roman',serif]PLS[/font][font=宋体]主成分数选择为[/font][font='Times New Roman',serif]T[/font][font=宋体]种,则通过不同排列组合可以建立合计[/font][font='Times New Roman',serif]M*N*T[/font][font=宋体]个光谱定量分析模型。[/font][align=center][img=多种建模方式,690,198]https://ng1.17img.cn/bbsfiles/images/2023/09/202309042104079253_7276_5075516_3.png!w690x198.jpg[/img][/align][b][font=宋体]2.4[/font][font=宋体]光谱模型选择[/font][/b][font=宋体] 基础模型一:在上述建立的大量光谱定量分析模型中,选择光谱模型最通用的两大表征系数,即模型相关系数([/font][font='Times New Roman',serif]R2[/font][font=宋体]值)以及均方根误差([/font][font='Times New Roman',serif]RMSECV[/font][font=宋体]值)进行基础模型筛选,选择模型相关系数最大的模型为基础模型[/font][font='Times New Roman',serif]A[/font][font=宋体],模型均方根误差最小的模型为基础模型[/font][font='Times New Roman',serif]B。[/font][font=宋体] 基础模型二:在基础模型一中引入验证集,通过训练集建立的多个光谱模型对验证集进行预测,将预测值与验证集标定值进行计算,获取偏差值,选择偏差值最小的光谱模型为基础模型[/font][font='Times New Roman',serif]C。[/font][align=center][img=基础模型C,690,264]https://ng1.17img.cn/bbsfiles/images/2023/09/202309042104332526_3725_5075516_3.png!w690x264.jpg[/img][/align][font=宋体] 基础模型三:在基础模型二中引入准确率,在近红外快检的实际应用中,对于预测偏差值在一定阈值范围内的样本定义为准确预测样本,若超出阈值则为预测错误样本,选择准确率最高的光谱模型为基础模型[/font][font='Times New Roman',serif]D。[/font][align=center][img=基础模型D,690,235]https://ng1.17img.cn/bbsfiles/images/2023/09/202309042104460652_3475_5075516_3.png!w690x235.jpg[/img][/align][b][font=宋体]2.5[/font][font=宋体]权重系数计算[/font][/b][font=宋体] 光谱模型不同,对盲测样本的预测能力不同,结合光谱模型的模型相关系数([/font][font='Times New Roman',serif]R2[/font][font=宋体]值)或者均方根误差([/font][font='Times New Roman',serif]RMSECV[/font][font=宋体]值)计算各个模型的预测权重,以模型相关系数为例:[/font][align=center][font='Times New Roman',serif]Ti=Ri/(R1+R2+R3+R4)[/font][/align][font=宋体] 其中,[/font][font='Times New Roman',serif]R1[/font][font=宋体]为基础模型[/font][font='Times New Roman',serif]A[/font][font=宋体]的模型相关系数,[/font][font='Times New Roman',serif]R2[/font][font=宋体]为基础模型[/font][font='Times New Roman',serif]B[/font][font=宋体]的模型相关系数,依此类推。[/font][font='Times New Roman',serif]Ti[/font][font=宋体]为各个基础模型对应权重系数。[/font][b][font=宋体]2.6[/font][font=宋体]多模型加权预测[/font][/b][font=宋体] 分别采用光谱基础模型[/font][font='Times New Roman',serif]A[/font][font=宋体]、[/font][font='Times New Roman',serif]B[/font][font=宋体]、[/font][font='Times New Roman',serif]C[/font][font=宋体]、[/font][font='Times New Roman',serif]D[/font][font=宋体]对盲测集[/font][font='Times New Roman',serif]100[/font][font=宋体]个样本进行预测,以盲测集单个样本为例,四个光谱模型对应获取四个预测值[/font][font='Times New Roman',serif]a[/font][font=宋体]、[/font][font='Times New Roman',serif]b[/font][font=宋体]、[/font][font='Times New Roman',serif]c[/font][font=宋体]、[/font][font='Times New Roman',serif]d [/font][font=宋体],结合权重系数计算最终单一预测值[/font][font='Times New Roman',serif]S[/font][font=宋体]:[/font][align=center][font=宋体][/font][/align][align=center][font='Times New Roman',serif]S=a*T1+b*T2+c*T3+d*T4[img=多模型加权预测,690,212]https://ng1.17img.cn/bbsfiles/images/2023/09/202309042106560595_5692_5075516_3.png!w690x212.jpg[/img][/font][/align][b][size=18px][font=宋体]3[/font][font=宋体]、实际应用[/font][/size][font=宋体]3.1[/font][font=宋体]硬件信息[/font][/b][font=宋体] 硬件设备为四川长虹研发的[/font][font='Times New Roman',serif]PV800-III[/font][font=宋体]便携式[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱仪[/color][/url],光谱仪波段范围为[/font][font='Times New Roman',serif]1350nm-2150nm[/font][font=宋体],采样间隔为[/font][font='Times New Roman',serif]6nm[/font][font=宋体],尺寸为[/font][font='Times New Roman',serif]Φ100mm×76.8mm[/font][font=宋体],重量约[/font][font='Times New Roman',serif]750g。[/font][b][font=宋体]3.2[/font][font=宋体]样本采集:[/font][/b][font=宋体] 采集[/font][font='Times New Roman',serif]400[/font][font=宋体]个酒醅样品,其中酒醅水分、淀粉、酸度等理化指标均由车间经验丰富化验员按常规化学方法测定所得。[/font][b][font=宋体]3.3[/font][font=宋体]分析对比[/font][/b][font=宋体] 结合酒醅常用的光谱预处理算法及[/font][font='Times New Roman',serif]PLS[/font][font=宋体]单模型建模算法对本应用中酒醅数据进行建模,通过多种预处理组合优化,有效剔除光谱数据中的大量无用信息,并结合[/font][font='Times New Roman',serif]PLS[/font][font=宋体]算法,将高维光谱数据进行有效降维,提升光谱数据的有效性及准确度。最后以[/font][font='Times New Roman',serif]RMSECV[/font][font=宋体]作为模型筛选指标,利用筛选的最优模型对[/font][font='Times New Roman',serif]100[/font][font=宋体]条未知样本进行模型外验证,图[/font][font='Times New Roman',serif]a~c[/font][font=宋体]依次给出了传统单模型水分、酸度、淀粉[/font][font='Times New Roman',serif]3[/font][font=宋体]个指标的模型外预测分布情况,图中横坐标为标定值,纵坐标为预测值,黄色区域为模型允许的误差范围(水分、淀粉允许误差为绝对偏差[/font][font='Times New Roman',serif]±1[/font][font=宋体],酸度允许误差范围为绝对偏差[/font][font='Times New Roman',serif]±0.3[/font][font=宋体]),采用基于多模型加权预测的近红外定量分析方法对上述酒醅光谱数据进行建模,利用筛选的多个光谱模型对相同的[/font][font='Times New Roman',serif]100[/font][font=宋体]条未知样本进行加权预测,图[/font][font='Times New Roman',serif]d~f[/font][font=宋体]依次依次给出了多模型加权预测方法水分、酸度、淀粉[/font][font='Times New Roman',serif]3[/font][font=宋体]个指标的模型外预测分布情况。[/font][img=酒醅定量分析,690,318]https://ng1.17img.cn/bbsfiles/images/2023/09/202309042105316390_239_5075516_3.png!w690x318.jpg[/img][font=宋体] 多模型加权预测方法相较于传统单模型预测方法,各指标准确率均有不同幅度提升,3个指标准确率平均提升约11%。各指标准确率均达到了企业车间应用要求。[/font][b][size=18px][font=宋体]4[/font][font=宋体]、结论[/font][/size][/b][font=宋体] 利用便携式[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱仪[/color][/url],分别以传统单模型建模方法、多模型加权预测方法进行酿酒车间酒醅各成分光谱建模,并对[/font][font='Times New Roman',serif]100[/font][font=宋体]个未知样本进行模型外预测分析。结果表明,基于多模型加权预测的近红外定量分析方法,可以有效弥补便携式[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱仪[/color][/url]在采样精度、稳定性等方面的不足。相较于单模型建模预测结果,多模型加权预测方法将酒醅样本各成分预测准确率平均提升了约[/font][font='Times New Roman',serif]11%[/font][font=宋体],甚至可有效逼近大型傅里叶光谱仪设备预测效果,是一种可以在便携式[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]快检领域推广应用的实用方法。[/font]
在近红外(NIR)进行定量时的指标有相关系数R和校正误差均方根RMSEC及预测误差均方根RMSEP的意义是什么呢?应该还有个RMSECV交叉验证误差均方根。他们的影响因素是什么呢?意义:我的理解是计算值和实际值(或参考值)的偏差大小,那它的影响因素都有什么呢?在建模时,有时相关系数已经达到0.9以上了,但是RMSEC还很大,有0.3多,通过什么手段能降低呢?
成分分析中,定性分析属于物理性测试,定量分析属于化学性测试,实验室做物理和化学归类的时候把成分分析归一类,还是把成分分析定性和定量归类分开呢?