当前位置: 仪器信息网 > 行业主题 > >

模型实验结果

仪器信息网模型实验结果专题为您整合模型实验结果相关的最新文章,在模型实验结果专题,您不仅可以免费浏览模型实验结果的资讯, 同时您还可以浏览模型实验结果的相关资料、解决方案,参与社区模型实验结果话题讨论。

模型实验结果相关的论坛

  • 【讨论】马尔文仪器的结果计算模型

    在马尔文粒度分析软件中,有三种结果计算模型可以选择,分别为"通用","多峰","单峰",那么在测试样品的时候,所测的样品是个未知的分布状态,我该怎么选择呀?我测的目的就是要测出它的分布状态,但确要先选择分布状态,这样合理吗?

  • 模型相关系数

    前几天看到坛里的一则帖子:《从一次曲线看二次曲线》,很简单地表达了自己的看法:相关系数与拟合模型无关。我自己也编写过原子吸收软件,很清楚相关系数是怎样算出来的。根据《数学手册》上的定义,相关系数只与自因变量的统计特性有关,而与所用的拟合模型是没有关系的。不过帖主“冰山”同学很快就贴出某软件的截图反驳了我的观点,贴图上很清楚显示不同的拟合模型有着不同的“相关系数”。这是什么回事呢?要搞清楚这个问题,需要搞清楚一个概念,即何为相关系数?其实相关系数是表示两个变量的相关程度的,一个模型中的自因变量如果存在单调性,如变量A增加则变量B增加(或者减小),以及相反,变量A减小则变量B减小(或增加),我们说两个A与B变量之间存在很强 的相关性。那么相关性的大小有如何计算呢?人们用的是线性相关系数R,它是一个衡量自因变量之间线性关系的一个指标。如果线性相关系数等于1或者-1,说明因变量可以用自变量的一次方程完美表达。因此,线性相关系数和所选择的拟合方程式确实是没有关系的,因为它只对线性方程有意义。那么如何比较两条工作曲线的优劣了。通常,人们会用剩余误差来说明工作曲线的质量。所谓剩余误差,指的是对所有实验样本的因变量与模型估计值之差的平方求和,不过这个数值有些主观,因为它与因变量的取值范围有关。例如,显然,一个取值在1000附近的变量显然比在0.1 附近取之的变量有大得多的误差,因此更“客观的”指标是所谓的“相对剩余误差”,即总剩余误差除以变量变异数(所有实验样本的变量与其算术平均值之差的平方求和)所得之结果。很显然,这个“相对剩余误差”(Qse)越小,拟合质量越好,它与所选择的拟合方程模型是相关的。对于线性拟合模型,Qse^2和R^2之和恰好等于1,所以在线性拟合模型中,常用线性相关系数的平方来说明拟合质量,因为这个值越大(越接近1),拟合质量越好,这很符合人们的思维习惯。对于非线性拟合方程,所谓的相关系数已经不适用了,于是,人们用1减去Qse^2杜撰出一个“相关系数”,更确切地说,这个系数实际上是“模型相关系数”。个人认为,分析软件中的相关系数,还是用“模型相关系数”更加合适。

  • 【讨论】一组同样的数据做模型,为啥模型不一样?

    用同样的数据,同样的数学处理得到的模型为什么不一样?今天我用一组数据做一个模型,然后把这组数据按一成分含量高低排序,重新做模型,做模型的数学处理方法也是一样的。但是为什么模型不一样呢?两个模型预测另外一组数据,预测结果有的差的还很大? 这是什么原因呢? 大虾们有知道的吗? http://simg.instrument.com.cn/bbs/images/brow/em09501.gif

  • 实验误差能不能影响到近红外模型的预测准确度?

    在近红外运用过程中,有一个常常被人提起的说法,就是“近红外光谱分析法的测定结果不如参考方法的准确”。这已经基本成为大家在应用近红外时的常识了。但真想真如此吗? 我们知道,近红外模型的数据来源是通过传统方法得到的近红外分析方法作为间接的分析方法,在人们认识上,其准确度必然低于直接分析法(也就是定标方法)。但褚小立博士做过一个实验,结论指出,在精度相对较差的情况下,近红外光谱预测出的数据更接近于真值(具体情况请参见附件文献其理论依据是,通过大量样本的光谱分析和化学计量学统计处理,已经将结果回归到正常范围。 在你心中,在你的认识里,近红外的预测结果与实验结果谁的误差大些? 近红外能不能冲破“近红外光谱分析法的测定结果不如参考方法的准确”的魔咒,成为国标制定的新的方向,甚至是在一些工作中成为强制执行的质控标准?

  • 如何建立数学模型(转载)

    如何建立数学模型(转载)

    如何建立数学模型讲授人:中国计量科学研究院研究员 倪育才 在测量不确定度评定中,建立数学模型也称为测量模型化,目的是要建立满足测量不确定度评定所要求的数学模型,即建立被测量Y和所有各影响量X间的函数关系,其一般形式可写为: Y=f(X1,X2,…,Xn) 可以说,建立数学模型是进行测量不确定度评定最关键的第一步,也是许多初学者在进行测量不确定度评定时遇到的第一个困难。 《测量不确定度表示指南》(GUM)在摘要介绍测量不确定度评定步骤时,首先就提到要建立数学模型,并说:“The function f should contain everyquantity, including all corrections and correction factors, that can contributea significant component of uncertainty to the result of measurement. ”。其意是数学模型f中应包含所有对测量结果的不确定度有影响的修正值和修正因子。也就是说,数学模型中应包含所有应该考虑的影响量,而每一个影响量将对测量结果贡献一个值得考虑的不确定度分量。因此一个好的数学模型,其中所包含的影响量和此后不确定度评定中所考虑的每一个不确定度分量应该是一一对应的。这样建立起来的数学模型,既能用来计算测量结果,又能用来全面地评定测量结果的不确定度。 要找出每一个影响量与被测量之间的函数关系,往往是很困难的,有时简直不可能得到两者关系的解析表达式。于是许多初学者往往将测量中用来获得被测量的计算公式作为数学模型而列出。例如在各种测量中,最经常采用的方法之一是比较测量。将被测量值y和参考标准所提供的标准量值s相比较,通过测量两者之差Δ可以计算出被测量y。于是在已经发表的各种测量不确定度评定的文章中,经常见到将y=x+Δ作为数学模型的情况。但在进行不确定度评定时,则又往往脱离数学模型而重新考虑各个不确定度分量。这样的数学模型对测量不确定度评定实际上毫无帮助。 在某些特殊情况下(例如某些检测项目)将计算公式作为数学模型可能是允许的,但一般说来不要把数学模型简单地理解为就是计算测量结果的公式,也不要理解为就是测量的基本原理公式。两者之间经常是有区别的。 从原则上说,似乎所有对测量结果有影响的输入量都应该在计算公式中出现,但实际情况却不然。有些输入量虽然对测量结果有影响,但由于信息量的缺乏,在具体测量时无法定量地计算它们对测量结果的影响。也有些输入量由于对测量结果的影响很小而被忽略,故在测量结果的计算公式中也不出现,但它们对测量结果的不确定度的影响却可能是必须考虑的。因此如果仅从计算公式出发来进行不确定度评定,则上述这些不确定度分量就可能被遗漏。当然,在某些特殊情况下如果所有其他不确定度贡献因素的影响都可以忽略不计时,数学模型也可能与计算公式相同。 对于不同的被测量和不同的测量方法,数学模型的具体形式可能差别很大,但实际上都可以用一种比较系统的方式来给出数学模型,或者说可以给出数学模型的通式。 根据测量误差的定义:误差=测量结果-真值。同时误差又可以分为随机误差和系统误差两类,且三者之间的关系为:误差=系统误差+随机误差。于是可以得到: 真值=测量结果-误差   =测量结果-系统误差-随机误差 由于修正值等于负的误差,于是上面的关系式就成为: 真值=测量结果-系统误差-随机误差   =测量结果+系统误差的修正值+随机误差的修正值 实际上,真值就是想得到的被测量的测量结果,于是上式可写成 被测量=测量结果+系统误差的修正值+随机误差的修正值 例1:对于常见的量块比较测量,若ls为标准量块的长度,Δl为测得的两量块的长度差,于是被测量块长度lx的计算公式为: lx=ls+Δl 由于测量时量块的温度通常会偏离标准参考温度20℃,考虑到温度和线膨胀系数对测量结果的影响,计算公式成为: lx=ls+Δl+lsδαθx+lsαsδθ 式中α和θ分别表示线膨胀系数和对标准参考温度20℃的偏差;脚标“s”、“x”分别表示标准量块和被测量块;以及δθ=θs-θx和δα=αs-αx。 考虑到量块测量点可能偏离量块测量面中心点对测量结果的影响,数学模型成为: lx=ls+Δl+lsδαθx+lsαsδθ+δl 将此数学模型和上面给出的通式相比较就可以发现,等式右边的第一、二项ls+Δl即是由测量得到的未修正的测量结果。等式右边的第三、四项lsδαθx+lsαsδθ是对由温度偏差所引入的系统误差的修正值,在本例中这两项的数值十分小而可以忽略,但它们对测量结果不确定度的影响是必须考虑的。等式右边的最后一项δl,是表示由于测量点可能偏离量块中心对测量结果的影响。测量点的偏离对测量结果引入随机误差,因此最后一项实际上是对该随机误差的修正值。由下图可见两者之间的对应关系。http://ng1.17img.cn/bbsfiles/images/2013/10/201310181455_471725_2771427_3.jpg 例2:砝码校准,将被测砝码的质量与具有相同标称值的标准砝码相比较。若被校准砝码和标准砝码的折算质量分别为mx和ms,测得两者的质量差为Δm,于是被校准砝码折算质量mx的计算公式为: mx=ms+Δm 考虑到标准砝码的质量自最近一次校准以来可能产生的漂移Δmd,质量比较仪的偏心度和磁效应的影响Δmc,以及空气浮力对测量结果的影响δB后,其数学模型成为: mx=ms+Δm+δmd+δmc+δB 模型中等式右边的第一、二项为未修正的测量结果。该测量不存在值得考虑的系统误差,也就是说,在数学模型中不存在对系统误差的修正值。等式右边的第三、四、五项为对三项随机误差分量的修正量。与数学模型通式之间的对应关系为:http://ng1.17img.cn/bbsfiles/images/2013/10/201310181455_471726_2771427_3.jpg 在建立数学模型时,未修正的测量结果和系统误差的修正值通常都能比较容易地得到解析形式的数学表达式。惟有随机误差的修正值无法得到其解析形式的表达式。因此只能在数学模型中简单地加上一项,表示对随机误差的修正值。根据随机误差的定义,无限多次测量结果的随机误差的平均值等于零,因此这些项的数学期望为零。也就是说,增加这些修正值后不会对被测量的数值有影响。需要知道的是这些修正值的可能取值范围,通常可以由测量者的经验或

  • 近红外的模型转移

    我们知道在近红外的实际应用中,在某一近红外仪(称源机)上建立的校正模型,即便在另外一台与源机相同功能的近红外仪(称为目标机)上使用时,因各仪器测量的光谱有差异,模型不再适用,计算结果偏差很大或根本无法使用,解决这类问题的过程称为模型转移,也称为仪器标准化。众所周知建立近红外校正模型时往往需要测量大量样品的化学值或基础性质作为数据基础,投入大、成本高,因此使用模型转移技术实现模型共享和有效利用非常必要。模型转移可克服样品在不同仪器上的量测信号(或光谱) 间的不一致性,通过信号处理以消除仪器对量测信号的影响 ,不仅使已有模型具有较好的动态适应性,而且可以减少因重复建模造成的人力、物力、财力以及时间的浪费。大家在模型转移过程中遇到过什么问题,或有什么好的经验及建议,欢迎一起讨论。下面的四篇英文文献都是近红外模型转移的一些介绍

  • 谈谈近红外模型的验证?

    最近忙于处理收集的样品,进行基础模型的比较,刚对基础模型进行了扩充,准备做验证工作。计划将未参与定标的样品扫描比对其结果。于是问题就来了?貌似有好多参数可以界定?要求sep 不大于0.2-0.3怎么做出来都超差了,哎。请高手指点一下。

  • 【原创大赛】模型转移简介

    【原创大赛】模型转移简介

    [font='times new roman'][size=18px][b]模型转移[/b][/size][/font][font='times new roman'][size=18px][b]简介[/b][/size][/font][font='times new roman'][size=16px]模型转移可以定义为光谱数据或校准模型的数学转换,以便使所开发的方法与不同的仪器或不同的测量条件兼容。[/size][/font][font='times new roman'][size=16px]模型转移[/size][/font][font='times new roman'][size=16px]的目的是确保在不同情况下获得的[/size][/font][font='times new roman'][size=16px]模型[/size][/font][font='times new roman'][size=16px]结果的互换性,而不必对每种情况进行耗时的重新校准。化学计量[/size][/font][font='times new roman'][size=16px]学[/size][/font][font='times new roman'][size=16px]用于纠正仪器和环境的差异,如仪器反应功能的变化[/size][/font][font='times new roman'][size=16px]([/size][/font][font='times new roman'][size=16px]由仪器更换部分零件或设备老化[/size][/font][font='times new roman'][size=16px]引起)[/size][/font][font='times new roman'][size=16px]、样品的物理或化学组成[/size][/font][font='times new roman'][size=16px]的[/size][/font][font='times new roman'][size=16px]改变[/size][/font][font='times new roman'][size=16px]([/size][/font][font='times new roman'][size=16px]例如[/size][/font][font='times new roman'][size=16px]颗粒[/size][/font][font='times new roman'][size=16px]大小、表面结构、粘度等[/size][/font][font='times new roman'][size=16px])[/size][/font][font='times new roman'][size=16px]及测量条件的变化[/size][/font][font='times new roman'][size=16px]([/size][/font][font='times new roman'][size=16px]如温度和湿度的变化[/size][/font][font='times new roman'][size=16px])等。在本研究中,使用[/size][/font][font='times new roman'][size=16px]相[/size][/font][font='times new roman'][size=16px]同的仪器设备采集的在线与离线[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]被解释为测量条件的变化,[/size][/font][font='times new roman'][size=16px]样品以不同的方式呈现给光谱[/size][/font][font='times new roman'][size=16px]采集[/size][/font][font='times new roman'][size=16px]系统。[/size][/font][font='times new roman'][size=16px]此外,随着光谱采集时间的推移,即使同一样品的光谱也会出现漂移、波长转变、线性或非线性改变等变化,[/size][/font][font='times new roman'][size=16px]因此[/size][/font][font='times new roman'][size=16px]建立的校正集模型需要定期进行维护。如果这些变化不通过定期采集新的校正集光谱进行维护,建立的模型会出现不可估量的误差[/size][/font][font='times new roman'][size=16px],[/size][/font][font='times new roman'][size=16px]且在线模型较离线模型的收集需要消耗更多的物料,模型的定期维护需要更多的经济投入。为了提高在线模型的精度,节省成本,减少校正集光谱收集及模型维护带来的经济成本,采用化学计量学方法对离线光谱与在线光谱间模型传递进行研究,提高了模型的精度和稳定性。[/size][/font][font='times new roman'][size=16px]离线模型的建立验证了便携式[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱仪[/color][/url]用于流化床混合过程[/size][/font][font='times new roman'][size=16px]API[/size][/font][font='times new roman'][size=16px]含量监测的可行性。由于物料的动态特性及其他影响因素的干扰,在线模型精度较低。此外,随着光谱采集时间、环境等的推移,即使同一样品的光谱也会出现漂移、线性或非线性改变等变化,[/size][/font][font='times new roman'][size=16px]故建立[/size][/font][font='times new roman'][size=16px]的校正集模型需要定期进行维护。如果这些变化不通过定期采集新的校正集光谱进行维护,建立的模型会出现不可估量的误差,给生产和检验带来不可估量的损失,且在线模型较离线模型的收集需要消耗更多的物料,模型的定期维护需要更多的经济投入。为了提高在线模型的精度,节省成本,减少校正集光谱收集及模型维护带来的经济成本,[/size][/font][font='times new roman'][size=16px]针[/size][/font][font='times new roman'][size=16px]对流化床混合过程中建立的[/size][/font][font='times new roman'][size=16px]API[/size][/font][font='times new roman'][size=16px]含量[/size][/font][font='times new roman'][size=16px]定量分析模型,采用化学计量学方法对离线光谱与在线光谱间模型传递进行研究,提高了模型的精度和稳定性,将模型转移后建立的新模型用于中试生产过程[/size][/font][font='times new roman'][size=16px]API[/size][/font][font='times new roman'][size=16px]含量的在线监测,实现了实验室到中试应用的理论和实践研究。[/size][/font][font='times new roman'][size=16px]目前,模型转移方法主要包括两大类:光谱数据的模型传递法和结果校正的[/size][/font][font='times new roman'][size=16px]模型传递法[/size][/font][font='times new roman'][size=16px][color=#080000][73, 74][/color][/size][/font][font='times new roman'][size=16px]。其中光谱数据的模型传递包括光谱吸光度及波长(或波数)的校正两个方面。在诸多模型传递方法中,分段直接标准化法[/size][/font][font='times new roman'][size=16px](Piecewise direct standardization,[/size][/font][font='times new roman'][size=16px] [/size][/font][font='times new roman'][size=16px]PDS)[/size][/font][font='times new roman'][size=16px]是最常用的方法之一,也是常用的评价模型传递新方法的参比方法,在模型传递方法中占有重要地位。另一个常用的方法是分段反向标准化法[/size][/font][font='times new roman'][size=16px](Piecewise reverse standardization,[/size][/font][font='times new roman'][size=16px] [/size][/font][font='times new roman'][size=16px]PRS)[/size][/font][font='times new roman'][size=16px]。[/size][/font][font='times new roman'][size=16px]PDS[/size][/font][font='times new roman'][size=16px][color=#080000][75, 76][/color][/size][/font][font='times new roman'][size=16px]法和[/size][/font][font='times new roman'][size=16px]PRS[/size][/font][font='times new roman'][size=16px]法在原理相同的,但数据转换方向不同。[/size][/font][font='times new roman'][size=16px]PDS[/size][/font][font='times new roman'][size=16px]法是将辅仪器[/size][/font][font='times new roman'][size=16px](slave instrument)[/size][/font][font='times new roman'][size=16px]的光谱数据向主仪器方向转换或者将精度低的光谱数据向精度高的方向转换,[/size][/font][font='times new roman'][size=16px]PRS[/size][/font][font='times new roman'][size=16px]法相反,是将将精度高的光谱数据向精度低的方向转换。[/size][/font][font='times new roman'][size=16px]采用化学计量学方法对离线光谱和在线光谱间模型传递进行研究,提高了模型精度,节省了校正集收集及模型维护成本,实现了由实验室到工厂实际应用的理论和实践研究,具体计算过程如图所示,研究内容主要包括:[/size][/font][font='宋体'][size=16px]①[/size][/font][font='times new roman'][size=16px]流化床混合过程中,标准离线光谱[/size][/font][font='times new roman'][size=16px]([/size][/font][font='times new roman'][size=16px]Xstatic[/size][/font][font='times new roman'][size=16px])[/size][/font][font='times new roman'][size=16px]的收集和标准在线光谱[/size][/font][font='times new roman'][size=16px]([/size][/font][font='times new roman'][size=16px]Xdynamic[/size][/font][font='times new roman'][size=16px])[/size][/font][font='times new roman'][size=16px]的收集。[/size][/font][font='宋体'][size=16px]②[/size][/font][font='times new roman'][size=16px]通过标准离线光谱[/size][/font][font='times new roman'][size=16px]([/size][/font][font='times new roman'][size=16px]Xstatic[/size][/font][font='times new roman'][size=16px])[/size][/font][font='times new roman'][size=16px]和标准在线光谱[/size][/font][font='times new roman'][size=16px]([/size][/font][font='times new roman'][size=16px]Xdynamic[/size][/font][font='times new roman'][size=16px])[/size][/font][font='times new roman'][size=16px]建立转换矩阵[/size][/font][font='times new roman'][size=16px][b]F[/b][/size][/font][font='times new roman'][size=16px]。[/size][/font][font='宋体'][size=16px]③[/size][/font][font='times new roman'][size=16px]将采集到的校正集样品离线光谱[/size][/font][font='times new roman'][size=16px]X[/size][/font][font='times new roman'][size=16px]static[/size][/font][font='times new roman'][size=16px]([/size][/font][font='times new roman'][size=16px]cal[/size][/font][font='times new roman'][size=16px])[/size][/font][font='times new roman'][size=16px]通过转换矩阵得到新的校正集建模光谱[/size][/font][font='times new roman'][size=16px]X[/size][/font][font='times new roman'][size=16px]static[/size][/font][font='times new roman'][size=16px](fit)=[/size][/font][font='times new roman'][size=16px]Xstatic[/size][/font][font='times new roman'][size=16px]([/size][/font][font='times new roman'][size=16px]cal[/size][/font][font='times new roman'][size=16px]) [/size][/font][font='times new roman'][size=16px][b]F[/b][/size][/font][font='times new roman'][size=16px].[/size][/font][font='宋体'][size=16px]④[/size][/font][font='times new roman'][size=16px]将得到的校正集光谱矩阵[/size][/font][font='times new roman'][size=16px]X[/size][/font][font='times new roman'][size=16px]static[/size][/font][font='times new roman'][size=16px](fit)[/size][/font][font='times new roman'][size=16px]用于建立校正集模型,用于未知样品的预测。[/size][/font][font='宋体'][size=16px]⑤[/size][/font][font='times new roman'][size=16px]模型传递后与原在线模型及离线模型的比较。[/size][/font][font='宋体'][size=16px]⑥[/size][/font][font='times new roman'][size=16px]将模型转移后的模型用于中试流化床混合过程在线监测并对测量结果进行评价。[/size][/font][align=center][img]https://ng1.17img.cn/bbsfiles/images/2020/09/202009102207075705_1626_3890113_3.png[/img][/align][align=center][font='times new roman']模型转移计算流程图[/font][/align]

  • 【分享】医学中的数学模型

    [size=3][font=宋体]一、医学数学化的发展历史[/font][/size][size=3][font=宋体] [/font][/size][size=3][font=宋体]数学应用于生命科学研究的历史可追溯到17 世纪。1615 年英国医生哈维(Farvey W)在研究心脏时应用流体力学知识和逻辑推理方法推断出血流循环系统的存在,18世纪欧拉利用积分方法计算了血流量问题,这些都是历史上应用数学研究生命科学的突出事例。但是,真正大范围地将数学应用于生命科学与医学研究则出现在20世纪中叶。1935年,Mottram对小白鼠皮肤癌的生长规律进行了研究,认为肿瘤细胞总数N随时间的变化速度与N成正比,并获得了瘤体在较短时间内符合指数生长规律的研究成果。1944 年奥地利著名物理学家薛定谔(Schrodinger E)出版了《生命是什么》(What is life)一书,应用量子力学和统计力学知识描述了生命物质的重要特征。在薛定谔的影响下,沃森(Watson JD)和克里克(Crick FHC)利用当时对蛋白质和核酸所做的射线结晶学研究以及其他与DNA结构有关的研究,于1953年建立了DNA超螺旋结构分子模型,验证了薛定谔的设想。在书中,薛定谔还利用非平衡热力学从宏观的角度解释生命现象,认为生命的基本特征是从环境中取得“负熵”,以使生物系统内的熵始终处于低水平。20多年后,普律高津(Prigogine I)等人提出耗散结构理论,将对生命系统的研究推广到薛定谔预言的领域,为此普律高津于1977年荣获了诺贝尔奖。作为医学领域的最高奖项,诺贝尔医学和生理学奖背后的许多数学影像也许更能说明数学在生命科学中的巨大潜力:英国生理学家、生物物理学家Hodgkin和Huxley建立了神经细胞膜产生动作电位时膜电位变化的模型,揭示了神经电生理的内在机制,因而于1963年共享诺贝尔奖;基于二维雷当变换(Radon transform)创建CT成像理论的美国科学家Cormack AM获得了1979年的诺贝尔奖,丹麦科学家Jerne NK则应用数学原理研究免疫网络理论获得1984年的诺贝尔奖。这些奖项有力地表明现代生命科学的研究离不开数学,数学在其中所起的作用和影响越来越重大,高层次的成果往往有赖于合理的数学模型的建立。[/font][/size][size=3][font=宋体] [/font][/size][size=3][font=宋体]数学不仅推动了人们探索生命世界的步伐,事实上两者结合已经产生了多个十分活跃的学科。1901年Peanson 创建生物统计学后,概率论与数理统计方法在医学上得到了非常广泛的应用,如目前常用的显著性检验、回归分析、方差分析、最大似然模型、决策树概率分布、微生物检测等,都属于基于统计学原理的数学模型及分析。1931年,Volterra在研究食物链的基础上,应用微分方程组研究生物动态平衡,完成了《生态竞争的数学原理》,开创了生物数学(biomathematics)这一新的分支。近年来,可视人及虚拟人的研究、计算医学(computational medicine/biology)、生物信息学(bioinformatics)、生理组学(Physiome)等新的学科及领域的出现,使数学这一工具在生物医学研究中的作用日益突出。[/font][/size][size=3][font=宋体] [/font][/size][size=3][font=宋体]生物系统是一个动态系统,作为世界上最复杂的系统之一,它具有调节机制复杂、多输入、多输出等特点,而且由于很多变量或参数很难在体测量及控制,仅仅通过实验研究来揭示其间的复杂关系,会非常困难且不易得到一致的结论。建立生物系统的数学模型,有利于获得生物系统的动态与定量变化,帮助阐明生物医学中有关作用机制等基础性问题,同时通过模型及仿真实验不仅可以得到正常状态,还可以获得异常或极端异常状态下的生理变化预测,以及代替一些技术复杂、代价高昂或难以控制和重现的实验,为临床或特定条件下的方案设计提供预测及指导。此外,从伦理学的角度,人们也希望医学研究中能够减少实验动物的数量,减轻临床试验中人体试验对象不必要的痛苦,因此生理系统的仿真与建模在生物医学领域中的研究中日益受到重视。目前,包括呼吸、血压、体温、各种调节系统等,都已建立了相应的数学模型,并进行了相应的模拟实验。针对特定应用的模型,如细胞动力学、药物动力学模型、生物种群生长模型、神经网络、心血管模型、临床计量诊断模型等,也不断呈现并得到应用。在本节下面的内容中,我们将以应用最为成功的模型之一,药物动力学模型为例,说明医用数学模型的建立过程。[/font][/size][size=3][font=宋体] [/font][/size][size=3][font=宋体]二、医用数学模型实例:药物动力学模型[/font][/size][size=3][font=宋体] [/font][/size][size=3][font=宋体]药物动力学(pharmacokinetics)是定量研究药物在生物体内吸收、分布、排泄和代谢等过程的动态变化规律的一门学科。于1937年由Teorell开创,主要内容是应用动力学原理、体外实验数据以及人体生理学知识,结合数学模型,定量研究药物在体内的运转规律,为药物的筛选提供指导。[/font][/size][size=3][font=宋体] [/font][/size][size=3][font=宋体]众所周知,新药研发过程费用昂贵、时间冗长、淘汰率高,大约有90%的候选药物在临床期间被淘汰,主要原因有口服吸收性差、生物利用度低、半衰期过短等等。为提高新药研究效率和安全性、降低药物研发成本,药物动力学模型已为全球各大制药公司应用。传统的新药研发流程中,药物动力学的应用主要在药物研发的中后期,近年来,人们开始在药物研发的早期对其药物动力学特性进行模拟研究,以尽早淘汰药物动力学参数不理想的候选药物,提高研发效率、降低成本。比如药物虚拟筛选(virtual screening)就是指在化合物合成前,先通过计算机模拟预测其药动学相关特性,进行初步筛选。此外,药物动力学模型在研究药物处置及作用机制、治疗药物监测及个体化用药、新药开发等方面也发挥着重要作用。[/font][/size][size=3][font=宋体] [/font][/size][size=3][font=宋体]药物动力学的数学模型包括房室模型、非线性药物动力学模型、生理药物动力学模型、药理药物动力学模型、统计矩模型等。下面以最常用的房室模型,结合前面所述的建模步骤,对药物动力学模型的建模过程进行分析描述。[/font][/size][size=3][font=宋体] [/font][/size][size=3][font=宋体](一)背景和问题表述[/font][/size][size=3][font=宋体] [/font][/size][size=3][font=宋体]药物进入机体后,在随血液输送到各个器官和组织的过程中,不断地被吸收、分布、代谢,最终被排出体外。药物在血液中的浓度,即单位体积血液中药物的含量,称为血药浓度。血药浓度的大小直接影响到药物的疗效。因此,药物动力学研究的主要对象是血药浓度随时间变化的规律——药时曲线,建模目的是建立能反映药物在体内分布的数学模型及参数,并能反映给药方式、给药时间间隔、给药剂量等对分布的影响。[/font][/size][size=3][font=宋体] [/font][/size][size=3][font=宋体](二)模型构建[/font][/size][size=3][font=宋体] [/font][/size][size=3][font=宋体]上述问题属于人体与外界以及人体内部的物质交换问题,研究这类问题最常用的是房室模型。药物动力学的房室分析方法将人的机体看做由不同房室构成的系统,每个房室代表药物在其中分布大致均匀的组织或体腔。如血液及供血丰富的肝、心、肾在特定情况下可视为一个房室,而血供不足的组织如肌肉、皮肤等可视为另一个房室。为了进行严格数学描述,常对模型做如下假设:①房室具有固定容量,且药物在每个房室内的分布是均匀的;②各房室间可进行物质交换,且至少有一个房室可与外环境进行交换;③房室间的物质交换或药物转移服从质量守恒定律,即系统中物质总量的改变等于输入总量与输出总量之差;④线性假设:药物的转移速率与药物浓度成正比。[/font][/size]

  • 模型传递方法

    [font=宋体]在[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]分析中,由于两台仪器之间存在差异,使得同一样品在两台仪器上所获得的光谱存在差别,导致一台仪器上所建立的模型不能用于另外一台仪器。仪器间的差异包括不同型号仪器之间的差异和相同型号仪器之间的差[/font][font=宋体]异。对于不同型号的仪器,由于分光原理或采用的检测器等不同,导致波长范围、波长精度及光谱响应会存在差异。对于相同型号的仪器,由于加工工艺水平局限及仪器随时间老化等原因,也会使仪器波长及光谱响应存在差异。在许多应用领域中,建立模型是一项烦琐、重复的工作,浪费人力、物力等资源,而且有些情况下样品可能不易获得或不易保存,存在重新建模困难,需要采用数学方法解决仪器之间的模型适用性问题,称之为模型传递。[/font][font=宋体][font=宋体]模型传递([/font][font=Times New Roman]Model transfer[/font][font=宋体]),也称仪器标准化([/font][font=Times New Roman]Standardization of spectrometric instruments[/font][font=宋体])是指经过数学处理后,使一台仪器上的模型(称为源机,[/font][font=Times New Roman]Master[/font][font=宋体])能够用于另一台仪器(称为目标机,[/font][font=Times New Roman]Slave[/font][font=宋体]),从而减少重新建模所带来的巨大工作量,实现样品和数据资源的共享。在确定仪器间光谱关系时,需要在两台仪器上同时测定某些样品的光谱,这些样品称为传递样品。根据是否需要传递样品,将模型传递分为无标样方法和有标样方法[/font][/font][sup][font=宋体][font=Times New Roman][6][/font][/font][/sup][font=宋体][font=宋体]。无标样方法在模型转移过程中不需要任何传递样品,主要以有限脉冲响应([/font][font=Times New Roman]Finite impulse response[/font][font=宋体],[/font][font=Times New Roman]FIR[/font][font=宋体])算法为代表。有标样方法必须选择一定数量的样品组成标样集,并在源机和目标机上分别测得其信号,从而找出该函数关系。这类算法又分为两种,一是基于预测结果的校正,如斜率[/font][font=Times New Roman]/[/font][font=宋体]偏差([/font][font=Times New Roman]Slope/Bias[/font][font=宋体])算法;二是基于仪器所测光谱信号的校正,如直接校正([/font][font=Times New Roman]Direct standardization[/font][font=宋体],[/font][font=Times New Roman]DS[/font][font=宋体])算法、分段直接校正[/font][/font][font=宋体][font=宋体]([/font][font=Times New Roman]Piecewise direct standardization[/font][font=宋体],[/font][font=Times New Roman]PDS[/font][font=宋体])算法和[/font][font=Times New Roman]Shenk[/font][font=宋体]’[/font][font=Times New Roman]s [/font][font=宋体]算法。此外,光谱空间转换([/font][font=Times New Roman]SST[/font][font=宋体])算法,已证明是一种效果良好的方法,其主要通过主从光谱空间之间的转换消除测量条件变化或仪器引起的光谱差异。[/font][/font]

  • 在线分析校正模型是如何建立的?

    [font=宋体][font=宋体]在线分析校正模型的建立主要分为[/font][font=Times New Roman]5[/font][font=宋体]个步骤:[/font][/font][font=宋体][font=宋体]([/font][font=Times New Roman]1[/font][font=宋体])获取代表性样品并采集对应的[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]。校正模型预测性能的稳健性很大程度上取决于样品本身的代表性,因此获取有良好代表性的样品是建模过程中及其关键的一环。待获取样品后,利用光谱采集装置进行在线[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]的采集,然后利用标准方法测定各份样品待测指标的数值,最后获得样品待测指标与对应光谱信息一一对应的数据集。[/font][/font][font=宋体][font=宋体]([/font][font=Times New Roman]2[/font][font=宋体])校正样本集与验证样品集的选择。校正样本集用来模型训练而验证样本集则用来验证模型的预测性能。理想的校正集应包含未来待测样本中可能存在的所有化学成分,其浓度范围应大于待测样本。目前,常利用[/font][font=Times New Roman]Kennard[/font][/font][font='Times New Roman']-Stone[/font][font=宋体]法、光谱[/font][font='Times New Roman']-[/font][font=宋体]理化值共生距离法进行校正集和验证集的选取。[/font][font=宋体][font=宋体]([/font][font=Times New Roman]3[/font][font=宋体])光谱预处理及波长筛选。在建模过程中,光谱预处理往往是必不可少的,运用适当的方法进行预处理可以有效保留光谱中的关键信息并剔除噪声信息,以提升校正模型的预测性能。波长选择也是重要环节之一,进行波长筛选一方面可以简化模型,更主要的是由于不相关或非线性变量的剔除,可以得到预测能力强、稳健性好的模型。[/font][/font][font=宋体][font=宋体]([/font][font=Times New Roman]4[/font][font=宋体])异常样本的剔除。异常样本会极大的影响建模过程,降低模型的预测准确性和稳定性,因此需要异常样本的识别与剔除。[/font][/font][font=宋体][font=宋体]([/font][font=Times New Roman]5[/font][font=宋体])校正模型的建立。待前面[/font][font=Times New Roman]4[/font][font=宋体]个部分的工作完成后,借助化学计量学算法建立定量校正模型,运用校正标准误差、预测标准误差、决定系数或相关系数等对校正模型的预测性能进行评价。涉及建立、评价定量校正模型或定性判别模型(类模型)可参考[/font][/font][font='Times New Roman']ASTM E-1655[/font][font=宋体]、[/font][font='Times New Roman']GB/T29858-2013[/font][font=宋体]和[/font][font='Times New Roman']GB/T37969-2019[/font][font=宋体]等[/font][font='Times New Roman'][font=宋体]标准[/font][/font][font=宋体]。[/font][font='Times New Roman'][font=宋体]此外,在线模型也可由实验室建立的离线模型通过模型传递技术获得。[/font][/font]

  • 关于近红外光谱模型转移和光谱转移

    小弟新人,有些事不解,想请教下,望多指点~1、模型转移是不是建立子机与主机模型的关系,一般为斜率截距,然后用主机模型预测子机光谱后,对预测的结果利用斜率截距进行修正?2、光谱转移,是不是建立一种计算关系,对子机采集的光谱进行修正,修正后的光谱可以直接利用主机模型预测,如果主机有多个指标的模型,是不是所有子机光谱修正后都可以利用主机所有指标模型进行预测,还是部分指标可以建立光谱转移关系;部分指标直接利用主机模型;部分指标利用模型转移;部分指标只能建立新的模型,谁的模型也用不上?谢谢了!~

  • 模型传递、更新与维护

    [b][font=宋体]一、模型传递[/font][/b][font=宋体][url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]容易受外界因素干扰而发生扰动或者变化,例如温度、湿度、样本形态、仪器漂移或仪器更换等,导致建立的模型难以适应新的应用场景。通过建立不同条件下光谱、模型系数或预测结果的关系,从而消除预测偏差的方法称为模型转移[/font][sup][font=宋体][font=Times New Roman][[/font][/font][/sup][sup][font='Times New Roman']68][/font][/sup][font=宋体][font=宋体],常见的方法包括斜率截距法([/font][font=Times New Roman]Slope/bias,S/B[/font][font=宋体])、专利算法[/font][/font][font='Times New Roman'][font=宋体]([/font][/font][font=宋体][font=Times New Roman]Shenks [/font][/font][font='Times New Roman']a[/font][font=宋体][font=Times New Roman]lgorithm[/font][/font][font='Times New Roman'][font=宋体])[/font][/font][font=宋体]、直接标准化[/font][font='Times New Roman'][font=宋体]([/font][/font][font=宋体][font=Times New Roman]Direct [/font][/font][font='Times New Roman']s[/font][font=宋体][font=Times New Roman]tandardization[/font][/font][font='Times New Roman'], [/font][font=宋体][font=Times New Roman]DS[/font][/font][font='Times New Roman'][font=宋体])[/font][/font][font=宋体]、分段直接标准化[/font][font='Times New Roman'][font=宋体]([/font][/font][font=宋体][font=Times New Roman]Piecewise [/font][/font][font='Times New Roman']d[/font][font=宋体][font=Times New Roman]irect [/font][/font][font='Times New Roman']s[/font][font=宋体][font=Times New Roman]tandardization[/font][/font][font='Times New Roman'], [/font][font=宋体][font=Times New Roman]PDS[/font][/font][font='Times New Roman'][font=宋体])[/font][/font][font=宋体]、光谱空间转换[/font][font='Times New Roman'][font=宋体]([/font][/font][font=宋体][font=Times New Roman]S[/font][/font][font='Times New Roman']pectral space transformation, SST[font=宋体])[/font][/font][font=宋体]、典型相关性分析[/font][font='Times New Roman'][font=宋体]([/font][/font][font=宋体][font=Times New Roman]Canonical [/font][/font][font='Times New Roman']c[/font][font=宋体][font=Times New Roman]orrelation [/font][/font][font='Times New Roman']a[/font][font=宋体][font=Times New Roman]nalysis[/font][/font][font='Times New Roman'], [/font][font=宋体][font=Times New Roman]CCA[/font][/font][font='Times New Roman'][font=宋体])[/font][/font][font=宋体],交替三线性分解[/font][font='Times New Roman'][font=宋体]([/font][/font][font=宋体][font=Times New Roman]Alternating tri-linear [/font][/font][font='Times New Roman']d[/font][font=宋体][font=Times New Roman]ecomposition[/font][/font][font='Times New Roman'], [/font][font=宋体][font=Times New Roman]ATLD[/font][/font][font='Times New Roman'][font=宋体])[/font][/font][font=宋体]光谱标准化和多级同时成分分析[/font][font='Times New Roman'][font=宋体]([/font][/font][font=宋体][font=Times New Roman]M[/font][/font][font='Times New Roman']ulti-level simultaneous component analysis[/font][font=宋体][font=Times New Roman],MSCA[/font][/font][font='Times New Roman'][font=宋体])[/font][/font][sup][font='Times New Roman'][69][/font][/sup][font=宋体]。[/font][font=宋体]因子分析是将数据在低维空间中表示的一类方法,利用因子分析将高维空间中的光谱转移转化为低维空间中的抽象因子,这能够有效降低模型转移的复杂程度。例如,联合独立分块分析[/font][font='Times New Roman'][font=宋体]([/font][/font][font=宋体][font=Times New Roman]J[/font][/font][font='Times New Roman']oint and unique multiblock analysis[font=宋体])[/font][/font][sup][font='Times New Roman'][70][/font][/sup][font=宋体]、域不变偏最小二乘[/font][font='Times New Roman'][font=宋体]([/font][/font][font=宋体][font=Times New Roman]D[/font][/font][font='Times New Roman']omain-invariant partialleastsquares[font=宋体])[/font][/font][sup][font='Times New Roman'][71][/font][/sup][font='Times New Roman'][font=宋体]、[/font][/font][font=宋体]等仿射不变式[/font][font='Times New Roman'][font=宋体]([/font][/font][font=宋体][font=Times New Roman]A[/font][/font][font='Times New Roman']ffine invariance[font=宋体])[/font][/font][sup][font='Times New Roman'][72][/font][/sup][font=宋体]等。张等[/font][sup][font='Times New Roman'][73][/font][/sup][font=宋体]在此基础上提出了一种基于权重系数的模型转移方法[/font][font='Times New Roman'][font=宋体]([/font][/font][font=宋体][font=Times New Roman]C[/font][/font][font='Times New Roman']alibration transfer based on the weight matrix[font=宋体])[/font][/font][font=宋体],该方法在偏最小二乘权重系数的基础上构造模型转移函数,转化偏最小二乘权重为得分,将光谱间的转化关系变换为光谱与得分矩阵间的转化,简化了模型转移的复杂程度,提高了模型转移的可靠性。[/font][font=宋体]基于拉格朗日乘子法的正则化方法不但能够实现模型的平滑、稀疏等特性,还能够自由结合多种约束实现模型转移和模型更新。此类方法通过超参[/font][font='Times New Roman'][font=宋体]([/font][/font][font=宋体][font=Times New Roman]Hyper-parameter[/font][/font][font='Times New Roman'][font=宋体])[/font][/font][font=宋体]来平衡效率[/font][font='Times New Roman'][font=宋体]([/font][/font][font=宋体]目标函数[/font][font='Times New Roman'][font=宋体])[/font][/font][font=宋体]和模型复杂程度[/font][font='Times New Roman'][font=宋体]([/font][/font][font=宋体]约束条件[/font][font='Times New Roman'][font=宋体])[/font][/font][font=宋体]的关系,但需要通过交互验证或者外部验证决定合适的参数。张等[/font][sup][font='Times New Roman'][74][/font][/sup][font=宋体][font=宋体]在此基础上提出了一种基于岭回归的模型更新方法,将预测优化目标和模型系数的[/font][font=Times New Roman]2[/font][font=宋体]范数约束结合起来,实现了模型系数的更新,解决了由于仪器漂移或样本变化引起的模型预测能力和可靠性变差的问题。[/font][/font][font=宋体]通常,使用标准样本的模型转移方法的结果相对更加准确,然而,其应用性受到限制。邵学广课题组提出了一系列无需标准样本的模型转移方法,例如,双模型策略[/font][font='Times New Roman'][font=宋体]([/font][/font][font=宋体][font=Times New Roman]Dualmodelstrategy[/font][/font][font='Times New Roman'][font=宋体])[/font][/font][sup][font='Times New Roman'][75][/font][/sup][font=宋体]、偏最小二乘校正[/font][font='Times New Roman'][font=宋体]([/font]PLS-[/font][font=宋体][font=Times New Roman]c[/font][/font][font='Times New Roman']orrected[font=宋体])[/font][/font][sup][font='Times New Roman'][76][/font][/sup][font=宋体]和线性模型校正[/font][font='Times New Roman'][font=宋体]([/font][/font][font=宋体][font=Times New Roman]L[/font][/font][font='Times New Roman']inear model correction, [/font][font=宋体][font=Times New Roman]LMC[/font][/font][font='Times New Roman'][font=宋体])[/font][/font][sup][font='Times New Roman'][77][/font][/sup][font=宋体]方法。这些算法不需要使用在不同仪器或者不同条件下采集的标准样本的[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url],因此,可以用于无标准光谱的模型维护和增强。张等[/font][sup][font='Times New Roman'][78][/font][/sup][font=宋体][font=宋体]在[/font][font=Times New Roman]LMC[/font][font=宋体]基础上提出的修正线性模型校正[/font][/font][font='Times New Roman'][font=宋体]([/font][/font][font=宋体][font=Times New Roman]M[/font][/font][font='Times New Roman']odified linear model correction[/font][font=宋体][font=Times New Roman],[/font][/font][font='Times New Roman']m[/font][font=宋体][font=Times New Roman]LMC[/font][/font][font='Times New Roman'][font=宋体])[/font][/font][font=宋体]方法利用拉格朗日乘子法,将预测优化目标函数与不同条件下模型系数相关性约束相结合,实现了对不同仪器设备基础上建立的分析模型高效、快速的无标准样本转移。此外,张等[/font][sup][font='Times New Roman'][79][/font][/sup][font=宋体][font=宋体]提出了利用相关系数约束结合全局游湖算法实现了无参数的模型增强([/font][font=Times New Roman]P[/font][/font][font='Times New Roman']arameter-free calibration enhancement[font=宋体])[/font][/font][font=宋体]框架,包括无监督、半监督和全监督的模型转移、维护和增强等多种应用情况。[/font][font=宋体][font=宋体]以上所介绍的这些方法,又称为[/font][font=宋体]“软拷贝”转移模型,值得近红外用户关注的是,随着仪器制造技术的不断提高,近红外仪器之间的光学性能差异越来越小,仪器之间的光谱测量结果具有很好的重现性,将原机模型或光谱“硬拷贝”到新光谱仪上就能正常使用,省去了复杂的“软拷贝”计算工作。[/font][/font]

  • 基于多模型加权预测的近红外定量分析方法

    基于多模型加权预测的近红外定量分析方法

    [b][size=18px][font=宋体]1[/font][font=宋体]、背景介绍[/font][/size][/b][font=宋体] 随着微机电技术的发展,近几年,便携式[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱仪[/color][/url]被广泛应用于食品、饮料、医药、煤炭等各个领域,相较于传统的大型傅里叶变换光谱分析系统,其具有结构简单、成本低廉、携带方便、结果实时可见等优势,目前已成为光谱领域的热门产品。但是便携式[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱仪[/color][/url]易受光源、检测器、使用方法、环境条件等影响,使得采集的光谱数据稳定性差,精度低,进而造成预测结果不稳定、预测准确率低等问题。[/font][font=宋体] 为了解决上述问题,提升便携式[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]分析结果的稳定性及准确性,目前行业内[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]数据建模优化工作,主要集中于数据源筛选、预处理算法优化、模型筛选算法优化等基于PLS算法的单模型建模优化工作,此类建模算法主要适用于高精度的傅里叶[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱仪[/color][/url]。对于自身硬件分辨率较低的便携式[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱仪[/color][/url],适用性较差。因此本帖在基于PLS算法建模的基础上,提出多模型加权预测的方法,以特定准则选取相对稳定、准确率较高的若干个光谱模型,结合模型自身系数进行加权预测的方式来提升便携式[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱仪[/color][/url]整体性能,进而提升便携式[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱仪[/color][/url]的预测稳定性及准确率。[/font][b][size=18px][font=宋体]2[/font][font=宋体]、方法解析[/font][/size][font=宋体]2.1[/font][font=宋体]样本集合划分[/font][/b][font=宋体] 使用便携式[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱仪[/color][/url]采集400个待测样品,采用Kennard Stone(K-S)算法对样本进行划分,将样本划分为训练集(200个)、验证集(100个)、盲测集(100个)、避免人为划分样本的主观性。[/font][b][font=宋体]2.2[/font][font=宋体]光谱预处理[/font][/b][font=宋体] 便携式[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱仪[/color][/url]采用常规的单一预处理方式效果不佳,本贴采用双预处理嵌套的方式对样品进行处理,其中第一级、第二级预处理均可设置不同的预处理参数,通过不同预处理方式,预处理参数的设置可以获取多种预处理结果。[/font][align=center][img=双预处理嵌套,690,325]https://ng1.17img.cn/bbsfiles/images/2023/09/202309042103332831_7122_5075516_3.png!w690x325.jpg[/img][/align][b][font=宋体]2.3[/font][font=宋体]光谱建模[/font][/b][font=宋体] [url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]定量分析建模方法包括多元线性回归([/font][font='Times New Roman',serif]MLR[/font][font=宋体])、主成分回归([/font][font='Times New Roman',serif][url=https://insevent.instrument.com.cn/t/jp][color=#3333ff]PCR[/color][/url][/font][font=宋体])、偏最小二乘回归([/font][font='Times New Roman',serif]PLS[/font][font=宋体])、人工神经网络([/font][font='Times New Roman',serif]ANN[/font][font=宋体])和支持向量机([/font][font='Times New Roman',serif]SVM[/font][font=宋体])等。其中,[/font][font='Times New Roman',serif]PLS[/font][font=宋体]算法应用最为广泛,选用[/font][font='Times New Roman',serif]PLS[/font][font=宋体]算法进行建模。通过多种预处理结果、不同[/font][font='Times New Roman',serif]PLS[/font][font=宋体]主成分数选择组合建立多个光谱定量分析模型,若设定一级预处理为[/font][font='Times New Roman',serif]M[/font][font=宋体]种,二级预处理为[/font][font='Times New Roman',serif]N[/font][font=宋体]种,[/font][font='Times New Roman',serif]PLS[/font][font=宋体]主成分数选择为[/font][font='Times New Roman',serif]T[/font][font=宋体]种,则通过不同排列组合可以建立合计[/font][font='Times New Roman',serif]M*N*T[/font][font=宋体]个光谱定量分析模型。[/font][align=center][img=多种建模方式,690,198]https://ng1.17img.cn/bbsfiles/images/2023/09/202309042104079253_7276_5075516_3.png!w690x198.jpg[/img][/align][b][font=宋体]2.4[/font][font=宋体]光谱模型选择[/font][/b][font=宋体] 基础模型一:在上述建立的大量光谱定量分析模型中,选择光谱模型最通用的两大表征系数,即模型相关系数([/font][font='Times New Roman',serif]R2[/font][font=宋体]值)以及均方根误差([/font][font='Times New Roman',serif]RMSECV[/font][font=宋体]值)进行基础模型筛选,选择模型相关系数最大的模型为基础模型[/font][font='Times New Roman',serif]A[/font][font=宋体],模型均方根误差最小的模型为基础模型[/font][font='Times New Roman',serif]B。[/font][font=宋体] 基础模型二:在基础模型一中引入验证集,通过训练集建立的多个光谱模型对验证集进行预测,将预测值与验证集标定值进行计算,获取偏差值,选择偏差值最小的光谱模型为基础模型[/font][font='Times New Roman',serif]C。[/font][align=center][img=基础模型C,690,264]https://ng1.17img.cn/bbsfiles/images/2023/09/202309042104332526_3725_5075516_3.png!w690x264.jpg[/img][/align][font=宋体] 基础模型三:在基础模型二中引入准确率,在近红外快检的实际应用中,对于预测偏差值在一定阈值范围内的样本定义为准确预测样本,若超出阈值则为预测错误样本,选择准确率最高的光谱模型为基础模型[/font][font='Times New Roman',serif]D。[/font][align=center][img=基础模型D,690,235]https://ng1.17img.cn/bbsfiles/images/2023/09/202309042104460652_3475_5075516_3.png!w690x235.jpg[/img][/align][b][font=宋体]2.5[/font][font=宋体]权重系数计算[/font][/b][font=宋体] 光谱模型不同,对盲测样本的预测能力不同,结合光谱模型的模型相关系数([/font][font='Times New Roman',serif]R2[/font][font=宋体]值)或者均方根误差([/font][font='Times New Roman',serif]RMSECV[/font][font=宋体]值)计算各个模型的预测权重,以模型相关系数为例:[/font][align=center][font='Times New Roman',serif]Ti=Ri/(R1+R2+R3+R4)[/font][/align][font=宋体] 其中,[/font][font='Times New Roman',serif]R1[/font][font=宋体]为基础模型[/font][font='Times New Roman',serif]A[/font][font=宋体]的模型相关系数,[/font][font='Times New Roman',serif]R2[/font][font=宋体]为基础模型[/font][font='Times New Roman',serif]B[/font][font=宋体]的模型相关系数,依此类推。[/font][font='Times New Roman',serif]Ti[/font][font=宋体]为各个基础模型对应权重系数。[/font][b][font=宋体]2.6[/font][font=宋体]多模型加权预测[/font][/b][font=宋体] 分别采用光谱基础模型[/font][font='Times New Roman',serif]A[/font][font=宋体]、[/font][font='Times New Roman',serif]B[/font][font=宋体]、[/font][font='Times New Roman',serif]C[/font][font=宋体]、[/font][font='Times New Roman',serif]D[/font][font=宋体]对盲测集[/font][font='Times New Roman',serif]100[/font][font=宋体]个样本进行预测,以盲测集单个样本为例,四个光谱模型对应获取四个预测值[/font][font='Times New Roman',serif]a[/font][font=宋体]、[/font][font='Times New Roman',serif]b[/font][font=宋体]、[/font][font='Times New Roman',serif]c[/font][font=宋体]、[/font][font='Times New Roman',serif]d [/font][font=宋体],结合权重系数计算最终单一预测值[/font][font='Times New Roman',serif]S[/font][font=宋体]:[/font][align=center][font=宋体][/font][/align][align=center][font='Times New Roman',serif]S=a*T1+b*T2+c*T3+d*T4[img=多模型加权预测,690,212]https://ng1.17img.cn/bbsfiles/images/2023/09/202309042106560595_5692_5075516_3.png!w690x212.jpg[/img][/font][/align][b][size=18px][font=宋体]3[/font][font=宋体]、实际应用[/font][/size][font=宋体]3.1[/font][font=宋体]硬件信息[/font][/b][font=宋体] 硬件设备为四川长虹研发的[/font][font='Times New Roman',serif]PV800-III[/font][font=宋体]便携式[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱仪[/color][/url],光谱仪波段范围为[/font][font='Times New Roman',serif]1350nm-2150nm[/font][font=宋体],采样间隔为[/font][font='Times New Roman',serif]6nm[/font][font=宋体],尺寸为[/font][font='Times New Roman',serif]Φ100mm×76.8mm[/font][font=宋体],重量约[/font][font='Times New Roman',serif]750g。[/font][b][font=宋体]3.2[/font][font=宋体]样本采集:[/font][/b][font=宋体] 采集[/font][font='Times New Roman',serif]400[/font][font=宋体]个酒醅样品,其中酒醅水分、淀粉、酸度等理化指标均由车间经验丰富化验员按常规化学方法测定所得。[/font][b][font=宋体]3.3[/font][font=宋体]分析对比[/font][/b][font=宋体] 结合酒醅常用的光谱预处理算法及[/font][font='Times New Roman',serif]PLS[/font][font=宋体]单模型建模算法对本应用中酒醅数据进行建模,通过多种预处理组合优化,有效剔除光谱数据中的大量无用信息,并结合[/font][font='Times New Roman',serif]PLS[/font][font=宋体]算法,将高维光谱数据进行有效降维,提升光谱数据的有效性及准确度。最后以[/font][font='Times New Roman',serif]RMSECV[/font][font=宋体]作为模型筛选指标,利用筛选的最优模型对[/font][font='Times New Roman',serif]100[/font][font=宋体]条未知样本进行模型外验证,图[/font][font='Times New Roman',serif]a~c[/font][font=宋体]依次给出了传统单模型水分、酸度、淀粉[/font][font='Times New Roman',serif]3[/font][font=宋体]个指标的模型外预测分布情况,图中横坐标为标定值,纵坐标为预测值,黄色区域为模型允许的误差范围(水分、淀粉允许误差为绝对偏差[/font][font='Times New Roman',serif]±1[/font][font=宋体],酸度允许误差范围为绝对偏差[/font][font='Times New Roman',serif]±0.3[/font][font=宋体]),采用基于多模型加权预测的近红外定量分析方法对上述酒醅光谱数据进行建模,利用筛选的多个光谱模型对相同的[/font][font='Times New Roman',serif]100[/font][font=宋体]条未知样本进行加权预测,图[/font][font='Times New Roman',serif]d~f[/font][font=宋体]依次依次给出了多模型加权预测方法水分、酸度、淀粉[/font][font='Times New Roman',serif]3[/font][font=宋体]个指标的模型外预测分布情况。[/font][img=酒醅定量分析,690,318]https://ng1.17img.cn/bbsfiles/images/2023/09/202309042105316390_239_5075516_3.png!w690x318.jpg[/img][font=宋体] 多模型加权预测方法相较于传统单模型预测方法,各指标准确率均有不同幅度提升,3个指标准确率平均提升约11%。各指标准确率均达到了企业车间应用要求。[/font][b][size=18px][font=宋体]4[/font][font=宋体]、结论[/font][/size][/b][font=宋体] 利用便携式[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱仪[/color][/url],分别以传统单模型建模方法、多模型加权预测方法进行酿酒车间酒醅各成分光谱建模,并对[/font][font='Times New Roman',serif]100[/font][font=宋体]个未知样本进行模型外预测分析。结果表明,基于多模型加权预测的近红外定量分析方法,可以有效弥补便携式[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱仪[/color][/url]在采样精度、稳定性等方面的不足。相较于单模型建模预测结果,多模型加权预测方法将酒醅样本各成分预测准确率平均提升了约[/font][font='Times New Roman',serif]11%[/font][font=宋体],甚至可有效逼近大型傅里叶光谱仪设备预测效果,是一种可以在便携式[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]快检领域推广应用的实用方法。[/font]

  • 模型更新与维护

    [font=宋体][font=宋体]在模型的应用过程中,原料种植环境和工艺条件等的改变或调整都会导致模型不再适用,这时就需要进行模型的更新和维护。模型的更新过程需要收集多个有代表性的新样本,然后,按照常规建模流程添加到原模型校正集中,重新建立模型。如果进行了模型更新则需要重新进行验证过程。对模型更新验证集的要求与新建模型时相同,原有的验证集样本可以用于新模型的验证,但是,必须补充代表新范围或新类型的样本。读者可参考分子光谱多元校正定量分析通则[/font] [font=Times New Roman](GB/T[/font][/font][font='Times New Roman'] 29858[/font][font=宋体][font=Times New Roman]-[/font][/font][font='Times New Roman']2013[/font][font=宋体][font=Times New Roman])[/font][font=宋体]。[/font][/font]

  • 关于ARIMA模型

    ARIMA模型一般是利用预测变量的过去值、当前值和误差值进行预测。那么如何利用含有自变量的ARIMA模型进行预测?模型阶数的确定方法还是一样的么?模型的参数怎么确定呢?有什么软件可以实现还是继续用eviews?希望高手帮助解答,谢谢。

  • 【原创大赛】颗粒水分近红外模型建立及验证

    【原创大赛】颗粒水分近红外模型建立及验证

    [font='times new roman'][size=16px][b]颗粒水分近红外模型建立及验证[/b][/size][/font][font='times new roman'][size=16px][b]偏最小二乘法[/b][/size][/font][font='times new roman'][size=16px][b] [/b][/size][/font][font='times new roman'][size=16px][b]PLS[/b][/size][/font][font='times new roman'][size=16px][b]算法原理[/b][/size][/font][size=14px]PLS[/size][size=14px]方法在对数据进行标准化后需要用主成分分析([/size][size=14px]Principal[/size][size=14px] [/size][size=14px]Component[/size][size=14px] [/size][size=14px]Analysis[/size][size=14px],[/size][size=14px]PCA[/size][size=14px])法来去除数据噪声。[/size][size=14px]PCA[/size][size=14px]通过计算数据矩阵的协方差矩阵得到特征向量,选择特征值(方差)最大的[/size][size=14px][i]k[/i][/size][size=14px]个[/size][size=14px]特征向量组成矩阵,从而将[/size][size=14px][i]n[/i][/size][size=14px]维数据降低到[/size][size=14px][i]k[/i][/size][size=14px]维,即有[/size][size=14px][i]k[/i][/size][size=14px]个[/size][size=14px]主成分。以二维矩阵为例,每个观测值由两个维度表示,理论认为,方差较大的方向是有效信息,方差较小的方向是噪声数据。选取方差较大的方向[/size][size=14px][i]u[/i][/size][font='times new roman'][size=14px][i]1[/i][/size][/font][size=14px]作为主成分方向,与[/size][size=14px][i]u[/i][/size][font='times new roman'][size=14px][i]1[/i][/size][/font][size=14px]呈正交方向[/size][size=14px]的方差较小的[/size][size=14px][i]u[/i][/size][font='times new roman'][size=14px][i]2[/i][/size][/font][size=14px]作为副主成分方向。[/size][size=14px][i]u[/i][/size][font='times new roman'][size=14px][i]1[/i][/size][/font][size=14px]方向上的投影具有大部分的有效信息,[/size][size=14px][i]u[/i][/size][font='times new roman'][size=14px][i]2[/i][/size][/font][size=14px]方向上的投影可以认为是噪声数据,这样就可以把二维数据转换成一维数据。其示意图如图所示。[/size][align=center][font='times new roman'][size=16px]图[/size][/font][font='times new roman'][size=16px] [/size][/font][font='times new roman'][size=16px]PCA[/size][/font][font='times new roman'][size=16px]二维数据分布图[/size][/font][/align][size=14px]在建模过程中,光谱数据[/size][size=14px][i]X[/i][/size][size=14px]是[/size][size=14px]90[/size][size=14px]×[/size][size=14px]125[/size][size=14px],水分数据[/size][size=14px][i]Y[/i][/size][size=14px]只有一维,即[/size][size=14px]90[/size][size=14px]×[/size][size=14px]1[/size][size=14px]。将[/size][size=14px][i]X[/i][/size][size=14px]和[/size][size=14px][i]Y[/i][/size][size=14px]分解成特征向量的形式使它们的主成分相关程度最大,其模型可以表示为:[/size][align=right][size=14px] [/size][size=14px] [/size][/align][align=right][size=14px] [/size][size=14px] [/size][/align][size=14px]式中,[/size][size=14px][i]W[/i][/size][font='times new roman'][size=14px][i]x[/i][/size][/font][size=14px]和[/size][size=14px][i]W[/i][/size][font='times new roman'][size=14px][i]y[/i][/size][/font][size=14px]分别对应于[/size][size=14px][i]X[/i][/size][size=14px]和[/size][size=14px][i]Y[/i][/size][size=14px]的得分矩阵;[/size][size=14px][i]P[/i][/size][size=14px]和[/size][size=14px][i]Q[/i][/size][size=14px]分别对应于[/size][size=14px][i]X[/i][/size][size=14px]和[/size][size=14px][i]Y[/i][/size][size=14px]的载荷矩阵;[/size][size=14px][i]E[/i][/size][font='times new roman'][size=14px][i]x[/i][/size][/font][size=14px]和[/size][size=14px][i]E[/i][/size][font='times new roman'][size=14px][i]y[/i][/size][/font][size=14px]分别对应于[/size][size=14px][i]X[/i][/size][size=14px]和[/size][size=14px][i]Y[/i][/size][size=14px]的拟合残差矩阵。[/size][size=14px]通过式([/size][size=14px]3-13[/size][size=14px])和式([/size][size=14px]3-14[/size][size=14px]),可以求得[/size][size=14px][i]W[/i][/size][font='times new roman'][size=14px][i]x[/i][/size][/font][size=14px]和[/size][size=14px][i]W[/i][/size][font='times new roman'][size=14px][i]y[/i][/size][/font][size=14px],建立两者的回归模型:[/size][align=right][size=14px] [/size][size=14px] [/size][/align][size=14px]式中,[/size][size=14px][i]B[/i][/size][size=14px]为回归系数矩阵,[/size][size=14px],[/size][size=14px][i]E[/i][/size][font='times new roman'][size=14px][i]r[/i][/size][/font][size=14px]为随机误差矩阵。因此,[/size][align=right][size=14px] [/size][size=14px] [/size][/align][size=14px][i]x[/i][/size][size=14px]为[/size][size=14px]待预测[/size][size=14px]样本的光谱数据,[/size][size=14px][i]y[/i][/size][font='times new roman'][size=14px][i]pre[/i][/size][/font][size=14px]为预测的水分含量。[/size][font='times new roman'][size=16px][b] [/b][/size][/font][font='times new roman'][size=16px][b]PLS[/b][/size][/font][font='times new roman'][size=16px][b]模型训练及预测结果[/b][/size][/font][align=center][size=14px]首先将数据[/size][size=14px]集按照[/size][size=14px]7[/size][size=14px]:[/size][size=14px]3[/size][size=14px]的比例分成训练集和预测集,再将训练集数据随机取出[/size][size=14px]3[/size][size=14px]0%[/size][size=14px]的数据作为验证集。根据[/size][size=14px]3.1[/size][size=14px]和[/size][size=14px]3.2[/size][size=14px]预处理和波段选择的结果,选择[/size][size=14px]Normalization+SG[/size][size=14px]作为光谱的预处理方法,用随机森林以特征重要性[/size][size=14px]0.0060[/size][size=14px]作为最低界限进行波段选择,整个[/size][size=14px]PLS[/size][size=14px]建模阶段的流程示意图如下图所示。[/size][/align][align=center][font='times new roman'][size=16px]图[/size][/font][font='times new roman'][size=16px] [/size][/font][font='times new roman'][size=16px]PLS[/size][/font][font='times new roman'][size=16px]建模过程示意图[/size][/font][/align][size=14px]对原始光谱进行[/size][size=14px]Normalization[/size][size=14px]和[/size][size=14px]SG[/size][size=14px]平滑处理并通过随机森林对处理过后的光谱进行波段选择,得到的光谱图像如下图所示,绿色方格表示选择的用来建模的波段。[/size][align=center][img]https://ng1.17img.cn/bbsfiles/images/2020/09/202009031754503657_2355_3890113_3.png[/img][/align][align=center][font='times new roman'][size=16px]图[/size][/font][font='times new roman'][size=16px] [/size][/font][font='times new roman'][size=16px]Normalization+SG+RF[/size][/font][font='times new roman'][size=16px]处理后的光谱[/size][/font][/align][size=14px]PLS[/size][size=14px]需要确定最佳主成分数目,主成分数目过少,光谱中一些有用的数据不能充分发挥作用,使得模型准确率下降,模型会处于欠拟合状态。主成分数目过多,光谱中一些无用甚至起相反作用的噪声数据不能被有效的过滤掉,容易使模型过拟合,在实际生产过程中应用此模型不能得到较准确的预测结果。为确定[/size][size=14px]PLS[/size][size=14px]的主成分数目,可以通过交叉验证的方式。[/size][size=14px]预处理过后的光谱的维度一共[/size][size=14px]60[/size][size=14px]个,则主成分数目的范围应该在[/size][size=14px]1~60[/size][size=14px]之间,用[/size][size=14px]PLS[/size][size=14px]遍历选择主成分数目,通过交叉验证得到模型的预测结果。[/size][size=14px]PLS[/size][size=14px]通过选择不同主成分建立的模型交叉验证结果如下图所示。[/size][align=center][font='times new roman'][size=16px]图[/size][/font][font='times new roman'][size=16px] [/size][/font][font='times new roman'][size=16px]不同主成分数[/size][/font][font='times new roman'][size=16px]PLS[/size][/font][font='times new roman'][size=16px]建模交叉验证结果[/size][/font][/align][size=14px]由图可知,选择主成分数为[/size][size=14px]13[/size][size=14px]的时候,[/size][size=14px]PLS[/size][size=14px]模型交叉验证结果最好,而且达到了[/size][size=14px]最好的结果为[/size][size=14px]0.209[/size][size=14px],这说明经过[/size][size=14px]降维之后[/size][size=14px]的数据信噪比得到了提升。对建立好的模型进行存档,用来对预测集数据进行预测,得出预测值和预测集的真实值的均方根误差[/size][size=14px]RMSE[/size][size=14px]为[/size][size=14px]0.210[/size][size=14px]和[/size][size=14px]R[/size][font='times new roman'][size=14px]2[/size][/font][size=14px]为[/size][size=14px]0.974[/size][size=14px]。[/size][align=center][font='times new roman'][size=16px]图[/size][/font][font='times new roman'][size=16px] PLS[/size][/font][font='times new roman'][size=16px]预测值和真实值[/size][/font][/align][font='times new roman'][size=16px][b]NIRS[/b][/size][/font][font='times new roman'][size=16px][b]模型在线验证[/b][/size][/font][size=14px]通过建立三种不同的算法模型对得到的光谱数据来预测颗粒中水分的含量,得到的各个模型的结果如下表所示。[/size][align=center][size=13px]表[/size][size=13px] [/size][size=13px]各个模型的[/size][size=13px]RMSE[/size][size=13px]和[/size][size=13px]R[/size][font='times new roman'][size=13px]2[/size][/font][/align][table][tr][td][align=center][size=14px]模型[/size][/align][/td][td][align=center][size=14px]RMSE[/size][/align][/td][td][align=center][size=14px]R[/size][font='times new roman'][size=14px]2[/size][/font][/align][/td][/tr][tr][td][align=center][size=14px]PLS[/size][/align][/td][td][align=center][size=14px]0.[/size][size=14px]210[/size][/align][/td][td][align=center][size=14px]0.[/size][size=14px]974[/size][/align][/td][/tr][tr][td][align=center][size=14px]PSO[/size][size=14px]-KRR[/size][/align][/td][td][align=center][size=14px]0.221[/size][/align][/td][td][align=center][size=14px]0.981[/size][/align][/td][/tr][tr][td][align=center][size=14px]PSO-SVR[/size][/align][/td][td][align=center][size=14px]0.207[/size][/align][/td][td][align=center][size=14px]0.972[/size][/align][/td][/tr][/table][size=14px]然而,三个模型得到的结果只是对离线数据进行的预测,模型可不可靠,能不能使用是需要在线上验证的,只有在线上可靠的模型才能用在生产过程中。在每个批次制[/size][size=14px]粒过程[/size][size=14px]中的每个阶段中随机取出少量样品,用近红外探头进行采谱,得到经过处理后的光谱数据,分别用以上三个已经保存好的模型进行预测颗粒的水分含量,然后通过干燥失重法测量样品中的水分含量,得到颗粒的真实水分含量。计算不同模型中预测值与真实值的均方根误差作为模型线上结果的评价标准,均方根误差小的即为较好的模型。[/size][size=14px]采用[/size][size=14px]2[/size][size=14px].[/size][size=14px]2[/size][size=14px].[/size][size=14px]1[/size][size=14px]中的实验方案进行六个批次实验,每个批次[/size][size=14px]4[/size][size=14px]分钟采集一次样品,共获得[/size][size=14px]90[/size][size=14px]个样品数据,对每个样本在相同的条件下进行采谱,并计算得到每个样本的实际含水量。为分别用[/size][size=14px]PLS[/size][size=14px]、[/size][size=14px]KRR[/size][size=14px]和[/size][size=14px]SVR[/size][size=14px]对光谱进行预测的结果。[/size][align=center][img]https://ng1.17img.cn/bbsfiles/images/2020/09/202009031754514605_4947_3890113_3.png[/img][/align][align=center][font='times new roman'][size=16px]图[/size][/font][font='times new roman'][size=16px]3-[/size][/font][font='times new roman'][size=16px]22 [/size][/font][font='times new roman'][size=16px]PLS[/size][/font][font='times new roman'][size=16px]模型预测值与真实值[/size][/font][/align][align=center][img]https://ng1.17img.cn/bbsfiles/images/2020/09/202009031754515806_9275_3890113_3.png[/img][/align][align=center][font='times new roman'][size=16px]图[/size][/font][font='times new roman'][size=16px]3-[/size][/font][font='times new roman'][size=16px]23 [/size][/font][font='times new roman'][size=16px]KRR[/size][/font][font='times new roman'][size=16px]模型预测值与真实值[/size][/font][/align][align=center][img]https://ng1.17img.cn/bbsfiles/images/2020/09/202009031754516958_7615_3890113_3.png[/img][/align][align=center][size=13px]图[/size][size=13px]3-[/size][size=13px]24 [/size][size=13px]SVR[/size][size=13px]模型预测值与真实值[/size][/align][size=14px]从图中可以看出,[/size][size=14px]KRR[/size][size=14px]模型的预测结果与真实结果的误差值变化比较平稳,距离误差零点远的点较少,[/size][size=14px]SVR[/size][size=14px]次之,[/size][size=14px]PLS[/size][size=14px]效果在三者中比较差,表[/size][size=14px]3-[/size][size=14px]8[/size][size=14px]表示了这三个模型[/size][size=14px]预测值与真实值的均方[/size][align=center][size=13px]表三个模型的均方根误差[/size][size=13px]RMSE[/size][/align][table][tr][td][align=center][size=13px]模型[/size][/align][/td][td][align=center][size=13px]RMSE[/size][/align][/td][/tr][tr][td][align=center][size=13px]PLS[/size][/align][/td][td][align=center][size=13px]0.[/size][size=13px]232[/size][/align][/td][/tr][tr][td][align=center][size=13px]KRR[/size][/align][/td][td][align=center][size=13px]0.[/size][size=13px]208[/size][/align][/td][/tr][tr][td][align=center][size=13px]SVR[/size][/align][/td][td][align=center][size=13px]0.[/size][size=13px]210[/size][/align][/td][/tr][/table][size=14px]从图和表中都可以表明,模型的线上预测结果都挺不错。其中,用[/size][size=14px]KRR[/size][size=14px]模型取得的效果最好,因此,选择[/size][size=14px]KRR[/size][size=14px]模型作为光谱水分预测的最优模型。[/size][font='times new roman'][size=16px][b]小结[/b][/size][/font][size=14px]通过[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]对颗粒中水分含量的预测进行了研究,主要结论如下:[/size][size=14px]对光谱数据进行了预处理研究,用[/size][size=14px]PLS[/size][size=14px]进行了建模,其中归一化和[/size][size=14px]SG[/size][size=14px]卷积平滑结合的方法效果最好。利用原始光谱验证集的[/size][size=14px]RMSE[/size][size=14px]和[/size][size=14px]R[/size][size=14px]分别为[/size][size=14px]0.[/size][size=14px]242[/size][size=14px]和[/size][size=14px]0.[/size][size=14px]958[/size][size=14px],预处理后的结果为[/size][size=14px]0.[/size][size=14px]214[/size][size=14px]和[/size][size=14px]0.[/size][size=14px]967[/size][size=14px];在预测集中使用原始光谱得到的[/size][size=14px]RMSE[/size][size=14px]和[/size][size=14px]R[/size][size=14px]分别为[/size][size=14px]0.[/size][size=14px]221[/size][size=14px]和[/size][size=14px]0.[/size][size=14px]960[/size][size=14px],预处理后的结果为[/size][size=14px]0.[/size][size=14px]212[/size][size=14px]和[/size][size=14px]0.[/size][size=14px]973[/size][size=14px]。说明经过归一化和[/size][size=14px]SG[/size][size=14px]卷积平滑后的预处理后光谱的信噪比得到了提升。[/size]

  • 首次利用冷冻电镜技术解析生物大分子原子结构模型

    1月11日,美国国家科学院院刊(PNAS)在线发表了中科院生物物理研究所朱平研究组及其合作伙伴利用冷冻电镜技术解析的一个质型多角体病毒原子分辨率结构模型的研究论文。这是我国首次利用冷冻电镜技术解析的生物大分子原子结构模型,也是目前已报道的国内最高分辨率的冷冻电镜三维重构结果。同时,这是世界上首次利用冷冻电镜的CCD图像(电荷耦合器件图像传感器)获得的生物大分子复合体的全原子模型。据生物物理所有关专家介绍,本工作完全基于生物物理所生物成像技术实验室去年4月建成并试运行的TitanKrios电镜及其附属设备完成,用单颗粒图像处理技术获得了呼肠孤病毒科的质型多角体病毒近原子分辨率的三维结构(3.9埃),并独立构建了全原子模型。呼肠孤病毒科病毒是一类重要的双链核糖核酸(RNA)病毒,其感染宿主包括植物、无脊椎动物、脊椎动物和人类,其中的质型多角体病毒是其两个亚科之一。该研究解析了呼肠孤病毒科质型多角体病毒的近原子分辨率三维结构并构建了完整原子模型,确认了该病毒新生信使RNA的流出通道,对研究双链RNA病毒的RNA加帽机制,新生信使RNA的释放过程,以及呼肠孤病毒的蛋白衣壳的稳定性和进化具有重要意义。

  • 【资料】生物多样性模型研究

    提 要 通过 1949 年以来在各种出版物上已发表的 27 种生物多样性模型分析发现,大多数多样性模型在理论上是不完善的。例如,被应用最广泛的 Shannon 模型至少有 4 个缺点:①没有考虑物种间生物量的区别;②如果要使用 Shannon 模型,每种物种的个数或每种景观单元的个数不能小于 100;③模型中没有隐含面积参数;④不能够表达多样性的丰富性方面。因此,作者推举了一种理论上完善的综合生物多样性模型,并为了满足实际操作和生物多样性自相似性研究的需要,对其中的一些参数进行了修正。关键词 多样性;丰富性;均一性;理论模型[img]http://www.instrument.com.cn/bbs/images/affix.gif[/img][url=http://www.instrument.com.cn/bbs/download.asp?ID=103383]生物多样性模型研究[/url]

  • 【原创大赛】XGBoost数学模型及Stacking模型融合

    【原创大赛】XGBoost数学模型及Stacking模型融合

    [font='times new roman'][size=16px][b]X[/b][/size][/font][font='times new roman'][size=16px][b]GBoost[/b][/size][/font][font='times new roman'][size=16px][b]数学模型[/b][/size][/font][font='times new roman'][size=16px][b]及[/b][/size][/font][font='times new roman'][size=16px][b]Stacking[/b][/size][/font][font='times new roman'][size=16px][b]模型融合[/b][/size][/font][font='times new roman'][size=16px][b]X[/b][/size][/font][font='times new roman'][size=16px][b]GBoost[/b][/size][/font][font='times new roman'][size=16px][b]数学模型[/b][/size][/font][size=14px]Xgboost[/size][font='times new roman'][size=14px][63][/size][/font][size=14px]是一种串行的集成学习算法。其思想是生成一串[/size][size=14px]CART[/size][size=14px]回归树,每一棵回归树都是对上一棵回归[/size][size=14px]树预测[/size][size=14px]的值与目标值的残差进行拟合,直到达到设定的树的数目或者函数得到收敛提前停止。[/size][size=14px]Xgboost[/size][size=14px]以其准确率较高的优势在工业界广泛应用。[/size][size=14px]Xgboost[/size][size=14px]的目标函数是由损失函数和正则化两项,由于所要解决的是回归问题,损失函数选择平方损失函数,目标函数如下:[/size][align=right][size=14px] [/size][size=14px] [/size][/align][size=14px]式中,[/size][size=14px]为第[/size][size=14px][i]i[/i][/size][size=14px]个[/size][size=14px]样本的实际值,[/size][size=14px]为第[/size][size=14px][i]i[/i][/size][size=14px]个[/size][size=14px]样本的预测值,[/size][size=14px]为树的深度。[/size][size=14px] [/size][size=14px] [/size][size=14px]Xgboost[/size][size=14px]模型的预测得分是所有回归树的预测得分之[/size][size=14px]和[/size][size=14px]。[/size][align=right][size=14px] [/size][size=14px] [/size][/align][size=14px]假设我们第[/size][size=14px][i]n[/i][/size][size=14px]次迭代训练的树的模型是[/size][size=14px],则在[/size][size=14px][i]n[/i][/size][size=14px]次迭代后的预测结果为:[/size][align=right][size=14px] [/size][size=14px] [/size][/align][size=14px]这样,可以将目标函数改写为[/size][align=right][size=14px] [/size][size=14px] (4-9)[/size][/align][size=14px]为了找到[/size][size=14px][i]f[/i][/size][font='times new roman'][size=14px][i]t[/i][/size][/font][size=14px]([/size][size=14px][i]x[/i][/size][font='times new roman'][size=14px][i]i[/i][/size][/font][size=14px])[/size][size=14px]使得目标函数最小化,在[/size][size=14px][i]f[/i][/size][font='times new roman'][size=14px][i]t[/i][/size][/font][size=14px]([/size][size=14px][i]x[/i][/size][font='times new roman'][size=14px][i]i[/i][/size][/font][size=14px])[/size][size=14px]=0[/size][size=14px]处进行[/size][size=14px]泰勒二阶[/size][size=14px]展开,目标函数近似为:[/size][align=right][size=14px] [/size][size=14px] [/size][/align][size=14px]式中,[/size][size=14px][i]G[/i][/size][font='times new roman'][size=14px][i]i[/i][/size][/font][size=14px]为一阶导数,[/size][size=14px][i]h[/i][/size][font='times new roman'][size=14px][i]i[/i][/size][/font][size=14px]为二阶导数。[/size][size=14px]简化目标函数为:[/size][align=right][size=14px] [/size][size=14px] [/size][/align][size=14px]求得最优的[/size][size=14px]和目标函数公式为:[/size][align=right][size=14px] [/size][size=14px] [/size][/align][font='times new roman'][size=16px][b]4.[/b][/size][/font][font='times new roman'][size=16px][b]3[/b][/size][/font][font='times new roman'][size=16px][b].[/b][/size][/font][font='times new roman'][size=16px][b]2 [/b][/size][/font][font='times new roman'][size=16px][b]构建[/b][/size][/font][font='times new roman'][size=16px][b]树[/b][/size][/font][font='times new roman'][size=16px][b]模型[/b][/size][/font][size=14px]为了能够达到最精确的结果,在构建回归树时,特征分裂采用贪心算法。从树的根节点开始,直到分裂到深度为[/size][size=14px][i]n[/i][/size][size=14px],算法的伪代码如下:[/size][size=14px]贪心算法在每个节点上遍历全部的特征,其中得分最高的节点作为分裂节点,在到达树设定的最大深度后停止分裂,然后再继续构造下一棵树的残差。将生成的所有的树进行组合,这样就得到了[/size][size=14px]XGBoost[/size][size=14px]模型。[/size][size=14px]XGBoost[/size][size=14px]模型构建过程示意图如下图所示。[/size][align=center][font='times new roman'][size=16px]XGBoost[/size][/font][font='times new roman'][size=16px]模型构建过程示意图[/size][/font][/align][font='times new roman'][size=16px][b]XGBoost[/b][/size][/font][font='times new roman'][size=16px][b]训练[/b][/size][/font][font='times new roman'][size=16px][b]过程[/b][/size][/font][size=14px]将数据集进行归一化处理并且按照[/size][size=14px]7[/size][size=14px]:[/size][size=14px]3[/size][size=14px]的比例分成训练集和预测集,然后用[/size][size=14px]XGBoost[/size][size=14px]对训练集数据进行训练。[/size][size=14px]XGBoost[/size][size=14px]训练过程如下。[/size][size=14px]([/size][size=14px]1[/size][size=14px])在[/size][size=14px]XGBoost[/size][size=14px]模型中输入训练集的特征向量及标签。[/size][size=14px]([/size][size=14px]2[/size][size=14px])用已经训练好的[/size][size=14px]基学习器[/size][size=14px]对训练集进行预测,得到模型预测值与样本真实值的残差。[/size][size=14px]([/size][size=14px]3[/size][size=14px])对特征向量进行初始化,计算在分割点处分割后的损失函数与分割前的变化。[/size][size=14px]([/size][size=14px]4[/size][size=14px])对当前[/size][size=14px]基学习器[/size][size=14px]分裂的深度进行计算。若达到了最大分裂深度,则停止分裂,当前[/size][size=14px]基学习器[/size][size=14px]完成建立并得到左右叶子节点权重;若没有达到最大分裂深度,则寻找新的最优分割点,并将样本分配到分割点的左右节点,进行步骤([/size][size=14px]3[/size][size=14px])。[/size][size=14px]([/size][size=14px]5[/size][size=14px])判断是否达到终止条件([/size][size=14px]基学习器[/size][size=14px]数量达到预设值)。若达到终止条件,将所有的[/size][size=14px]基学习器[/size][size=14px]组合起来,训练结束。若未达到,进行步骤([/size][size=14px]2[/size][size=14px])。[/size][size=14px]XGBoost[/size][size=14px]训练流程如下图所示。[/size][align=center][font='times new roman'][size=16px] [/size][/font][font='times new roman'][size=16px]XGBoost[/size][/font][font='times new roman'][size=16px]训练流程图[/size][/font][/align][font='times new roman'][size=16px][b]XGBoost[/b][/size][/font][font='times new roman'][size=16px][b]预测结果[/b][/size][/font][font='times new roman'][size=16px][b] [/b][/size][/font][size=14px]对训练集数据进行归一化后进行十折交叉验证,得到[/size][size=14px]RMSE[/size][size=14px]为[/size][size=14px]0.[/size][size=14px]133[/size][size=14px],将模型对归一化后的预测集数据进行预测,得到结果为[/size][size=14px]0.127[/size][size=14px]。[/size][size=14px]XGBoost[/size][size=14px]模型在预测集上损失函数图如下图所示。[/size][align=center][img]https://ng1.17img.cn/bbsfiles/images/2020/09/202009031801536210_9873_3890113_3.png[/img][/align][align=center][font='times new roman'][size=16px]XGBoost[/size][/font][font='times new roman'][size=16px]损失函数图[/size][/font][/align][font='times new roman'][size=16px][b]Stacking[/b][/size][/font][font='times new roman'][size=16px][b]模型融合[/b][/size][/font][font='times new roman'][size=16px][b]Stacking[/b][/size][/font][font='times new roman'][size=16px][b]算法原理[/b][/size][/font][size=14px]Stacking[/size][font='times new roman'][size=14px][64][/size][/font][size=14px]是一种集成学习框架。一般分为两层学习过程:首先对原始数据集进行拆分,得到许多个子数据集,[/size][size=14px] Stacking[/size][size=14px]框架中第一层模型由[/size][size=14px]基学习器[/size][size=14px]组成,每个[/size][size=14px]基学习器[/size][size=14px]对应着[/size][size=14px]一[/size][size=14px]个子数据集,求出每个[/size][size=14px]基学习器[/size][size=14px]的预测结果。然后,将第一层模型[/size][size=14px]基学习器[/size][size=14px]得到的预测值作为第二层模型的输入,由第二层模型输出最终结果[/size][font='times new roman'][size=14px][65][/size][/font][size=14px]。其学习方式如下图所示。[/size][align=center][font='times new roman'][size=16px]Stacking[/size][/font][font='times new roman'][size=16px]集成学习方式[/size][/font][/align][size=14px]对于数据集[/size][size=14px][i]S[/i][/size][size=14px]={([/size][size=14px][i]x[/i][/size][font='times new roman'][size=14px][i]n[/i][/size][/font][size=14px][i],y[/i][/size][font='times new roman'][size=14px][i]n[/i][/size][/font][size=14px]),[/size][size=14px][i]n[/i][/size][size=14px]=[/size][size=14px]1[/size][size=14px],2,3…[/size][size=14px][i]N[/i][/size][size=14px]},[/size][size=14px][i]x[/i][/size][font='times new roman'][size=14px][i]n[/i][/size][/font][size=14px]和[/size][size=14px][i]y[/i][/size][font='times new roman'][size=14px][i]n[/i][/size][/font][size=14px]分别表示第[/size][size=14px][i]n[/i][/size][size=14px]个[/size][size=14px]样本特征向量和对应的标签值。将原始数据集[/size][size=14px][i]S[/i][/size][size=14px]按照随机的方法分成[/size][size=14px][i]T[/i][/size][size=14px]个[/size][size=14px]规模差不多大的子集[/size][size=14px][i]S[/i][/size][font='times new roman'][size=14px][i]1[/i][/size][/font][size=14px],[/size][size=14px][i]S[/i][/size][font='times new roman'][size=14px][i]2[/i][/size][/font][size=14px],[/size][size=14px]…[/size][size=14px][i]S[/i][/size][font='times new roman'][size=14px][i]T[/i][/size][/font][size=14px],[/size][size=14px]定义[/size][size=14px][i]S[/i][/size][font='times new roman'][size=14px][i]t[/i][/size][/font][size=14px]和[/size][size=14px][i]S[/i][/size][font='times new roman'][size=14px]-[/size][/font][font='times new roman'][size=14px][i]t[/i][/size][/font][size=14px]=[/size][size=14px][i]S[/i][/size][size=14px]-[/size][size=14px][i]S[/i][/size][font='times new roman'][size=14px][i]t[/i][/size][/font][size=14px]分别为交叉验证中第[/size][size=14px][i]t[/i][/size][size=14px]折的测试集和训练集。在第一层预测模型中总共有[/size][size=14px][i]T[/i][/size][size=14px]个基学习器[/size][size=14px],每个[/size][size=14px]基学习器[/size][size=14px]对相应的子训练集进行训练,得到基模型[/size][size=14px][i]L[/i][/size][font='times new roman'][size=14px][i]t[/i][/size][/font][size=14px],[/size][size=14px][i]t[/i][/size][size=14px]=1,2,3,…,[/size][size=14px][i]T[/i][/size][size=14px]。[/size][size=14px]在完成交叉验证后,每个[/size][size=14px]基学习器[/size][size=14px]会得到一个输出结果,将得到的这些结果组合起来当作第二层预测模型的输入样本[/size][size=14px][i]S[/i][/size][font='times new roman'][size=14px]2[/size][/font][size=14px]。用第二层预测模型中的算法对[/size][size=14px][i]S[/i][/size][font='times new roman'][size=14px]2[/size][/font][size=14px]进行整理得到[/size][size=14px]元学习器[/size][size=14px][i]L[/i][/size][font='times new roman'][size=14px]2[/size][/font][size=14px],而且在整理的过程中可以不断地对第一层预测模型中的误差进行修正,提高模型的预测准确度。[/size][size=14px]Stacking[/size][size=14px]模型训练的部分伪代码如下:[/size][size=14px][b]In[/b][/size][size=14px][b]put[/b][/size][size=14px]:[/size][size=14px][i]S[/i][/size][size=14px]={[/size][size=14px]([/size][size=14px][i]x[/i][/size][font='times new roman'][size=14px][i]n[/i][/size][/font][size=14px],[/size][size=14px][i]y[/i][/size][font='times new roman'][size=14px][i]n[/i][/size][/font][size=14px]),[/size][size=14px][i]n[/i][/size][size=14px]=1,2,3,…,[/size][size=14px][i]N[/i][/size][size=14px]}[/size][size=14px][b]step1[/b][/size][size=14px]:将数据[/size][size=14px]集按照[/size][size=14px]随机的方法分成[/size][size=14px][i]T[/i][/size][size=14px]个[/size][size=14px]规模差不多的子集[/size][size=14px][i]S[/i][/size][font='times new roman'][size=14px][i]1[/i][/size][/font][size=14px],[/size][size=14px][i]S[/i][/size][font='times new roman'][size=14px][i]2[/i][/size][/font][size=14px],[/size][size=14px]…,[/size][size=14px][i]S[/i][/size][font='times new roman'][size=14px][i]t[/i][/size][/font][size=14px][b]step2[/b][/size][size=14px]:[/size][size=14px][b]for[/b][/size][size=14px] [/size][size=14px][i]t[/i][/size][size=14px]=1 [/size][size=14px][b]to[/b][/size][size=14px] T [/size][size=14px][b]do[/b][/size][size=14px] [/size][size=14px]在训练集上用第一层预测模型中的[/size][size=14px]基学习器[/size][size=14px][i]L[/i][/size][font='times new roman'][size=14px][i]t[/i][/size][/font][size=14px]进行训练[/size][size=14px] [/size][size=14px][b]end[/b][/size][size=14px][b]step[/b][/size][size=14px][b]3[/b][/size][size=14px][b]:[/b][/size][size=14px]构建新数据集[/size][size=14px][i]S[/i][/size][font='times new roman'][size=14px]2[/size][/font][size=14px]。[/size][size=14px][b]step[/b][/size][size=14px][b]4[/b][/size][size=14px][b]:[/b][/size][size=14px]在第二程预测模型中用[/size][size=14px]元学习器[/size][size=14px][i]L[/i][/size][font='times new roman'][size=14px]2[/size][/font][size=14px]对[/size][size=14px][i]S[/i][/size][font='times new roman'][size=14px]2[/size][/font][size=14px]进行训练。[/size][size=14px][b]output[/b][/size][size=14px]:[/size][size=14px][i]y[/i][/size][font='times new roman'][size=14px][i]npre[/i][/size][/font][size=14px]。[/size][font='times new roman'][size=16px][b]构建[/b][/size][/font][font='times new roman'][size=16px][b]Stacking[/b][/size][/font][font='times new roman'][size=16px][b]模型[/b][/size][/font][size=14px]不同的算法模型会从不同的数据特征空间以及不同的角度来对数据进行观测,根据各自算法的特点建立不同的模型来预测新的数据,这就会使得单一的算法会有一定局限性,不能够全方位的认识数据,用不同的模型进行融合可以从各个角度认识数据,可以提升预测的准确度[/size][font='times new roman'][size=14px][66][/size][/font][size=14px]。[/size][size=14px]第一层预测模型除了[/size][size=14px]BP[/size][size=14px]神经网络和[/size][size=14px]XGBoost[/size][size=14px]以外,还选择了在[/size][size=14px]3.2.2[/size][size=14px]节波段选择表现较好的[/size][size=14px]bagging[/size][size=14px]集成学习算法[/size][size=14px]RF[/size][size=14px]、以[/size][size=14px]boosting[/size][size=14px]学习方式的集成算法的梯度提升决策树([/size][size=14px]gradient[/size][size=14px] [/size][size=14px]boosted[/size][size=14px] [/size][size=14px]decision[/size][size=14px] [/size][size=14px]tree[/size][size=14px],[/size][size=14px]GDBT[/size][size=14px])和在样本少、非线性数据集上表现良好的[/size][size=14px]SVM[/size][size=14px]算法。第二层预测模型需要选择泛化能力较强,预测结果较为准确,并且可以防止过拟合的学习算法,[/size][size=14px]XGBoost[/size][size=14px]算法效果最好,因此选用[/size][size=14px]XGBoost[/size][size=14px]作为第二层模型。综上所述,[/size][size=14px]Stacking[/size][size=14px]模型的第一层预测模型为[/size][size=14px]BP[/size][size=14px]网络、[/size][size=14px]XGBoost[/size][size=14px]、[/size][size=14px]RF[/size][size=14px]、[/size][size=14px]GDBT[/size][size=14px]和[/size][size=14px]SVM[/size][size=14px],第二层预测模型为[/size][size=14px]XGBoost[/size][size=14px]。[/size][size=14px]为了防止模型发生过拟合,对于五个[/size][size=14px]基学习器[/size][size=14px]按照时间维度划分成五个数据集,并保证每次训练过程[/size][size=14px]不同基学习[/size][size=14px]器用的验证集不相同。对于每个[/size][size=14px]基学习器[/size][size=14px],每次训练将四个数据集作为训练集,剩余的一个作为验证集,最终将五个[/size][size=14px]基学习器[/size][size=14px]的预测结果合并成新的数据集。[/size][font='times new roman'][size=16px][b]Stacking[/b][/size][/font][font='times new roman'][size=16px][b]模型融合结果[/b][/size][/font][size=14px]对原始数据集进行归一化并按比例随机拆分成[/size][size=14px]70%[/size][size=14px]的训练集和[/size][size=14px]30%[/size][size=14px]的预测集。分别用[/size][size=14px]XGBoost[/size][size=14px]、[/size][size=14px]RF[/size][size=14px]、[/size][size=14px]GDBT[/size][size=14px]、[/size][size=14px]BP[/size][size=14px]网络、[/size][size=14px]SVR[/size][size=14px]进行建模和[/size][size=14px]Stacking[/size][size=14px]进行建模,建模结果如下表所示。[/size][align=center][font='times new roman'][size=16px]各[/size][/font][font='times new roman'][size=16px]模型超[/size][/font][font='times new roman'][size=16px]参数及预测结果[/size][/font][/align][table][tr][td][align=center][size=13px]算法名称[/size][/align][/td][td][align=center][size=13px]超参数集[/size][/align][/td][td][align=center][size=13px]RMSE[/size][font='times new roman'][size=13px]CV[/size][/font][/align][/td][td][align=center][size=13px]RMSE[/size][font='times new roman'][size=13px]P[/size][/font][/align][/td][td][align=center][size=13px]训练时间[/size][/align][/td][/tr][tr][td][align=center][size=13px]XGBoost[/size][/align][/td][td][align=center][size=13px]树深度为[/size][size=13px]5[/size][size=13px],树的数目为[/size][size=13px]200[/size][size=13px],最小叶子节点权重为[/size][size=13px]2[/size][size=13px],学习率为[/size][size=13px]0.[/size][size=13px]1[/size][/align][/td][td][align=center][size=13px]0.[/size][size=13px]133[/size][/align][/td][td][align=center][size=13px]0.[/size][size=13px]127[/size][/align][/td][td][align=center][size=13px]17.[/size][size=13px]18[/size][size=13px]s[/size][/align][/td][/tr][tr][td][align=center][size=13px]RF[/size][/align][/td][td][align=center][size=13px]树的数目为[/size][size=13px]30[/size][size=13px],树的最大深度为[/size][size=13px]3[/size][size=13px],最小叶子节点样本数目为[/size][size=13px]1[/size][/align][/td][td][align=center][size=13px]0.[/size][size=13px]153[/size][/align][/td][td][align=center][size=13px]0.[/size][size=13px]160[/size][/align][/td][td][align=center][size=13px]18.[/size][size=13px]12[/size][size=13px]s[/size][/align][/td][/tr][tr][td][align=center][size=13px]GDBT[/size][/align][/td][td][align=center][size=13px]学习率为[/size][size=13px]0.[/size][size=13px]1[/size][size=13px],迭代次数为[/size][size=13px]400[/size][size=13px],节点划分最小样本数为[/size][size=13px]2[/size][size=13px],树的最大深度为[/size][size=13px]3[/size][/align][/td][td][align=center][size=13px]0.[/size][size=13px]165[/size][/align][/td][td][align=center][size=13px]0.[/size][size=13px]161[/size][/align][/td][td][align=center][size=13px]17.[/size][size=13px]56[/size][size=13px]s[/size][/align][/td][/tr][tr][td][align=center][size=13px]BP[/size][size=13px]网络[/size][/align][/td][td][align=center][size=13px]激活函数为[/size][size=13px]relu[/size][size=13px],最大迭代次数为[/size][size=13px]500[/size][/align][/td][td][align=center][size=13px]0.[/size][size=13px]182[/size][/align][/td][td][align=center][size=13px]0.[/size][size=13px]179[/size][/align][/td][td][align=center][size=13px]167.[/size][size=13px]31[/size][size=13px]s[/size][/align][/td][/tr][tr][td][align=center][size=13px]SVR[/size][/align][/td][td][align=center][size=13px]核函数为径向基函数,惩罚系数为[/size][size=13px]20[/size][/align][/td][td][align=center][size=13px]0.[/size][size=13px]187[/size][/align][/td][td][align=center][size=13px]0.185[/size][/align][/td][td][align=center][size=13px]60.[/size][size=13px]35[/size][size=13px]s[/size][/align][/td][/tr][tr][td][align=center][size=13px]Stacking[/size][/align][/td][td][align=center][size=13px]以上模型进行融合[/size][/align][/td][td][align=center][size=13px]0.[/size][size=13px]101[/size][/align][/td][td][align=center][size=13px]0.[/size][size=13px]104[/size][/align][/td][td][align=center][size=13px]335.[/size][size=13px]44[/size][size=13px]s[/size][/align][/td][/tr][/table][size=14px]由表可以看出,[/size][size=14px] Stacking[/size][size=14px]模型融合在验证集上的用交叉验证得到的[/size][size=14px]RMSE[/size][size=14px]结果为[/size][size=14px]0.[/size][size=14px]101[/size][size=14px],在预测集上的结果为[/size][size=14px]0.[/size][size=14px]104[/size][size=14px],说明模型融合的方法较单个模型效果要好[/size][size=14px]。[/size]

  • 请教饲料原料氨基酸模型验证实施办法

    新购的近红外设备,后期打算预测饲料原料氨基酸,厂家提供了一些基础模型,问题也出来了,我们怎么校正和验证氨基酸模型呢,难道样品统统送检氨基酸,根据其检测结果再处理么,氨基酸分析仪检测也有一定的误差的,而且这个费用会相当的大,所以在这里跟大家交流一下,你们是如何校正和验证氨基酸模型? 请大家踊跃发言!

  • 求教近红外模型建立

    食品近红外模型建立,两种较相似的食品,检测同一种指标,可用这两种食品建立同一种指标的模型吗?

  • 实验室认可风险的量化评价模型研究

    [font=&]【序号】:10[/font][font=&]【作者】:[b]程燕声[/b][/font][font=&]【题名】:[b][b][b][b][b][b][b]实验室认可风险的量化评价模型研究[/b][/b][/b][/b][/b][/b][/b][/font][font=&]【期刊、年、卷、期、起止页码】:现代测量与实验室管理. 2015,23(02)[/font],页码:[font=&][size=12px][color=#666666]34-36[/color][/size][/font][font=&][/font][font=&]【全文链接】:https://kns.cnki.net/kcms/detail/detail.aspx?dbcode=CJFD&dbname=CJFDLAST2015&filename=XDJL201502013&uniplatform=NZKPT&v=dc8fsEjC2X5ALrcl5IXkx2K8tZwuAB0M4DOApqnXRHtijLQCmwAayeRZyTQddO6w[/font]

  • 【求助】模型转移的问题

    现在使用最广的模型转移算法是所谓的pair matching方法,我的问题是怎么保证那个光谱或者说光谱所测量的体系在校正转移前后是绝对一样的,而不受温度,湿度等等的影响。换句话说,在模型转移的过程中怎么提供一个绝对不变的被测体系呢?

  • 【求助】定量模型的建立遇见的问题

    各位前辈,我是菜鸟,问的问题可能有点弱智,我想咨询一下建立定量模型的问题,在建立定量模型的时候,因样本较少(50多份),我用校正集建立模型,在参数检验的时候,用的是交叉检验,在曲线下面,如果选用Validation检验,R2较小,RMSECV较大,我应该怎样调整我的模型呢,我还想想问一下怎么评价一个模型的好坏,谢谢!

Instrument.com.cn Copyright©1999- 2023 ,All Rights Reserved版权所有,未经书面授权,页面内容不得以任何形式进行复制