视频号
视频号
抖音号
抖音号
哔哩哔哩号
哔哩哔哩号
app
前沿资讯手机看

我要投稿

投稿请发送邮件至:weidy@instrument.com.cn

邮件标题请备注:投稿

联系电话:010-51654077-8129

近红外分会秘书长、中石化石油化工科学研究院教授级高工,一直从事以近红外光谱为主要手段的过程分析成套技术的研发和推广工作。

阅读TA的文章
二维码

我要投稿

投稿请发送邮件至:weidy@instrument.com.cn

邮件标题请备注:投稿

联系电话:010-51654077-8129

近三年光谱结合化学计量学分析技术综述文献的评述(一)

分享到微信朋友圈

打开微信,点击底部的“发现”,

使用“扫一扫”即可将网页分享到朋友圈。

分享: 2022/11/14 17:05:18
导读: 现代光谱分析技术日益得到关注和重视。本文对近三年发表的涉及光谱结合化学计量学为主题的综述论文进行评述,主要论述了这类技术的发展现状、存在的挑战以及未来的发展方向,引用文献351篇。

三年光谱结合化学计量学分析技术综述文献的评述(一)

Commentary on the review articles of spectroscopy technology combined with chemometrics in the last three years

褚小立

(中石化石油化工科学研究院有限公司,北京,100083)


摘要:近些年,现代光谱分析技术得到了迅猛发展,该技术的一个关键特征是采用化学计量学方法对光谱数据进行处理,从而尽可能多地获得有用信息,并且,该技术可直接对不同形态的复杂混合物进行定性和定量分析,在检测速度、成本、效率、通用性、自动化和便携性等方面表现出优于多数传统方法的特殊优势,在农业、食品、制药、石油、化工、烟草、环保和医学等各个领域得到了广泛的应用。因此,现代光谱分析技术也日益得到关注和重视。本文对近三年(2020-2022年)发表的涉及光谱结合化学计量学为主题的综述论文进行评述,主要论述了这类技术的发展现状、存在的挑战以及未来的发展方向,引用文献351篇。

1引言

现代光谱分析技术,如紫外可见光谱(UV-vis)、中红外(MIR)、近红外(NIR)、拉曼光谱Raman)、三维荧光光谱(EEM)、太赫兹(THz)光谱、核磁共振(NMR)光谱、激光诱导击穿光谱(LIBS)等,可直接对不同形态的复杂混合物进行定性和定量分析,具有速度快,效率高,可无损和在线分析等优势,在农业、食品、制药、石油、化工、烟草、环保和医学等各个领域得到了广泛的应用(图1)。该技术的一个显著特点是借助化学计量学方法从光谱数据中尽可能多的提取详细的有价值的化学信息,其目的是为了显著提高分析结果的稳健性和准确性,使传统光谱技术不可实现的应用成为现实。

1 光谱结合化学计量学方法的分析技术框架图


近年来,随着人工智能、大数据、云计算等,尤其是深度学习的快速发展,为化学计量学注入了新思路、新途径和新方法,用于光谱分析的新型化学计量学方法如雨后春笋般涌现出来,成为国内外本领域专家学者的重点和热点研究方向。借助材料学、MEMS制造技术、计算机技术等的进步,光谱类仪器及其应用也得到了长足发展。近三年(2020-2022),光谱结合化学计量学的综述论文也如井喷式般的出现,涉及到光谱学、光谱仪器、化学计量学(机器学习)方法、以及在诸多领域的应用研究等方方面面。本文以“化学计量学(chemometric)” 或“机器学习(machinelearning)”,“光谱(spectroscopy)”或“光谱技术(spectroscopic technology)”或“光谱仪(spectrometer)”,以及“综述(reviewoverview)”为关键词,以2020年至今为时间段,Science DirectScopusWeb of ScienceGoogle Scholar和知网(CNKI)上进行检索,对检索到的351篇综述类论文进行了整理、归纳和评述。

2光谱学与光谱技术

2.1/红外光谱

Beć等综述了量子计算化学在近红外光谱解析方面的进展,指出振动光谱学与计算化学形成的显著的协同作用,随着理论方法和计算机技术的进步,将大大提高振动光谱,特别是近红外光谱的应用潜力[1]。在另一篇综述中,他们论述了明确详细的谱带归属研究对深入认识和理解近红外光谱的重要意义,解释了不同微型光谱仪所提供的化学信息贡献的差异的原因[2]

水光谱组学是一门研究水和水系统分子间氢键组成形态的新兴科学,它通过观察近红外光对水的作用所表征特征峰的变化来分析水系统中溶剂与溶质间的作用关系,具有非侵入性、分析速度快和定性定量等特点。孙岩等总结了用于温控近红外光谱分析的化学计量学方法,以及利用温控近红外光谱技术研究小分子的结构和蛋白质、温敏聚合物结构转变过程等方面的研究工作,利用随温度变化的水光谱信息,可实现对含水混合物的定性和定量分析[3]陈定芳等梳理了水光谱组学的历史沿革、研究方法及其应用现状,阐明了水光谱组学用于测定人体经络脏腑的超分子结构特征的可行性[4]

褚小立等从振动光谱基础理论、光谱仪器硬件和化学计量学3个方面对近红外光谱分析技术的最新进展进行了综述,认为以近红外光谱为核心的商业产品将在不同应用领域进一步提供深化和细化的服务,近红外光谱有望成为与时代发展特征(如人工智能、大数据、云计算物联网等)最相关的一项分析技术[5]王家俊等探讨了在网络化应用环境中,近红外光谱仪器设备存在的硬件差异以及传统化学计量学方法在建模、数据处理存在的不足对近红外光谱的深度应用产生的影响,提出了云计算应用的解决思路,并对大数据时代近红外光谱分析网络化模式的应用前景进行了展望[6]

Fakayode等介绍了近红外光谱、傅里叶变换红外光谱仪器和拉曼光谱的最新技术创新进展,对2015-2018年期间近红外光谱、傅里叶变换红外光谱仪器和拉曼光谱在药品、食品等质量控制和保证等方面的应用现状进行了探究[7]

霍学松等综述了近些年新型的商品化微小型(便携式、手持式和袖珍式)近红外光谱仪器及其应用进展,指出物联网技术在智能农业、智能工厂、智能医疗和智慧城市等众多领域的兴起,成为推动近红外光谱传感器向着微型化方向发展的主要力量[8]Zhu等综述了商品化便携式近红外光谱仪的主要类型,总结并比较了它们的性能指标,还介绍了促进小型化的新技术,对仪器未来发展的前景进行了展望[9]

表面增强红外吸收(SEIRA是一种超灵敏的红外光谱技术,能够实现亚单层膜水平的表面选择性探测。ZhouSEIRA传感机制和理论模型的进展进行了综述,从结构设计、材料选择到结合机器学习算法等方面讨论了优化SEIRA性能的方法[10]

2.2拉曼光谱

Pan等综述了人工智能方法结合拉曼光谱用于分析复杂混合物的进展,包括化学品、食品、药品和医学诊断等,指出拉曼光谱SERS可以与红外光谱相结合,以增强物质识别能力[11]Orlando等综述了拉曼光谱在先进材料科学表征中的应用进展,认为随着现场拉曼分析的推广应用,该技术在未来有望成为材料表征的常规分析技术[12]Löbenberg等系统比较了不同拉曼分析技术的特点,介绍了拉曼光谱作为过程分析技术(PAT)工具在医药产品和工艺开发中的应用进展[13]

2 用于体内上皮组织诊断的快速光纤共焦拉曼光谱系统


Heng等综述了现代拉曼仪器、微型光纤拉曼探针设计和制造的最新进展(图2),论述了实时光纤拉曼光谱在临床内窥镜检查期间改善体内癌前病变和癌症早期诊断等方面具备的潜力[14]Barik等概述了用于体内测量的不同光纤探针,重点介绍了用于生物医学的拉曼光谱探头,并对影响探针提取最佳光谱特征的各种方面,如光纤探头、辐射源、探测器和光谱仪等进行了探究[15]

 

3 基于SERS的传感器在农业应用示意图


表面增强拉曼光谱(SERS)是一种高度灵敏的技术,可增强由某些纳米结构材料支撑的分子的拉曼散射。Han等概述了SERS设备、SERS活性材料制备和SERS测量的详细信息,重点介绍了SERS与化学计量学结合在多个研究领域的最新应用,包括探测表面反应和界面电荷转移、结构表征和化学/生物传感。此外,还讨论了SERS光谱再现性、技术局限性和可能的优化方法[16]Liu对目前SERS农业传感器现状和发展进行了总结,较全面地阐述了SERS在农产品质量安全控制中,对农药残留等有害物质检测的发展和应用(图3),介绍了SERS传感器/基底在不同应用场景中的优势和价值[17]

空间偏移拉曼光谱(SORS)技术可在一定程度上克服通过包装对材料进行定性或定量分析的问题。Arroyo-Cerezo等综述了SORS结合化学计量学方法在食品和农业领域的应用,比较了商业和工业分析仪以及实验室规模的食品和饮料SORS实施情况,讨论了未来在农业食品供应链中的部署途径[18]

低频拉曼光谱(LFR)探测与长程有序(即结晶度)相关的振动模式,该模式可提供固态结构特征和其他特性的独特信息。Bērziņš等详细讨论了LFR的基础理论、仪器和数据分析(包括化学计量学和计算技术的应用)的各个方面,并总结了LFR在药物分析中的新应用[19]

2.3太赫兹光谱

随着光源和探测器组件的迅猛发展,太赫兹(THz谱技术最近在医学、材料、生物传感和制药工业等多个领域都得到了较快发展Feng综述了太赫兹光谱与化学计量学结合的最新进展,以及太赫兹谱在评估食品质量和确保食品安全方面中的应用,并讨论了太赫兹谱的优势和一些固有的局限性[20]Rawson讨论了太赫兹光谱的原理和仪器,重点介绍了太赫兹技术在水分监测、土壤传感、种子分类、品种来源鉴别、残留检测、微生物、毒素和食品腐败检测、食品掺假鉴定、食品或农产品中的异物检测等方面的应用[21]

2.4LIBS光谱

激光诱导击穿光谱法(LIBS)是一种简单、直观、多用途的原子发射光谱法,它将快速脉冲激光束聚焦到样品上,形成含有其组成元素的等离子体,然后使用发射光的光谱分析检测存在的元素。激光诱导击穿光谱技术具有多元素同时检测、结构简单、检测速度快、不受样品形态影响等特点,在诸多领域展现出广阔的应用前景。

Andrade等综述了近些年LIBS样品制备、定性分析、校正策略以及提高LIBS分析灵敏度方法的进展,指出现场应用、在线应用、以及与化学计量学方法的深度融合是未来LIBS技术的主要发展趋势[22]李祥友等综述了激光诱导击穿光谱技术的机理、装置类型、基础研究进展(信号增强方法、定性定量分析方法),以及在深空探测、地质勘探、环境污染、食品安全、工业冶金和生物医疗等领域的应用进展,指出为了实现海量材料的快速、高灵敏度检测,在线LIBS装置的研制将是未来的发展趋势[23]Harmon等论述了实验室和现场LIBS分析技术,综述了LIBS在大气、天然水、矿物、岩石、沉积物和土壤等地球科学领域中的应用研究进展[24]

Wang总结LIBS定量分析技术的最新进展,包括不确定性和误差产生机制、硬件改进和定量校正方法(包括基于物理原理的校正模型、基于数据驱动的校正模型和混合模型),解释了信号不确定性和矩阵效应对LIB定量分析性能的影响,提出了LIBS定量分析的改进策略框架[25]Chen综述了激光诱导击穿光谱(LIBS)与机器学习相结合在地球化学和环境资源勘探中的最新进展,提出了LIBS在未来发展中的潜在应用,包括现场快速筛选和极端环境下的远程探测等。由于LIBS可同时分析轻元素和重元素含量,在工业中,特别是在钢铁、汽车和飞机制造业中变得非常流行[26]Velásquez-Ferrín 论述了LIBS在分析食品微量营养素、基本成分和有毒物质的应用进展,包括谷物、蔬菜、盐、酒精饮料、烟草、糖、肉、鱼、咖啡、茶和水等[27]Legnaioli等综述了激光诱导击穿光谱(LIBS)在工业应用中的进展,包括能源工业、制药业、金属工业、建筑业、食品和饲料工业、资源回收工业等[28]

4 激光诱导击穿光谱成像技术的应用示意图

曾庆栋等综述了便携式LIBS的发展历程,对各种激光光源(小型 Nd:YAG固体激光器、二极管泵浦固体激光器、微片激光器、光纤激光器以及光纤传能的方案)应用于便携式LIBS系统的最新研究进展进行了综述和分类讨论,提出在应用领域应当从“专机专用”的角度着手,即一个样机只针对某个领域的某几种元素,甚至是某几个谱线来设计[29]。Limbeck等综述了LIBS成像仪器和相关化学计量学方法的最近进展,总结了LIBS成像在生命科学、地质学和材料科学领域的应用实例(图4),展示了LIBS在空间分辨分析中的优势,还讨论了该技术的未来前景和潜在应用[30]

2.6微型光谱仪

光学、半导体、智能手机和许多其他制造技术的最新进展促进了光谱仪器的小型化和微型化。从未来的角度来看,这些传感器的小型化和性能改进将导致广泛的传感网络与物联网相结合,提供前所未有的现场诊断,从而为医疗保健和环境监测等许多其他应用提供实时分析。

Yang对光谱仪微型化的技术路线、技术突破及其后续应用进行了系统的分析,总结了过去三十年中所发展的四种微型光谱仪(图5),即色散型(dispersive optics)、窄带滤光型(narrowband filters)、傅里叶变换型(Fourier transform)和计算光谱(reconstructive)。论文指出了微型光谱仪发展历程中的重要技术突破,认为微型光谱仪的发展主要依赖于加工技术的进步和计算能力的提升[31]

5超小型微型光谱仪的四种策略示意图


Biswas等概述了智能手机光谱仪的最新发展,重点是光收集、色散、检测和光谱校准,这些光谱仪可以利用实时物联网将边缘数据传输到云端,在未来,该仪器或将为使用者提供前所未有的现场诊断[32]。Zhi等总结了国内外微型光谱仪的发展现状,重点介绍了微型光谱仪在精准农业中的应用研究进展,指出随着新原理、新工艺和新材料的发展,微型光谱仪在提高特异性的同时,正朝着高性能、高集成度和单芯片方向发展[33]。荧光传感器有着高灵敏度和特异性的优点,Shin等论述了便携式不同类型荧光传感器的特点,并讨论了其在水质监测、生物医学等领域的应用进展[34]

Zhang等从理论、实现和性能指标方面系统地回顾了芯片傅里叶变换光谱仪(FTS)的进展,尤其是芯片静态FTS,包括空间调制、时间调制和空时共调制FTS,指出芯片FTS的应用将会逐渐扩展到食品安全、健康分析和大气探测等领域[35]。Ravindran评述了用于微光谱仪的光栅技术的新研究趋势,探究了评估光栅性能的主要参数,发现光栅效率、凹槽密度、自由光谱范围和分辨率对光栅性能有重要影响[36]。王飞等论述了片上光谱成像系统的分光原理、集成方式,展望了片上光谱成像系统在生物医疗、环境监测、军事装备和智能消费电子等领域的应用前景,指出未来基于片上光谱成像系统的各种光谱成像设备将真正进入掌上时代,深度融入个人日常生活,在食品安全、移动健康等方面展现出其独特的魅力[37]

3 化学计量学算法与策略

3.1概述

Wang等从实用性的角度综述了近十年来在现代光谱分析中应用的各种化学计量学方法,包括光谱预处理、波长(变量)选择、数据降维、定量校正、模式识别、模型传递、模型维护和多光谱数据融合等[38]。Houhou等重点介绍了化学计量学、机器学习和深度学习等人工智能方法用于光谱和成像分析的最新研究和趋势,包括核磁共振、质谱、振动光谱、X射线、原子力显微镜、电子显微镜和二维色谱等,他们认为深度学习在生物医学中的应用,以及数据融合方法,是未来研究的主题之一[39]。Zhang等汇总了用于LIBS多元定量和定性分析的机器学习方法(图6),讨论了模型可解释性、数据集大小、过拟合以及噪声、干扰等问题和挑战[40]。Costa等也综述了用于LIBS的化学计量学方法,比较了多种定量校正方法的优缺点[41]

6 人工智能、机器学习、化学计量学之间的关系示意图

7 用于电化学、光谱学和联用质谱学中的化学计量学方法框架图


Peris-Díaz等引用300多篇文献回顾了2018~2020期间化学计量学方法在电化学、光谱学和联用质谱学中的应用研究和发展趋势(图7),并论述了使用这些方法时要避免的潜在陷阱[42]


8 光谱分析中常用的化学计量学方法工具箱


Meza Ramirez等介绍了应用于光谱分析的机器学习和人工智能背景、概念和方法,及其在生命科学和医疗领域的最新研究进展,并给出了光谱分析中常用的机器学习和人工智能工具箱(图8)[43]。Oliveira等综述了各种分析技术与化学计量学方法结合用于石油泄漏研究中的应用和研究进展,讨论了化学计量学方法的一些概念性和不当使用等问题[44]

Aleixandre-Tudo等对化学计量学在食品科学和技术研究领域的应用进行了文献计量学评估,结果表明,化学计量学是一个内容丰富且发展快速的领域,广泛应用于食品领域[45]。Rocha等综述了2008-2018年期间非线性方法(人工神经网络、支持向量机、自组织映射等)在食品(蔬菜、水果、食用油和奶制品等)分类和预测分析中的应用,讨论了非线性方法相对于传统多元分析方法的优缺点[46]。Carolien等用实例对用于食品质量评估的多种化学计量学方法进行了探究,指出食品科学家和统计学家之间需要跨学科合作,以便正确使用数据分析方法并合理解释结果[47]。Ma等全面综述了神经网络在食品分析(如食品识别、食品供应链安全和组学分析等)中的应用进展,提出友好界面软件包的空白、难以解释的模型行为、多源异质数据等是阻碍神经网络广泛推广应用的主要挑战[48]

3.2光谱预处理与波长选择

由于测量模式、样品状态和其他外部物理、化学和环境因素,光谱仪等分析仪器产生的数据可能包含不必要的变化。数据预处理的总体目标是从信号中去除不必要的变化或影响,以便与感兴趣属性相关的有用信息可用于有效建模。

基线漂移是拉曼、中红外、近红外以及激光诱导击穿光谱等光谱仪器测量过程中经常出现的问题,会对光谱的定量和定性分析产生不利影响。王海朋等系统评述了光谱基线校正的基本算法、改进算法和新型算法及其应用研究进展,认为目前的基线校正算法大都没有从机理或光谱本质方面对基线漂移做出解释,在具体应用时应根据具体的对象加以选择和改进[49]。Mishra等系统介绍了用于光谱预处理的方法,重点论述了新出现的集成融合预处理方法,并归纳出了三种基于集成融合的预处理策略[50]

波长(变量)选择是近红外光谱(NIR)多元校准的重要步骤,也是近红外光谱研究的一个热点。现如今,已经开发了大量的变量选择方法,由于其原理和应用范围的不同,它们具有不同的优点和缺点。Fu等归纳了基于联合策略开发的变量选择方法,联合方法的目的是应用两种或多种变量选择算法,利用它们各自的优势,从高维NIR数据集中更有效地选择特征波长[51]。de Araújo Gomes等则概述了用于食品光谱数据分析中的波长变量筛选方法,并通过定量校正和分类识别实例论述了变量选择的重要性[52]

3.2多维高阶算法

化学多维校正方法具有突出的“二阶或更高阶优势”,被视为借助绿色智能的“数学分离”来替代或增强传统的“物理/化学分离”,这避免或显著简化了样品预处理过程,减少了分析时间。此外,可以消除背景基体和干扰信号的影响,即使在存在未知干扰的情况下,也可以实现对感兴趣的多个分量的同时、快速和准确的定量分析。

Wu等综述了基于各种高阶分析数据的多维校正的理论和分析应用的最新进展,重点讨论了多线性模型及其扩展、具有二阶或高阶优势的多维校正算法以及其他基本问题,并着重介绍了它们对绿色分析化学的贡献,例如在环境样品定量分析中的应用[53, 54]。在另一篇综述中,吴海龙等则系统综述了近5年来二阶、三阶、四阶校正方法与不同高阶分析仪器相结合的代表性应用,强调了多维校正方法对绿色分析化学的贡献[55]

10近红外光谱成像与高阶化学计量学算法用于药物杂质测定和有效期估计的分析流程图


Sun对用于化学和生物制造过程中张量数据分析的方法进行了综述,指出张量数据分析是一种有前景的过程理解和优化工具,为提取有用的过程信息开辟了新的可能性[56]。Vignaduzzo等讨论了高阶化学计量学与多种仪器技术(如紫外-可见光谱、荧光、色谱、电化学等)相结合解决药学定性和定量问题的研究进展,是解决包括降解研究、杂质和原料药测定(溶解试验、均匀性试验等)等问题的有力工具(图10),还讨论了该策略在药物鉴定、PAT和QbD中的应用潜力[57]

Yu等综述了多维校正算法与近红外光谱结合在食品工业过程控制、质量评价、欺诈识别和分类、以及图像分析等方面的应用进展,作者认为,多维算法与光谱数据的结合可以将食品加工数据信息转化为操作知识,能进一步提高对食品系统和食品过程的理解[58]。Mazivila等论述了如何利用多维分辨方法从基于分析物触发的半导体量子点(QD)荧光调制(猝灭/增强)的传感平台中体现激发发射荧光矩阵(EEFM)的二阶优势,包括平行因子分析(PARAFAC)、多元曲线分辨交替最小二乘(MCR-ALS)和基于残差双线性的未展开偏最小二乘(U-PLS/RBL)[59]。de Juan等系统论述了多元曲线分辨(MCR)方法50年的发展历程,重点介绍了MCR在组学、成像或多维色谱等领域的新应用[60]。Mazivila 等则重点论述了MCR-ALS结合光谱和色谱技术在过程分析化学(PAC)和过程分析技术(PAT)中用于实时过程监测和控制的进展[61]

Park等系统综述了二维相关光谱在概念、实验方法和应用研究等方面的进展,强调了二维相关光谱与多元分辨和多元校正方法的结合[62]。Yang等重点综述了二维相关光谱结合多维化学计量学方法在乳制品、酒精饮料、食用油等食品质量检测中的应用[63]。Liu等综述了二维相关光谱在水环境、土壤环境和大气环境检测和分析中的应用,特别是在研究环境中有机物的分子特性以及与金属离子的相互作用机理等方面的进展[64]。Rutherford等讨论了应用于生物流体红外光谱分析的机器学习分类算法,强调了二维红外光谱的多维性及其具有的丰富信息,其与分类算法结合具有令人鼓舞的潜力[65]

3.3多数据融合

多光谱融合技术是将不同类型的光谱进行优化和整合,实现单光谱优势互补,以获得更全面、更可靠、更丰富的特征数据,达到提高模型预测准确性和稳定性的目的。戴嘉伟等对近年出现的多光谱数据融合技术的新策略和新方法进行了综述,作者认为将多光谱仪器硬件与多光谱数据融合算法结合是未来的发展趋势,通过云平台可将多光谱数据的采集和数据的融合处理进行集成,进一步节约人力物力,提高分析效率[66]

11低级、中级和高级数据融合的建模策略(包括深度学习)示意图


Calvin等综述了用于评估食品质量的电子鼻(ENs)、电子舌(ET)和电子眼(EEs)组合系统开发的最新进展,特别讨论了不同数据融合策略的应用(图11)[67]。Azcarate等系统论述了数据融合的不同策略,强调数据结构对选择融合策略的重要性,以及如何将它们合并到不同的数据分析场景中[68]。Mishra等概述了多块数据分析的概念、可执行的各种任务(包括探索性数据分析、预测建模、变量选择、预处理优化和模型转移)以及不同方法的优缺点[69]

3.4深度学习

12人工神经网络家族的Venn


深度学习是近年来非常活跃的一支人工神经网络方法(图12),主要包括CNN、ResNets、自动编码器、GAN、RNN等,在光谱分析中主要有四种应用场景:光谱预处理、分类、回归和光谱特征提取。Debus等综述了深度学习方法及其在分析化学中的应用,包括定量分析、混合物中特定化合物的识别、光谱重建、图像分析和样品分类等[70]。数据规模的增长和计算能力的提高促进了深度学习在光谱及医学影像分析中的应用,但深度学习模型可解释性的不足是阻碍其应用的关键因素。刘煦阳等从算法角度介绍了深度学习及三类可解释性方法的原理,综述了深度学习及可解释性方法在光谱及医学影像分析,提出基于小规模数据的训练策略、增强模型可解释性的方法及可解释模型的构建仍是未来的发展趋势[71]。光谱数据的深度学习建模中的一个主要主题是选择和优化适用于光谱建模特定任务的深度神经网络架构。Passos等基于实现和优化光谱回归和分类两个实例,介绍了一套旨在优化深度学习模型超参数的方法[72]


13传统人工神经网络与深度神经网络的区别


Mishra等就深度学习在近红外光谱数据建模中的主要优点和潜在缺陷进行了批判性和全面的论述(图13),介绍了深度学习在回归、分类、模型更新、模型转移和光谱图像处理等方面的应用,作者认为具有广泛变异性的大光谱数据集是训练更复杂、准确和稳健模型的关键。尽管该文是针对近红外光谱评述的,但许多观点也可扩展适用于其他光谱技术[73]。Nikzad-Langerodi等从化学计量学和分析化学角度概述了迁移学习的理论、概念和应用,并将其与校正模型更新/适应和模型转移向联系,提出了未来的应用前景[74]

Luo等在综述中讨论了深度学习算法在拉曼光谱分析中的最新发展以及这些算法存在的挑战[75]。Mozaffari等综述了一维卷积神经网络在便携式拉曼光谱仪中识别未知物质的研究进展,指出缺乏可用于深度学习的大型拉曼光谱数据库是当前面临的最大挑战[76]。Lussier等论述了应用于拉曼和SERS的深度学习和人工智能方法,涉及食品和饮料,病毒和细菌,刑侦、医疗等领域的定性和定量分析[77]。

Cobas等论述了机器学习(ML)和深度学习(DL)方法在核磁共振信号处理和小分子分析领域的各种应用,包括结构自动验证和溶液中NMR观测值的预测等[78]。Chen等总结了深度学习方法在核磁共振(NMR)光谱学中的应用,认为深度学习方法有可能将NMR光谱学转化为化学和生命科学中更高效和强大的技术[79]

14用于LIBSANN方法


Li等综述了用于激光诱导击穿光谱(LIBS)分析的人工神经网络(ANN)方法(图14),包括反向传播神经网络(BPNN)、径向基函数神经网络(RBFNN)、自组织映射(SOM)和卷积神经网络(CNN)等,比较了这些有代表性人工神经网络方法的网络结构原理及其特点,以及它们在LIBS分析中的应用,深入讨论了变量选择、网络构建、数据集利用、网络训练、模型评估等具体实施时的策略性问题,指出了ANN方法在过拟合和可解释性等方面的局限性,展望了多光谱融合、全谱建模、广义谱、多算法组合等方面的发展[80]。赵文雅等总结了LIBS结合ANN模型在地质、合金、有机聚合物、煤炭、土壤及生物等领域的具体应用,展望了ANN在LIBS光谱深度信息挖掘、便携式专用型设备开发、技术联用等方面的发展前景[81]

Cui等讨论了卷积神经网络(CNN)和递归神经网络(RNN)等深度学习方法在电化学生物传感器、可穿戴电子器件、SERS和基于其他光谱的生物传感器、荧光生物传感器和比色生物传感器中的应用,提出在这些应用程序中,所建模型必须是可解释的(而不是黑匣子)。医疗专业人员和决策者必须能够理解机器决策。同时,人类的知识和推理规则需要以透明的方式纳入深度学习系统,以强制和规范其学习和决策过程。此外,将人类知识和推理规则纳入机器学习过程可以显著减少训练模型所需的样本量[82]。Pradhan等讨论了深度学习在生物光子领域的可能性,包括图像分类、分割、配准、伪染色和分辨率增强,以及深度学习在光谱数据中的潜在用途,如光谱数据预处理和光谱分类,并对深度学习在振动光谱应用面临一些挑战进行了讨论,例如数据的缺乏、光谱的复杂性、光谱内的类间和类内差异以及深度学习模型的可解释性[83]

Nayak等论述了从人工神经网络到深度学习在智能食品加工中的应用进展,包括了该领域从浅层学习到深度学习的详细过程[84]。Liang等论述了近红外光谱和红外光谱与人工神经网络(浅层神经网络和深层神经网络)相结合用于食品质量和安全认证以及品种和产地的可追溯性的研究进展,指出不应盲目追求复杂的神经网络结构,应根据测量数据集的复杂性设计网络,并应专注于研究神经网络轻量级结构和算法[85]。Zhang等的综述侧重于深入学习算法在食品和农产品质量评估中的应用、当前研究的经验教训和未来展望,深度学习方法能够平滑光谱数据并提取信息特征,所以其主要优点之一是通过端到端分析可在很大程度上减少对领域知识的依赖[86]

Mishra等综述了用于高光谱图像特征提取和分类的4种深度学习方法,并归纳了它们在常用数据集中获得的对比结果[87]。Ozdemir等综述了用于高光谱图像特征提取和分类的深度学习算法[88]。Kassem等系统综述了用于图像视觉诊断皮肤病变的机器学习和深度学习方法,认为小数据集、特殊图像选择和种族偏见是当前面临的主要挑战[89]。Zhu等则综述了应用于食品加工领域机器视觉技术的传统机器学习和深度学习方法,应用领域包括食品安全检测、食品加工监控和异物检测等[90]

Jaiswal等综述了高光谱成像结合深度学习在多领域的应用进展,包括生物医学、食品质量、农业、生态、采矿、林业和国防等领域,提出应在高光谱解混合、异常检测、模式识别和数据融合等方面进行深入研究,以有效利用高光谱数据立方体[91]。Wang等从深度学习模型和特征网络两个方面综述了高光谱图像分析在农业中的应用,包括品种分类、成熟度和成分预测、遥感图像分类和植物病害检测,提出了迁移学习、生成对抗网络、半监督学习和主动学习是应对有限标记训练样本挑战的有前景的技术[92]。Odebiri等论述了从传统神经网络向深度学习的过渡,并讨论了遥感数据预测土壤有机碳(SOC)带来的应用潜力和主要挑战[93]。Yang等概述了深度学习技术在园艺领域中的应用场景,以及应用的模型和框架、使用的数据和总体性能结果,包括品种识别、产量估计、质量检测、病虫害管理、生长监测等[94]

3.5标准与规范

拉曼光谱越来越多地应用于生物学、法医学、诊断学、药剂学和食品科学。这种增长不仅是由仪器设备和实验方法的改进引起的,也是由化学计量学技术的发展引起的。Guo等概述了拉曼光谱分析中的化学计量学过程,包括实验设计、数据预处理、数据学习和模型传递,讨论了可能遇到的方法陷阱问题及解决办法,在此基础上提出了化学计量学方法用于拉曼光谱分析的标准化流程,其目的是将基于化学计量学方法的拉曼分析技术从概念验证研究进一步推向实际应用[95]。Barton等论述了用于拉曼光谱分析的化学计量学方法进展,尤其是与仪器和数据校准相关的方法,概述了使用拉曼光谱创建、验证和传递化学计量学模型所需的步骤和应注意的问题[96]。Ntziouni等全面分析了与拉曼光谱相关的标准方法、指南和规范,指出制定通用标准方法对进一步促进拉曼光谱技术的发展和应用至关重要,尤其是对于表面增强拉曼光谱和低分辨率便携式分析仪来说[97]

结合化学计量学的光谱分析方法在疾病筛查和诊断、微生物学研究、法医学和环境调查中非常有吸引力,其中快速、准确和可靠的分类模型是基础。Morais等编写了用于振动光谱数据(FTIR、Raman和近红外)的多元分类分析规程,重点介绍了一系列关键步骤,如预处理、数据选择、特征提取、分类和模型验证[98]。Afara等提出了近红外光谱和成像表征生物组织的工作流程规范,并展示了近红外光谱和成像在探索和诊断生物组织应用中的分析能力[99]。Yang等系统总结了世界范围内的近红外光谱相关的标准,涉及仪器、建模通则和应用方法等[100]

3.6其他

随着校正样本数据集的日益增大、样本来源日益广泛及光谱采集条件日益复杂,非线性方法的使用越来越普遍。Zareef等概述了近红外光谱应用于食品分析的非线性定量和定性校正算法,包括ANN、AdaBoost、SVM、ELM和局部校正方法(LA),讨论了各种方法的优缺点[101]。李明等针对近红外光谱通用模型在农产品和食品检测中的研究进行综述,通过比较传统模型建模方法与通用模型建模方法,分别就建立通用模型过程中样品信息的获取、模型的建立以及样品信息的预测三大建模步骤中使用的方法进行总结,并归纳了近红外光谱通用模型在建模步骤中的要点[102]。Dorantes等针对土壤的光谱分析,综述了校正集大小的选择、通过子集构建目标校正模型,以及通过加标方法实现库转移等建模优化方法和策略[103]。模型转移是用于在光谱仪之间转移光谱校正模型的一类化学计量学方法。传统模型转移方法对标准样品的要求一直是一个挑战,因为此类测量在现实应用中存在困难。Mishra等论述了近年来在模型转移领域取得的研究进展,提出随着人工智能、深度学习和计算能力的不断进步,无标样算法将会得到越来越多的应用[104]

在模式识别中,单类分类方法(one-class classification)是一种只针对一类实例建模分析,以特定的置信水平固定目标样本类的边界,对新样本的类别进行判定的方法,利用这一特点能有效区分不同于真实样本的数据,大大减少了检测的工作量,在食品掺假检测应用领域有一定的发展潜力。唐逸芸等对单类分类方法进行了综述,重点介绍了几种常见的单类分类方法如数据驱动的簇类独立软模式(DD-SIMCA)、单类偏最小二乘(OCPLS)、单类支持向量机(OCSVM)以及单类随机森林(OCRF),论述了该方法在食品真实性鉴别中的应用,包括食用油、乳制品、饮料、保健品、香辛料及谷物等[105]

Lavine等论述了红外光谱两种相似性比对方式(库搜索算法和模式识别方法)的优劣,强调了在使用统计方法比较光谱时,光谱专家参与认证以及光谱高质量的重要性[106]。Ferguson等综述了傅里叶变换红外光谱(FTIR)和量子级联激光红外光谱(QCL)结合机器学习方法在检测和分类不同癌症组织的进展,论文强调了F1得分可作为直接比较模型性能的定量指标,并指出基于集成策略的识别方法往往能得到较好的结果,而且识别技术正在朝着可以捕捉组织复杂性的分层建模方向发展[107]

独立分量分析(ICA)是一种概率方法,其目标是从混合观测信号中提取最大独立和非高斯的基本分量信号。由于分析化学中许多应用获取的数据是成分信号的混合物,因此这种方法非常有用。Monakhova等综述了近年来ICA在荧光、UV-VIS、NMR、振动光谱以及色谱中定量和定性分析的应用,提出了进一步的研究方向[108]

图15 光谱解混技术的研究现状

Research status of spectral unmixing technology


光谱成像中,低空间分辨率和物质异质性等因素造成的图像混合像元问题,使像元级的数据处理和应用难以满足实际需求。光谱解混提取亚像元尺度上的端元和丰度信息,为现实应用的数据精细化定量分析提供技术支撑。杨斌等介绍了近些年光谱解混理论方法和应用的相关研究进展(图15),总结了光谱解混技术与应用研究中的不足和构建二者协同发展的必要性[109]

本文为评述第一部分,第二部分查看请点击此处>>>


[来源:仪器信息网] 未经授权不得转载

用户头像

作者:褚小立 中石化石油化工科学研究院

总阅读量 1w+ 查看ta的文章

网友评论  0
为您推荐 精选资讯 最新资讯 新闻专题

版权与免责声明:

① 凡本网注明"来源:仪器信息网"的所有作品,版权均属于仪器信息网,未经本网授权不得转载、摘编或利用其它方式使用。已获本网授权的作品,应在授权范围内使用,并注明"来源:仪器信息网"。违者本网将追究相关法律责任。

② 本网凡注明"来源:xxx(非本网)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,且不承担此类作品侵权行为的直接责任及连带责任。如其他媒体、网站或个人从本网下载使用,必须保留本网注明的"稿件来源",并自负版权等法律责任。

③ 如涉及作品内容、版权等问题,请在作品发表之日起两周内与本网联系,否则视为默认仪器信息网有权转载。

使用积分打赏TA的文章

到积分加油站,赚取更多积分

谢谢您的赞赏,您的鼓励是我前进的动力~

打赏失败了~

评论成功+4积分

评论成功,积分获取达到限制

收藏成功
取消收藏成功
点赞成功
取消点赞成功

投票成功~

投票失败了~