推荐厂家
暂无
暂无
[align=center][b]sup-NIR分析仪在药用辅料快速识别体系建立中的应用研究[/b][/align][align=center]研究生:孙巧凤[/align][align=center]导师:臧恒昌教授[/align][b]摘要目的:[/b]药用原辅料是药品生产过程中的基础物质,也是药品质量的关键影响因素。我国药品生产质量管理规范要求采取核对或检验等适当的措施,确认每一包装内的原辅料正确无误,给制药企业带来了巨大的挑战。近几年国家提出了实行药品与药用原辅料和包装材料关联审批,在政策放宽的情况下,如何低成本、准确而快速的监管原辅料是一个十分关键的问题。欧盟的近红外草案规定当近红外方法应用于原辅料的放行时,可以被称为主要方法,这说明[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]分析技术对于原辅料质量快速评价具有强有力的优势。通过对药用原辅料建立[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]快速分析体系,将有效的推动国产[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱仪[/color][/url]服务于药品生产行业,为广大人民群众的用药安全提供保障。[b]方法:[/b]本实验采用sup-NIR1520对17种不同的药用辅料进行光谱采集,并利用化学计量学方法建立了辅料的快速识别体系,药用辅料数据库建立的方法主要利用光谱间的相关系数值以及偏最小二乘判别分析定性分析方法,数据库的验证结果证明了sup-NIR分析仪在药用辅料定性方面应用的可行性。在建立的PLS-DA模型中发现此仪器不仅可以用于不同种药用辅料之间的快速识别,还可以应用于同种辅料不同型号的样品快速识别。[b]关键词:[/b][url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]分析技术;sup-NIR分析仪;药用原辅料[align=center]Research on the establishment of rapid identification systemof pharmaceutical excipients with sup-NIR analyzer[/align][align=center]Graduatestudent: Qiaofeng Sun[/align][align=center] Supervisor: Hengchang Zang[/align][align=left][b]Abstract Objective[/b]: Pharmaceutical excipients and raw materials arethe basic substances in the production of drugs, and they are the keyinfluencing factors of quality of medicine. GMP requires that appropriatemeasures should be taken to confirm that the materials in each package arecorrect, which has brought great challenges to the pharmaceutical companies. Inrecent years, The State has proposed the associated examination and approval ofdrugs and pharmaceutical excipients and raw materials and packaging materials.Under such circumstances, how to supervise raw and excipients materialsaccurately, quickly is a key technical issue. How to supervise the rawmaterials and excipients with low cost, accurate and fast is a key issue. TheEU's near-infrared draft stipulates that when near-infrared methods are appliedto the release of raw materials and excipients, it can be called the mainmethod, which indicates that NIRS has strong advantages for the qualityevaluation of raw materials and excipients. The establishment of a rapidanalysis system for near-infrared spectroscopy of pharmaceutical raw materialsand excipients will effectively promote domestic portable near-infraredspectrometers to serve the pharmaceutical industry and provide security for thepeople's drug safety. [b]Methods:[/b]In this experiment, 17 kinds of different pharmaceuticalexcipients were collected by sup-NIR1520, and rapid identification database forexcipients was established by chemometrics methods. The method of building thedatabase mainly used the correlation coefficient values and the PLS-DAqualitative analysis method, and the validation results of the database provedthe feasibility of the sup-NIR analyzer in the qualitative application ofpharmaceutical excipients. From the PLS-DA models, it was found that thisinstrument can be used not only for fast identification among differentpharmaceutical excipients, but also for the same kind of excipients ofdifferent types.[/align][align=left][b]Key words:[/b] Near infraredspectroscopy sup-NIR analyzer pharmaceutical excipients and raw materials[/align][b]1 材料1.1 仪器与软件[/b]Sup- NIR1520型[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]分析仪(聚光科技有限公司)工作温度是5-35 ℃,工作湿度是(5-85)%,工作压力为(86-116)kPa;采用带TEC温控系统的InGaAs检测器;光纤漫反射探头;参比盒;RIMP光谱采集及处理软件;MATLAB 2015a数据处理软件。[b]1.2 样品[/b]17种药用辅料均为药厂生产中使用的辅料,质量均符合药典规定标准。17种药用辅料,每种10个批次,共170批样品。[b]2 方法2.1[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]的采集[/b]样品不经预处理,室温条件为20-25 ℃,采用光纤漫反射探头直接采集样品光谱,不同位置重复采集3次光谱,取平均;波长范围为1000-1800nm;扫描次数30次;分辨率为11 nm;以白板作为参比。[b]2.2 辅料识别体系的建立[/b]利用每种辅料7张光谱的内部相关系数确定每种辅料的阈值,以此相关系数阈值为辅料一级识别体系的判断依据,对验证集进行预测,依据相关系数的阈值判断样品的归属,归属多个种类的利用PLS-DA继续分析。建立辅料识别体系的主要策略如图2-1:[align=center][img=,489,347]http://ng1.17img.cn/bbsfiles/images/2018/07/201807251725504841_7871_3389662_3.png!w489x347.jpg[/img][/align][align=center]图2-1 辅料识别体系技术路线图[/align][align=center]2.3样品集的划分[/align]采用Kennard-Stone method(KS法)分别将17种辅料划分为校正集和验证集,其中每种辅料取7个批次作为校正集,3个批次作为辅料识别体系的验证样品,即119个样品为校正集,51个样品作为验证集;其中校正集中,每类辅料的7个光谱取平均作为辅料识别体系的标准图谱。2.4 一级识别体系的建立[b][/b]2.4.1预处理方法的选择本研究考察了标准归一化法、多元散射校正、一阶导数、二阶导数,并根据识别体系的识别率和拒绝率确定最佳预处理方法。[b][/b]2.4.2阈值的确立根据每种辅料的内部相关系数值大小确定此种辅料的阈值,主要规则如下:若同类别的相关系数均大于0.97,为了增大识别体系的准确率,以不同种类间的一般阈值0.97为此类辅料的阈值;若辅料内部出现小于0.97的相关系数值,则以最小值作为此类辅料的判别阈值。[b][/b]2.4.3 结果分析一级识别体系主要是以相关系数值作为判断标准,将17张标准图谱作为一级识别体系的基础,以每种辅料的阈值作为体系的判断种类归属的依据。验证样品首先与标准图谱计算相关系数进行初步判断。[b][/b]2.5二级识别体系的建立某些辅料因结构相似等因素干扰导致无法直接用一级识别体系直接正确判断,存在一个以上大于阈值的相关系数值,则将所有大于阈值的辅料的7张原始光谱导出与内部的3个验证样品进行PLS-DA定性分析并最终归类。并将其建立成PLS-DA判别分析的二级识别体系。[b][/b]2.6识别体系的外部验证按照建立识别体系时相同的方法采集得到外部验证样品光谱,利用外部验证集对辅料识别体系的准确性进行验证,观察该数据库对于外来样品的识别和拒绝情况。[b][/b]3实验结果3.1 样品的原始光谱采用sup-NIR1520光谱仪采集的170批药用辅料的原始光谱图如图2-2所示. 由原始光谱图可以看出不同的辅料光谱之间是存在差异的但同时也存在光谱的重叠。所以需要借助化学计量学方法对其进行光谱矩阵进行数据运算。[align=center][img=,491,240]http://ng1.17img.cn/bbsfiles/images/2018/07/201807251736087373_5680_3389662_3.png!w491x240.jpg[/img][/align][align=center]图2-2 辅料样品的原始光谱图[/align][b]3.2 样品集的划分结果[/b]将样品划分为119个校正集和51个验证集,划分结果见表2-1。校正集119个样品中包括17种样品,每种样品7张光谱,其原始光谱如图2-3-a所示。同样验证集样品包括17种辅料,每种3张验证光谱,其原始光谱如图2-3-b。将119张光谱每7张取平均,每种样品保留一张平均后的光谱作为一级识别体系的标准谱图。标准谱图如图2-4所示。[align=center][img=,575,542]http://ng1.17img.cn/bbsfiles/images/2018/07/201807251736463497_6475_3389662_3.png!w575x542.jpg[/img][/align][align=center][img=,517,297]http://ng1.17img.cn/bbsfiles/images/2018/07/201807251737193350_8509_3389662_3.png!w517x297.jpg[/img][/align]3.3 一级识别体系的建立[b][/b]3.3.1 预处理方法的选择结果样品辅料均为固体粉末,其颗粒大小的不规则性可能会因为影响光程而引入噪音,除此之外,还包括仪器、人为等因素带来的干扰,会使[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]包含一些非样品自身性质的无关信息,为了减少或消除其他因素带来的干扰,采用化学计量学方法对光谱数据进行预处理。首先考察了SNV与MSC预处理方法对光谱矩阵相关系数的影响,具体结果如表2-2所示,由表中数据可知,随机挑出三种辅料的光谱经过SNV和MSC预处理后,三种辅料内部的相关系数以及与验证集的相关系数均不变,通过计算得知这两种预处理方法对于相关系数的影响不大,因此其他辅料没有进行SNV和MSC预处理的考察。导数预处理可以去除基线漂移和背景的干扰,放大光谱间的差异,本研究考察了FD、SD以及不同的平滑窗口宽度对于识别体系识别率与拒绝率的影响,选出最佳的预处理方法以及最佳平滑窗口宽度。识别体系对于自身样品的识别率均为100 %,而拒绝率经过不同的预处理后结果不同,整体考虑FD预处理后的拒绝率最高,因此选择FD作为光谱的最佳预处理方法。由于导数运算的同时会增大噪声的影响,因此应同时进行平滑处理,而不同的窗口宽度产生的平滑效果不同,本研究同时考察了不同窗口宽度的平滑效果,以17种辅料综合考虑来看,当平滑窗口宽度为13时,数据库的识别率和拒绝率最大,因此选FD+SG 13点平滑为最佳预处理方法。[b][/b]3.3.2 阈值的确立本研究是以光谱矩阵中的相关系数值为判断指标,因此每种辅料内部的相关系数阈值的确定十分重要,为了确保阈值的准确可靠,我们用以下两种规则确定阈值:若同类别的相关系数均大于0.97,为了增加识别体系的准确率,以不同种类间的一般阈值0.97为此类辅料的阈值,以甘露醇类辅料为例,如表2-2所示,甘露醇类内的相关系数值均大于0.98,为保证识别体系的验证准确率,以0.97为此类辅料的阈值,相同情况的其他种类的辅料均以0.97为阈值;若辅料内部出现小于0.97的相关系数值,则以最小值作为此类辅料的判别阈值。以十二烷基硫酸钠为例,如表2-3所示为十二烷基硫酸钠相关系数结果,此时阈值选为0.96。相同情况的其他辅料均以最小值为阈值。根据以上两种原则计算出的所有辅料的阈值见表2-4。[align=center][img=,608,428]http://ng1.17img.cn/bbsfiles/images/2018/07/201807251738094300_1550_3389662_3.png!w608x428.jpg[/img][/align][align=center][img=,582,264]http://ng1.17img.cn/bbsfiles/images/2018/07/201807251738082012_8458_3389662_3.png!w582x264.jpg[/img][/align]3.3.3 结果分析将辅料的标准谱图以及验证集样品光谱图经FD+SG 13点平滑预处理,根据2.4中的阈值进行一级识别体系的判别,经过预处理后的谱图见图2-5,计算预处理后的验证集样品与17种辅料的标准谱图之间的相关系数,根据阈值进行辅料种类的归属,此时的验证属于库内验证。一级识别体系的验证存在两种情况,一种是仅有一个相关系数值大于阈值此时可以正确归属该辅料,如图2-6所示为第4个验证样品与17种辅料的相关系数值,横坐标为辅料的编号,纵坐标为相关系数值。从图中看出此验证样品仅与第四个辅料之间的相关系数大于阈值,因此可将其正确的归类为第四种辅料甘露醇。另一种情况是同时出现多个两个或以上的数值大于阈值,此时会出现辅料归属的不确定性。如图2-7所示,第25个验证样品同时与硬脂酸镁和十二烷基硫酸钠相匹配,一级识别体系无法正确判断,应进一步分析。其他验证样品利用相同的原理进行验证。最终的验证结果显示,微晶纤维素类样品PH101、PH102,淀粉类样品糊精、CMS、预胶化淀粉及玉米淀粉,硬脂酸镁及十二烷基硫酸钠三大类样品间因其结构相似无法正确判断,而除此之外的其他样品均能成功识别和拒绝。因此需根据上述三类样品建立PLS-DA定性分析模型,作为识别体系的子库。[align=center][img=,538,603]http://ng1.17img.cn/bbsfiles/images/2018/07/201807251739356596_6435_3389662_3.png!w538x603.jpg[/img][/align][align=center][img=,501,294]http://ng1.17img.cn/bbsfiles/images/2018/07/201807251739346185_9267_3389662_3.png!w501x294.jpg[/img][/align][b]3.4二级识别体系的建立[/b]二级子库的建立是为了将一级识别体系识别中不确定种类的的样品进行进一步的定性分析,子库的建立采用的是PLS-DA定性分析方法。由一级识别体系的验证结果可知共有三大类的样品由于结构相似相关系数值无法正确区分,现根据上述情况建立了三个独立的PLS-DA模型作为一级识别体系的补充。[b]3.4.1淀粉类样品PLS-DA模型的建立[/b]首先将一级识别体系中的玉米淀粉、糊精、预胶化淀粉、CMS的28张原始光谱调出作为定性模型的校正集,将一级识别体系验证集中易混淆的12个样品挑出作为模型的验证集。用上述40个批次的样品建立模型。利用原始光谱建立的PLS-DA模型如图2-8所示,图中后半部分为验证样品,校正集和验证集的识别率拒绝率均为100%,说明利用此方法能将四类辅料完全分开。[align=center][img=,502,266]http://ng1.17img.cn/bbsfiles/images/2018/07/201807251740551806_2263_3389662_3.png!w502x266.jpg[/img][/align][b]3.4.2PH101和PH102辅料PLS-DA模型的建立[/b]PH101和PH102是不同型号的同一种辅料,都属于微晶纤维素,因此结构十分相似,难以区分。利用PLS-DA模型不经预处理即可将两种样品分开,模型的校正集是两种辅料的14张校正光谱图,验证集6个样品。如图2-9所示,图中的红色虚线为PLS-DA生成的判别线,线上方为一类,线下方为另一类。模型校正集和验证集的识别率以及拒绝率均为100%。[align=center][img=,485,281]http://ng1.17img.cn/bbsfiles/images/2018/07/201807251742494590_6583_3389662_3.png!w485x281.jpg[/img][/align][b]3.4.3硬脂酸镁和十二烷基硫酸钠PLS-DA模型的建立[/b]硬脂酸镁与十二烷基硫酸钠在相关系数法判别时也无法正确分开,两种辅料可能是由于结构或者包装等其他因素导致一些相似的特征出现,同样利用PLS-DA模型判别两种辅料,在导入原始光谱时即可完全分开,模型的校正集是两种辅料的14张校正光谱图,验证集6个样品,模型结果见图2-10,模型校正集和验证集的识别率拒绝率均为100%[align=center][img=,509,271]http://ng1.17img.cn/bbsfiles/images/2018/07/201807251744222873_6541_3389662_3.png!w509x271.jpg[/img][/align][b]3.4.4 二级识别体系结果分析[/b]由以上三个定性模型可知,在一级识别体系中无法正确判断的样品均能在不经预处理的条件下利用PLS-DA方法正确区分,识别率和拒绝率均为100 %,说明将相关系数法和PLS-DA法相结合判断药用辅料的种类是可行的,模型结果见表2-5。另一方面说明了sup-NIR1520分析仪可以用来区分这些辅料,实现定性判别的作用。[align=center][img=,528,168]http://ng1.17img.cn/bbsfiles/images/2018/07/201807251745073638_3095_3389662_3.png!w528x168.jpg[/img][/align][b]3.5辅料识别体系的外部验证[/b]由上述结果可知,建立的识别体系在快速识别药用辅料方面是可行的,为了进一步证明此识别体系的准确性和可靠性,设计外部验证集考察模型对于外来辅料的识别能力。[b]3.5.1外部验证光谱图[/b]在相同条件下采集了60个不同种类和批次的样品光谱作为识别体系的外部验证集,样品的原始光谱及预处理后的光谱见图2-11。样品集的验证流程与识别体系内部验证相同,先利用预处理后的相关系数值进行初步判断,如果相关系数值很高的样品再利用PLS-DA模型验证。根据验证结果分为三类具体描述。[align=center][img=,505,260]http://ng1.17img.cn/bbsfiles/images/2018/07/201807251742510972_5235_3389662_3.png!w505x260.jpg[/img][/align][b]3.5.2相关系数直接判别[/b]由一级识别体系直接判断出的验证样品共17个,即与17种辅料的相关系数值中仅有一个值大于阈值,表2-6种列举了其中8个样品的相关系数结果,其中表头中的数字表示验证样品的编号。[align=center][img=,562,543]http://ng1.17img.cn/bbsfiles/images/2018/07/201807251746036984_3446_3389662_3.png!w562x543.jpg[/img][/align][b]3.5.3PLS-DA判别[/b]共有19个验证样品的相关系数值与两种及以上的辅料相似,因此需利用建立的二级识别体系进行进一步的验证,PLS-DA结果显示19个样品均能正确归属种类。表2-7为其中8个验证样品的相关系数结果。其中第10个、16个、25个外部验证样品的PLS-DA分析结果见图2-12、图2-13、图2-14,图中的灰色圆圈代表验证样品,由结果可知利用PLS-DA均能正确识别。[align=center][img=,566,561]http://ng1.17img.cn/bbsfiles/images/2018/07/201807251746386429_3985_3389662_3.png!w566x561.jpg[/img][/align][align=center][img=,490,747]http://ng1.17img.cn/bbsfiles/images/2018/07/201807251742232524_3277_3389662_3.png!w490x747.jpg[/img][/align][b]3.5.4不属于识别体系内的样品[/b]由于外部验证集的范围并不完全在识别体系范围内,所以会出现相关系数值均低于所有阈值的现象,此种情况说明该验证样品不属于识别体系内的任何一种辅料。由检测数据可以看出,24个验证样品均能被识别体系正确拒绝,拒绝率达到100%。由以上三种情况可知,外部验证集的60个样品均能被此识别体系正确的识别和拒绝,再次证明了识别体系的准确性和可靠性,既说明了此方法可以准确的应用到辅料的快速识别,又说明了sup-NIR1520分析仪在辅料定性识别应用中的可行性。[b]4讨论和结论[/b]本实验采用sup-NIR1520分析仪对17种不同的药用辅料进行光谱采集,并利用化学计量学方法建立了17种辅料的快速识别库,证明了sup-NIR1520分析仪在药用辅料定性方面应用的可行性。此自主研发的仪器不仅可以用于不同种药用辅料之间的快速识别,还可以应用于同种辅料不同型号的样品快速识别如PH101和PH102,识别率和拒绝率均达到100%。[align=center][b]参考文献[/b][/align] 王动民, 纪俊敏, 高洪智. 多元散射校正预处理波段对[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]定标模型的影响. 光谱学与光谱分析, 2014, 34(9):2387-2390. BrownC D, Vegamontoto L, Wentzell P D. Derivative Preprocessing and OptimalCorrections for Baseline Drift in Multivariate Calibration. AppliedSpectroscopy, 2000, 54(7):1055-1068.
[align=center][b]sup-NIR分析仪在原料药快速识别体系建立中的应用研究[/b][/align][align=center]研究生:孙巧凤[/align][align=center]导师:臧恒昌教授[/align][b]摘要 目的[/b]:药用原辅料是药品生产过程中的基础物质,也是药品质量的关键影响因素。我国药品生产质量管理规范要求采取核对或检验等适当的措施,确认每一包装内的原辅料正确无误,给制药企业带来了巨大的挑战。近几年国家提出了实行药品与药用原辅料和包装材料关联审批,在政策放宽的情况下,如何低成本、准确而快速的监管原辅料是一个十分关键的问题。欧盟的近红外草案规定当近红外方法应用于原辅料的放行时,可以被称为主要方法,这说明[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]分析技术对于原辅料质量快速评价具有强有力的优势。通过对药用原辅料建立[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]快速分析体系,将有效的推动国产[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱仪[/color][/url]服务于药品生产行业,为广大人民群众的用药安全提供保障。[b]方法[/b]:本实验采用sup-NIR1520对76种不同的原料药进行光谱采集,并利用化学计量学方法建立原料药的快速识别库,数据库的内部及外部验证结果的准确率均为100%,证明了sup-NIR1520分析仪在药用原料快速识别应用方面的可行性。本研究还对不同厂家的雷尼替丁进行了定性分析,利用sup-NIR1520采集光谱并利用支持向量机判别分析建立定性分析模型,模型校正集的识别率和拒绝率均为100%,验证集的识别率和拒绝率分别为100%,88.9%。[align=left][b]关键词[/b]:[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]分析技术;sup-NIR分析仪;药用原料;化学计量学[/align][align=center]Research on the establishment of rapid identification systemof pharmaceutical raw materials with sup-NIR analyzer[/align][align=center]Graduate student: QiaofengSun[/align][align=center]Supervisor: Hengchang Zang[/align][align=left][b] Abstract Objective[/b]: Pharmaceuticalexcipients and raw materials are the basic substances in the production ofdrugs, and they are the key influencing factors of quality of medicine. GMPrequires that appropriate measures should be taken to confirm that thematerials in each package are correct, which has brought great challenges tothe pharmaceutical companies. In recent years, The State has proposed theassociated examination and approval of drugs and pharmaceutical excipients andraw materials and packaging materials. Under such circumstances, how tosupervise raw and excipients materials accurately, quickly is a key technicalissue. How to supervise the raw materials and excipients with low cost,accurate and fast is a key issue. The EU's near-infrared draft stipulates thatwhen near-infrared methods are applied to the release of raw materials andexcipients, it can be called the main method, which indicates that NIRS hasstrong advantages for the quality evaluation of raw materials and excipients.The establishment of a rapid analysis system for near-infrared spectroscopy ofpharmaceutical raw materials and excipients will effectively promote domesticportable near-infrared spectrometers to serve the pharmaceutical industry andprovide security for the people's drug safety.[b]Methods:[/b] In this experiment, 76 kinds of differentpharmaceutical raw materials were collected by sup-NIR1520, and rapididentification database for raw materials was established by chemometricsmethods. The accuracy of the internal and external validation results of thedatabase were 100%, which proved the feasibility of the sup-NIR analyzer in therapid identification of pharmaceutical raw materials. This study also conducteda qualitative analysis of ranitidine from different manufacturers. Samplesspectra were collected using sup-NIR1520 and a qualitative analysis model wasestablished by SVM-DA method. The recognition rate and rejection rate of thecalibration set were both 100%. The recognition rate and rejection rate of thevalidation set were 100% and 88.9% respectively.[/align][align=left][b]Key words:[/b] Near infraredspectroscopy sup-NIR analyzer pharmaceutical raw materials Chemometrics[/align][align=left][b][/b][/align][align=left][b]1材料1.1仪器与软件[/b] Sup- NIR1520型[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]分析仪工作温度是5-35 ℃,工作湿度是(5-85)%,工作压力为(86-116)kPa;采用带TEC温控系统的InGaAs检测器;光纤漫反射探头;参比盒;RIMP光谱采集及处理软件;MATLAB 2015a数据处理软件。[b]1.2样品[/b] 研究中使用的76种药用原料均为药厂生产中使用的原料,质量均符合药典规定标准。[b]2 方法2.1[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]的采集[/b] 样品不经预处理,室温条件为20-25 ℃,采用光纤漫反射探头直接采集样品光谱,不同位置重复采集3次光谱,取平均;波长范围为1000-1800nm;扫描次数30次;分辨率为11 nm;以白板作为参比。[b]2.2原料识别体系建立的方法[/b] 利用每种原料7张光谱的内部相关系数确定每种辅料的阈值,以此相关系数阈值为一级识别体系的判断依据,对验证集进行预测。二级识别体系的建立利用PLS-DA定性分析方法。[/align][align=center][img=,485,349]http://ng1.17img.cn/bbsfiles/images/2018/07/201807251438224494_5055_3389662_3.png!w485x349.jpg[/img][/align][align=center]图3-1 药用原料识别体系技术路线图[/align][align=left][b]2.3样品集的划分[/b] 采用K-S法分别将76种原料划分为校正集和验证集,其中每种样品取7个作为标准校正集,3个作为识别体系的验证集,即532个样品为校正集,228个样品作为验证集;其中校正集中,每种原料的7个光谱取平均作为标准图谱。[b]2.4一级识别体系的建立2.4.1预处理方法的选择[/b] 本研究参考辅料识别体系的预处理方法的考察结果,共考察了FD、SD预处理方法对识别体系的影响,并根据识别体系的识别率和拒绝率确定最佳预处理方法。[b]2.4.2阈值的确立[/b] 根据每种辅料的内部相关系数值大小确定此种辅料的阈值,主要规则如下:若同类别的相关系数均大于0.97,为了增大识别体系的准确率,以不同种类间的一般阈值0.97为此类辅料的阈值;若辅料内部出现小于0.97的相关系数值,则以最小值作为此类辅料的判别阈值。[b]2.4.3结果分析[/b] 一级识别体系主要是以相关系数值作为判断标准,将76张标准图谱作为一级识别体系的基础,以每种辅料的阈值作为判断种类归属的依据。验证样品首先与标准图谱计算相关系数进行初步判断。[b]2.5二级识别体系的建立[/b] 某些原料因结构相似等因素干扰导致无法直接用一级识别体系直接正确判断,存在一个以上大于阈值的相关系数值,则将所有大于阈值的辅料的7张原始光谱导出与验证样品进行PLS-DA定性分析并最终归类。并将其建立成PLS-DA判别分析的二级识别体系。[b]2.6识别体系的外部验证[/b] 按照建立识别体系时相同的方法采集得到外部验证样品光谱,利用外部验证集对原料识别体系的准确性进行验证,观察该数据库对于外来样品的识别和拒绝情况。并根据结果统计出外部验证时样品的假阳、假阴、真阳和真阴的个数。假阳性是指实际为阴性,判断为阳性,在本研究中表示实际不属于识别体系里的样品,但错误判断为识别体系中的某一原料;假阴性表示实际为阴性,判断为阳性;真阳性表示实际为阳性,判断也为阳性;真阴则表示实际为阴性,判断也为阴性。[b]2.7不同生产厂家原料的定性分析[/b] 原料药识别体系的建立仅仅研究了不同种类原料间的相互识别,不同厂家由于原材料及生产条件不同,生产出的原料也会有差异,为了更精确的控制原料的质量,考察sup-NIR1520对更加相似物料的定性能力,本研究设计实验设计实验以原料雷尼替丁为例,收集两个厂家A和B的雷尼替丁原料共52批,其中A厂家28批,B厂家24批。利用SVM-DA定性方法对其样品进行分析。[b]2.7.1[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱[/color][/url]的采集[/b] 样品不经预处理,室温条件为20-25 ℃,采用光纤漫反射探头直接采集样品光谱,不同位置重复采集3次光谱,取平均;波长范围为1000-1800nm;扫描次数30次;分辨率为11 nm;以白板作为参比。[b]2.7.2样品集的划分[/b] 采用KS方法将样品集划分为35个校正集和17个验证集,并使其校正集和验证集在A、B两个厂家中均有相应的占比。[b]2.7.3定性分析模型的建立[/b] 本研究采用SVM-DA定性分析方法进行模型的建立,SVM-DA是一种有监督的定性识别方法,因其在小样本、非线性以及高维模式识别方面具有很大的优势而得到了广泛的应用。通过对不同厂家样品的定性识别,考察了国产[url=https://insevent.instrument.com.cn/t/1p][color=#3333ff]近红外光谱仪[/color][/url]sup-NIR1520在定性识别方面进一步的应用。[b]3实验结果3.1样品的原始光谱[/b] 采用sup-NIR1520光谱仪采集的76种药用原料的原始光谱图如图3-2所示。每种原料包括10个批次,共760个不同批次的光谱。由原始光谱图可以看出,原料光谱的数量很多且重叠严重,无法用感官判断其类别,因此需要借助化学计量学方法建立快速识别体系。[/align][align=center][img=,478,242]http://ng1.17img.cn/bbsfiles/images/2018/07/201807251452131866_5718_3389662_3.png!w478x242.jpg[/img][/align][align=center]图3-2 原料样品的原始光谱图(见实验记录0004196-p67)[/align][align=left][b]3.2样品集的划分结果[/b] 利用K-S法将样品划分为个532校正集和228个验证集。校正集532个样品中包括76种原料,每种样品7张光谱,其原始光谱如图3-3-a所示。验证集样品包括76种原料,每种3张验证光谱,其原始光谱如图3-3-b。将532张光谱每7张取平均,每种样品保留一张平均后的光谱作为一级识别体系的标准谱图。标准谱图如图3-4所示。[/align][align=center][img=,486,244]http://ng1.17img.cn/bbsfiles/images/2018/07/201807251456498371_9484_3389662_3.png!w486x244.jpg[/img][/align][align=center]图3-3 校正集(a)和验证集(b)原始光谱图(见实验记录0004196-p67)[/align][align=center][img=,489,247]http://ng1.17img.cn/bbsfiles/images/2018/07/201807251457411863_46_3389662_3.png!w489x247.jpg[/img][/align][align=center]图3-4 76种药用原料的标准图谱(见实验记录0004196-p68)[/align][align=left][b]3.3一级识别体系的建立3.3.1预处理方法的选择[/b] 由图3-3可知,光谱采集过程中由于粉末颗粒以及背景的干扰,引入了很多无关信息,影响两个样本间相关系数值的大小,进而影响两个样本间的定性关系,因此应首先对预处理方法进行考察,以判断的正确率为评价指标,此正确率包含正确识别以及拒绝占总验证样本数的比例。导数可以去除基线漂移和背景的干扰,放大光谱间的差异,本研究考察了FD+SG 13点平滑、SD +SG 13点平滑对于识别体系相关系数判断正确率的影响,选出最佳的预处理方法。不同的预处理方法对原料的阈值以及验证正确率有很明显的影响,经SD+SG13点平滑预处理后对于某些原料来说结果十分不理想,如艾地苯醌。可能是由于经过二阶导数处理后光谱的噪声被放大,光谱也比原始光谱复杂很多,导致原本相似的光谱差异较大,原本不相似的光谱相关系数增大,大大增加了错误判断的几率。经FD+SG13点平滑预处理后,识别体系的整体结果均很好,正确率均在90 %以上,因此选FD+SG13点平滑为最佳预处理方法。[b]3.3.2阈值的确立[/b] 原料一级识别体系的判断指标即为光谱间的相关系数值,首先应当建立每种原料判别的阈值。阈值的确立方法与辅料识别体系阈值确立方法相同,所有光谱均经过预处理后计算相关系数。若内部相关系数均大于0.97,以0.97为此类原料的阈值,以多索茶碱为例,多索茶碱类内的相关系数值均大于0.98,因此以0.97为此原料的阈值;若原料内部出现小于0.97的相关系数值,则以最小值作为此类原料的判别阈值。以氨磺必利为例,此时阈值选为0.89,相同情况的其他原料均以最小值为阈值。根据以上两种原则计算出的所有原料的阈值见表3-1。[/align][align=center][img=,572,634]http://ng1.17img.cn/bbsfiles/images/2018/07/201807251509149266_5191_3389662_3.png!w572x634.jpg[/img][/align][align=center] [img=,575,216]http://ng1.17img.cn/bbsfiles/images/2018/07/201807251516413473_1093_3389662_3.png!w575x216.jpg[/img][/align][b]3.3.3结果分析[/b][align=left] 标准谱图以及验证集样品光谱图均经过FD+SG 13点平滑预处理,根据阈值进行相关系数的判别,此时的判别属于库内验证。一级识别体系的验证存在两种情况,一种是仅有一个相关系数值大于阈值此时可以正确归属该辅料,如图3-5所示,图中横坐标为76个校正集标准样品,纵坐标为相关系数值,红色横线部分为阈值。另一种情况是同时出现多个两个或以上的数值大于阈值,此时会出现辅料归属的混淆判断,将会再进入更进一步的分析。如图3-6所示,第100个验证样品同时与三个标准样品相匹配,一级识别体系无法正确判断,应进行子库的建立。其他验证样品利用相同的原理进行验证。最终的验证结果显示,以下几种原料之间因结构或其他外在因素存在而无法正确判断:卡铂和顺铂;奥替拉西钾、盐酸格拉司琼、吉美嘧啶、佐匹克隆和盐酸帕洛诺司琼;氨苄西林、阿莫西林、庆大霉素和头孢丙烯;肝素钠、精氨酸、鲨鱼CS和猪CS。而除此之外的其他样品均能成功识别和拒绝。[/align][align=center][img=,556,541]http://ng1.17img.cn/bbsfiles/images/2018/07/201807251520291704_9388_3389662_3.png!w556x541.jpg[/img][/align][b]3.4二级识别体系的建立[/b] 为了提高识别体系的正确率,对相关系数法没有正确识别的少量样品展开进一步的分析,利用常用的定性分析方法PLS-DA建立识别体系的子库。由一级识别体系结果可知,易混淆的样品可归结为四大类,分别为化药类:奥替拉西钾、盐酸格拉司琼、吉美嘧啶、佐匹克隆和盐酸帕洛诺司琼;抗生素类:氨苄西林、阿莫西林、庆大霉素和头孢丙烯;生药类:肝素钠、精氨酸、鲨鱼CS和猪CS;铂类:卡铂和顺铂。分别针对这四大类建立相应的PLS-DA分析模型。每个模型的校正集是由每种原料的7张原始光谱图组成,验证集是由相应种类的3张验证光谱组成。建立的最佳模型结果见表3-2。分别对应的PLS-DA模型如图3-7、图3-8、图3-9、图3-10所示。[align=center][img=,528,438]http://ng1.17img.cn/bbsfiles/images/2018/07/201807251526172294_1698_3389662_3.png!w528x438.jpg[/img][/align][align=center][img=,479,557]http://ng1.17img.cn/bbsfiles/images/2018/07/201807251526386560_8362_3389662_3.png!w479x557.jpg[/img][/align][align=center][img=,525,250]http://ng1.17img.cn/bbsfiles/images/2018/07/201807251527018463_116_3389662_3.png!w525x250.jpg[/img][/align][align=left] 由以上四个定性模型可知,在一级识别体系中容易混淆的样品均能利用PLS-DA方法完全正确区分,说明将相关系数法和PLS-DA法相结合对药用原料进行快速识别是可行的。同时证明了sup-NIR1520分析仪可以用来区分药用原料,实现定性判别的目的。[/align][align=left][b]3.5识别体系的外部验证[/b] 由原料识别体系的结果可知,建立的识别体系在快速识别药用原料方面是可行的,为进一步考察识别体系的准确性和稳健性,设计外部验证集考察模型对于外部样品的识别能力。[b]3.5.1外部验证光谱图[/b] 在相同条件下采集了100个不同种类和批次的样品光谱作为识别体系的外部验证集,样品的原始光谱如图3-11所示。光谱间的信息重叠严重,且有外界因素的干扰,利用化学计量方法对其进行处理及数据运算。[/align][align=center][img=,552,272]http://ng1.17img.cn/bbsfiles/images/2018/07/201807251528381284_5202_3389662_3.png!w552x272.jpg[/img][/align][align=left][b]3.5.2验证结果分析[/b] 外部验证集的验证流程与识别体系的内部验证相同,先利用预处理后的相关系数值进行初步判断,如果有无法识别的样品再利用PLS-DA模型进一步验证。验证结果见表3-7。由表中的数据可知,识别体系的识别率为100%,拒绝率也高达97%。100个外部验证样品中有1个样品验证错误,表现为假阳性,即错误判断为识别体系中的某类原料。这可能是由于识别体系中的原料种类较多,识别体系的复杂程度增加而造成错误的识别。观察发现错误识别的样品相关系数值仅高于阈值千分之几,为保证样品识别的正确率,对于相关系数值十分接近阈值的样品单独进行常规化学分析确定其种类,可降低错误发生的几率。[/align][align=center][img=,494,223]http://ng1.17img.cn/bbsfiles/images/2018/07/201807251530012984_6433_3389662_3.png!w494x223.jpg[/img][/align][align=left] 结合识别体系内部及外部验证结果可知,由sup-NIR采集光谱并利用化学计量学方法建立的原料识别体系可以用于原料的快速识别。[/align][align=left][b]3.6不同生产厂家原料的识别3.6.1样品原始光谱[/b] 52批雷尼替丁的原始光谱如图3-12所示,从光谱图中可以看出,样品间是存在差异的,由于光谱的重叠比较严重,需要借助化学计量学方法进一步分析。[/align][align=center][img=,548,269]http://ng1.17img.cn/bbsfiles/images/2018/07/201807251531576339_3802_3389662_3.png!w548x269.jpg[/img][/align][align=left][b]3.6.2样品集的划分结果[/b] 用KS方法将样品集划分为35个校正集和17个验证集。具体的划分结果见表3-4。[/align][align=center][img=,440,121]http://ng1.17img.cn/bbsfiles/images/2018/07/201807251533111704_9388_3389662_3.png!w440x121.jpg[/img][/align][align=left][b]3.6.3 定性分析模型的建立[/b][/align][align=left] 本研究利用SVM-DA[sup][/sup]对不同厂家的雷尼替丁进行定性分析,此方法主要通过核函数完成数据的维度转换,常用的核函数为径向核函数[sup][/sup]。本研究考察了不同预处理方法对模型结果的影响。可知,在经过MSC+FD+SG13点平滑预处理后,模型校正集的识别率和拒绝率均为100%,验证集的拒绝率也为100%,仅有一个验证样品识别错误,因此选择MSC+FD+SG13点平滑为最佳预处理方法。最佳模型结果如图3-13所示。利用SVM-DA定性方法可以实现不同厂家的原料识别,模型结果较好,同时证明了sup-NIR在同一厂家原料鉴别中应用的可行性。[/align][align=center][img=,437,310]http://ng1.17img.cn/bbsfiles/images/2018/07/201807251626323693_429_3237657_3.jpg!w437x310.jpg[/img][/align][align=center][/align][align=left][b]4 讨论和结论[/b][/align][align=left] 本实验采用sup-NIR1520分析仪对76种不同的原料进行光谱采集,并利用化学计量学方法建立了原料药的快速识别库,证明了sup-NIR1520分析仪在药用原料快速识别应用方面的可行性。并以其中一种原料雷尼替丁为例,搜集不同厂家A和B的雷尼替丁,利用sup-NIR1520采集光谱并利用SVM-DA建立定性分析模型,考察了此仪器在不同厂家原料识别中的应用可行性。两种实验考察结果说明了sup-NIR可以准确的识别原料种类及不同厂家。 药用原料识别体系与辅料识别体系建立的方法基本原理相同,主要依靠光谱间的相关系数值以及常用的PLS-DA定性分析方法。结合两种方法的优点大大提高了识别体系的准确性和简便性。由外部验证结果可知,识别体系的识别率达到100%,拒绝率为97%,相比较于辅料识别体系来说,原料库的种类增加几十种,所以导致识别体系的组成十分复杂,准确率也相应的有所降低,但仍然可以满足日常的快速识别需求。对于不同厂家原料的识别建立了SVM-DA定性模型,模型校正集的识别率和拒绝率均为100%,验证集的识别率和拒绝率分别为100%,88.9%,说明不同厂家的原料间满足某种非线性关系。整体来看模型的正确率较高,可以满足一般的识别要求。本研究首次将sup-NIR分析仪应用到药用原料识别体系的建立并首次应用到同一原料不同厂家的鉴别。为仪器在原料生产及使用厂家的推广提供了很好的理论研究基础。[/align][align=center][b]参考文献[/b][/align] 汪海燕, 黎建辉, 杨风雷. 支持向量机理论及算法研究综述. 计算机应用研究, 2014, 31(5):1281-1286. 钟雄斌. 基于高光谱技术的不同品种猪肉品质检测模型维护方法研究. 华中农业大学, 2014.[align=left][/align][align=left][/align][align=left][/align][align=left][/align][align=left][/align][align=left][/align][align=left][/align][align=left][/align]
以下附件是HACH-DKK的在线油品分析仪,包括蒸馏仪、总硫分析仪、闪点仪、蒸气压仪、浊点、倾点、冷滤点分析仪、色度分析仪、油品识别仪等。其中蒸馏仪、总硫分析仪、蒸气压分析仪取得NEPSI 氢气环境下的防爆认证,这是唯一一个取得中国防爆认证的外国品牌。总硫分析仪则是最先进技术的产品,维护量小,测量达到国V标准,安全可靠,无日常维护的机械与真空部件。