稻谷中千粒重NIR模型检测方案

收藏
检测样品: 种子
检测项目: 遗传形状
浏览次数: 676
发布时间: 2014-07-31
关联设备: 1种 查看全部
获取电话
留言咨询
方案下载

聚光科技(杭州)股份有限公司

白金19年

解决方案总数: 203 方案总浏览次数:
方案详情
通过采用不同样品量不同定标集和验证集比例以 3 2 5期 党文新等: 样本集选择对稻谷千粒重NIR模型预测精度的影响 及不同定标集选择方法对稻谷千粒重NIR模型影响的 试验研究,可以得出以下结论: 样品数量对稻谷千粒重的NIR模型有明显的影响, 采用合适数量的样品进行光谱扫描,可以提高模型的预 测精度 当样本总数一定时,定标集与验证集的比例不同, 所建模型的预测能力有明显的差异在总样本中,以 70%的样本建立定标模型,其余30%样本作为验证样 本,可以获得较好的预测效果 定标集选择方法明显影响稻谷千粒重NIR模型的 预测能力在含量梯度法K-S算法和随机抽取法中, 采用K-S算法选取定标集进行建模,稻谷千粒重的NIR 模型具有较好的预测能力

方案详情

江西农业学报 2011,23(5):22~24Acta Agriculturae Jiangxi 235期党文新等:样本集选择对稻谷千粒重 NIR模型预测精度的影响 样本集选择对稻谷千粒重 NIR 模型预测精度的影响 党文新,卢晓宇,龚红菊2 (1.江西省轻工业设计院,江西南昌330002;2.南京农业大学工学院,江苏南京210031) 摘 要:为研究样本集选择方法对稻谷千粒重 NIR模型的影响,分别采用不同数量样品,不同定标集、验证集比例以及不同定标集选择方法,选出建模的定标集,在600~1100 nm 的波长区间,用偏最小二乘法建立稻谷千粒重的近红外光谱预测模型,根据内部交叉验证决定系数(R,)、外部验证决定系数(R,)、内部交叉验证误差( SECV) 和预测误差( SEP) 比较模型的预测能力。结果显示,样品数量、定标集和验证集比例以及定标集选择方法均对稻谷千粒重的 NIR 模型有明显影响。采用合适数量的样品可以得到较佳的 NIR 模型,以7:3的比例分割定标集与验证集,得到的稻谷千粒重 NIR 模型具有相对高的预测能力,而与含量梯度法和随机抽取法相比,采用K-S算法进行定标集选择,可以得到预测精度更高的 NIR 模型。 关键词:近红外光谱;样本集;定标集; NIR模型;稻谷 中图分类号:S33文献标识码:A 文章编号:1001-8581(2011)05-0022-03 Effect of Selecting Sample Sets on Predictive Ability ofNIR Model for 1000 -grain Weight of Paddy DANG Wen -xin', LU Xiao-yu², GONG Hong-ju* (1. Jiangxi Designing Institute of Light Industry, Nanchang 330002, China;2. College of Engineering, Nanjing Agricultural University, Nanjing 210031, China) Abstract: The effect of selecting calibration sample sets on the NIR predictive model for 1000 - grain weight of paddy was investi-gated. NIR models were developed by using partial least square regression in the wavelength region from 600 nm to 1100 nm under theconditions of different calibration sets with various paddy quantities, different ratios of the calibration set to the validation set, and dif-ferent methods for selecting the calibration sets. The developed NIR models were evaluated according to determination coefficients forcross - validation (R ’) and for prediction (R2), and standard errors for cross -validation (SECV) and for prediction ( SEP). Theresults showed that the quantity of paddy sample, the ratio of the calibration set to the validation set and the method for selecting cali-bration set all had significant influences upon the NIR model for 1000 - grain weight of paddy. The 7:3 was the optimal ratio of thecalibration set to the validation set for the development of NIR model. The NIR model developed based on the calibration set which wasselected with K-S algorithm had better predictive ability for 1000 - grain weight of paddy than that developed based on the calibrationsets which were selected with the gradient and the random methods. Key words: NIR; Calibration set; Model; Paddy 近红外光谱分析( NIRS) 技术具有快速、实时、非破坏以及可同时分析多种成分等优点,是目前世界上发展最为迅速的定量分析技术之一,在许多领域,尤其是在食品与农产品品质分析方面获得了广泛的应用1~51。NIR光谱分析是一种间接分析技术,需要事先收集一定数量、具有代表性的样本,通过光谱扫描后建模,再根据所建NIR模型进行定量或定性分析。许多的研究结果表明,NIR 模型会受到很多外界条件的影响16~8,温度、样品的粒度10、样品的数量以及品种成熟度等2~14都是影响所建近红外光谱模型的预测能力和精度的重要因素。但是,目前人们对近红外光谱分析理论和应用的研究报道很多,而对样品数量、不同定标集选择方法对 NIR模型影响的研究却很少,相关的系统研究和比较几乎处于空白。本文以不同数量样本、不同方法选择定标集样 本建立稻谷千粒重的NIR 模型,分析比较模型的预测能力,全面系统地研究探讨样品数量和定标集选择方法对稻谷千粒重近红外光谱模型的影响。 1 材料与方法 1.1 试验样本 从目前南方地区普遍种植的稻和粳稻中,选出具有代表性的稻种112个,每个品种2kg稻谷为试验样本。 1.2 千粒重的测定将收集到的112种稻谷样品采用加湿和烘干的方式进行水分调节,使每种稻谷的水分近似相等并小于14%,然后按照 GB 5519—88《粮食和油料千粒重的测定法》,从每种稻谷中数出500粒稻谷,用电子天平(JP2012型,上海精密科学仪器有限公司天平仪器厂,最小读数0.01 g)称重,再折算成千粒重。按此方法对每种稻谷进行3次千粒重测定,总共得到336个已 ( 收稿日期:2011-04-07 ) ( 基金项目:江苏省农机局基金项目资助( gxz09007) 。 ) ( 作者简介:党文新(1957一),男,高级工程师,主要从事食品工程设计研究。*通讯作者:龚红菊。 ) 知千粒重的样本用于建模和模型验证。 1.3 定标集选择方法对 NIR 模型的影响 1.3.1 样品数量对稻谷千粒重 NIR 模型的影响 从每个已知千粒重的样本中,分别数取300、500和800粒稻谷装入样本容器,进行近红外光谱扫描,建立分别用300、500和800粒稻谷扫描数据得到的千粒重 NIR 模型,分析比较样品数量对 NIR 模型的影响。 1.3.2 定标集和验证集比例对稻谷千粒重 NIR 模型影响 将336个样本,分成定标集和验证集两部分,其中,将定标集样本个数占样本总数的比例,分别设定为50%、60%、70%、80%和90%进行建模,分析比较采用不同比例定标集和验证集对所建模型的影响。 1.3.3 含量梯度法对稻谷千粒重 NIR 模型影响 首先将样本按其千粒重的大小顺序(由大到小或反之)进行排列,然后从中按序以隔三抽二的方式抽取224个样本组成定标集建立 NIR 模型,其余112个样本作为预测集对模型进行验证,分析以该方法选择定标集所建模型的预测能力。 1.3.4 Kennard - Stone 法对稻谷千粒重 NIR 模型影响 根据 Kennard -Stone法的设计原理,将336个样本中光谱差异较大的224个样本选入定标集,用于建模,而将其余较相近的112个样本归入预测集进行模型验证,分析以该方法选择定标集所建模型的预测能力。 1.3.5 随机法对稻谷千粒重 NIR模型影响 从336个样本中,随机抽取2/3样本,即224个为定标集,进行建模;其余1/3样本,即112个为验证集,对所建模型进行验证,评价模型的预测能力。 1.4 稻谷千粒重的近红外光谱分析 首先用参比板进行参比扫描,然后从每个样本取约30g稻谷至容器(底部为白色),用 SupNIR -1100 型近红外光谱仪(中国杭州聚光科技有限公司生产),在室温(23±2)℃下进行扫描,波长范围600~1100 nm,分辨率1nm,参比和测量积分时间80 ms,每个样本扫描3次,取平均值存于计算机。 为减少粒度大小、杂光等外部噪声的干扰,用仪器自带的 CM-2000 化学计量学分析软件对原始光谱分别进行多项式平滑、一阶求导和均值中心化的预处理,然后采用偏最小二乘( PLS) 方法建立定标模型,对定标模型进行内部交叉检验,根据决定系数 R,'和交叉验证误差SECV 来评价模型的预测结果。最后再以验证集对模型的预测能力进行外部验证,用决定系数R,'和预测误差SEP 对模型的预测能力进行评价。 2 结果与分析 2.1 样品数量对稻谷千粒重 NIR 模型的影响 对分别采用300、500和800粒稻种进行扫描的近红外光谱,进行25点多项式平滑、1阶求导和标准化处理后,采用 PLS方法建立定标模型,并用验证集对模型进行验证,结果如表1所示。 表1 采用不同数量样品的建模结果 样品量 建模波段 R R, SECV SEP 主因 (粒) (nm) 子数 300 600~1100 0.714 0.659 1.809 1.756 7 500 600~1100 0.623 0.404 1.992 2.218 4 800 600~1100 0.653 0.540 1.920 2.097 5 通过分析比较表1数据可知,样品的数量对模型的预测能力有明显的影响,采用300粒稻种建模,模型的预测误差最小,以更多的样品数量建模,模型的预测能力不会提高,但主因子数会减少,模型会变得相对简单。 2.2 定标集和验证集的比例对稻谷千粒重 NIR 模型的影响 对按不同定标集和验证集比例分割后的样本进行光谱扫描,对得到的原始光谱,同样采用25点多项式平滑、1阶求导和标准化处理后,用 PLS 方法建模并进行验证,结果如表2所示。由表2可知,在总样本数一定的条件下,采用不同比例的定标集建模,模型的预测能力有明显的不同。采用7:3的定标集和验证集比例得到的模型,有最大的决定系数和最小的预测误差。采用太大比例的定标集或太小比例的定标集,所得到的模型预测能力都会降低,因此,在总样本数一定的情况下,定标集和验证集的分割比例定为7:3最佳。 表2 采用不同比例定标集和验证集的建模结果 定标集/建模波段 验证集 (nm) R R SECV SEP 主因 子数 9/1 600~1100 0.646 0.379 1.916 2.055 4 8/2 600~1100 0.685 0.597 1.831 1.835 5 7/3 600~1100 0.714 0.659 1.809 1.756 7 6/4 600~1100 0.668 0.591 1.913 1.762 5 5/5 600~1100 0.663 0.569 2.028 1.862 4 2.3 波长选择方法对模型预测能力的影响 分别用含量梯度法、K-S 算法和随机抽取法从总体样本中选出2/3的样本为定标集,同样采用25点多项式平滑、1阶求导和标准化处理后,用 PLS 方法建模,用其余1/3样本对模型进行验证,结果见表3.由表3可知,不同的定标集选择方法对模型有明显的影响。用随机抽取法得到的模型预测能力最差,不论是交叉验证决定系数还是验证决定系数均最小,而采用K-S算法进行定标集样本选择后,所建立的模型预测能力最好。因此,在利用近红外光谱分析技术进行农产品定量分析时,采用合适的选择方法进行定标集选择,对提高模型的预测能力具有明显的帮助。 表3 采用不同定标集选择方法的建模结果 定标集选择 方法 建模波段(nm) R R, SECV SEP 主因子数 含量梯度法 600~1100 0.679 0.603 1.802 1.9665 K-S算法 600~1100 0.714 0.6591.809 1.756 7 随机抽取法 600~1100 0.649 0.598 1.751 1.935 4 3 结论 通过采用不同样品量、不同定标集和验证集比例以 及不同定标集选择方法对稻谷千粒重 NIR 模型影响的试验研究,可以得出以下结论: 样品数量对稻谷千粒重的 NIR 模型有明显的影响,采用合适数量的样品进行光谱扫描,可以提高模型的预测精度。 当样本总数一定时,定标集与验证集的比例不同,所建模型的预测能力有明显的差异。在总样本中,以70%的样本建立定标模型,其余30%样本作为验证样本,可以获得较好的预测效果。 定标集选择方法明显影响稻谷千粒重 NIR 模型的预测能力。在含量梯度法、K-S算法和随机抽取法中,采用K-S算法选取定标集进行建模,稻谷千粒重的 NIR模型具有较好的预测能力。 ( 参考文献: ) ( [1] Agnew R D, Pa r k R S , Mayne C S . P o te n tial of near inf r ared spectroscopy to predict the voluntary i n take of g r azed gr a ss La i d- law A S . A nim. F eed Sci Tech,2004,115:169~178. ) ( 2] Cozzolino D,Labandera M. Determination of dry matter and cr u de protein contents o f u ndried forages b y near in f rared re f lectance spectroscop y . Food Arg,2002,82:380 ~ 384. ) ( 3]NIicolai Bart M ,Beullens Katrien, Bobelyn Els , et al. Non d estruc-tive measurement o f fruit and vegetable quality by means of NIR spectroscopy: A review [. P o stharvest B iology and T echnology,2007 ,46(2):99~118. ) ( [4] Cen Haiyan,He Yong. Theory an d application of near infrared re- flectance spectroscopy in determination of food quality . Trendsin Food Science & Technology,2007,18: 72~83. ) ( 5] X ie Lijuan, Ying Yibin,Ying Tiejin. Rapid determination of ethyl-ene c ontent i n t omatoes using visible a nd short - wave near -in- ) (上接第21页) ( 获得较好的产量,在劳动力较充足的时节和地方值得提倡;在劳动力紧缺时,应该提倡高产、高效、轻简化耕作栽培模式。本试验方案中的处理D(旋耕20cm撒播,用牛耙平,盖土,芝麻2~3对真叶时用锄头结合中耕除草施肥锄苗)因为通过撒播省工,又省去了工人间苗的繁琐,而且通过锄苗达到了同条播一样芝麻成行、通风、透光的效果,因而在试验方案中获得了较高的产量,同时获得了最高的经济效益。因此,试验方案中的处理D,适宜当前芝麻的大田生产。 ) ( frared spectroscopy and wavelength selection [] . Chemometricsand I ntelligent Laboratory Systems,2009,97:141~145. ) ( 6赵丽丽,赵龙莲,李军会,等.傅里叶变换近红外光谱仪扫描条件对数学模型预测精度的影响[.光谱学与光谱分析,2004, 24(1):41~44. ) ( ]严衍禄,景茂,张录达,等.傅立叶变换近红外漫反射光谱分析测量误差的研究形.北京农业大学学报,1990,16(增刊):37 ~48. ) ( ]祝诗平.基于 PCA 与 GA 的近红外光谱建模样品选择方法 .农业工程学报,2008,24(9):126~130. ) ( ]祝诗诗,王刚,杨飞,等.粉末样品颗粒大小对花椒挥发油近红外光谱定量预测的影响研究形].光谱学与光谱分析,2008 (4):775~779. ) ( [10] M itsumoto M,Ozawa S,Mitsuhashi. The influence of sample te m -perature on t he determination o f m oisture a nd fat c ontentin b eef longissimus by n ear infrared spectroscopy [C] //Davies A M C, Giangiacomo R. Proceeding of the 9th In t ernational C o nference,Near I nfrared Spectroscopy. Chichester,UK: N IR Pub l ications, 2000:805~807. ) ( [11]陈斌,叶静,颜辉,等.定标集样品数对茶叶近红外光谱分析精度的影响影.江苏大学学报,2009,30(4):330~333. ) ( [12] Pe i rs A,Lammerty N J,Ooms K, e t a l. Prediction of the optimal picking date of differen t apple cultivar s by means of VIS/NIR spectroscopy . Postharvest Biology and Technology,2000,21: 189~199. ) ( [13]李东华,季淑娟,重滕和明.果实成熟度对南果梨近红外无损检测技术模型的影响[].食品科学,2009,30(12):266 ~269. ) ( [14]黄安民,费本华,江泽慧,等.表面粗糙度对近红外光谱分析木材密度的影响[].光谱学与光谱分析,2007(9):1700 ~1702. ) ( []尹恩,汪强,徐桂珍,等.芝麻肥水高效利用的研究进展叨.安 徽农业科学,2010(21):11104~11105,11107. ) ( 2]唐雪辉,贺建文,谭顺林,等.芝麻主要农艺性状与产量相关性 及通径分析分.安徽农业科学,2010(26):14293~14294. ) ( 3]叶川,许幸声,黄天宝,等.红壤丘陵区春季黑芝麻品种比较试 验叨.安徽农业科学,2009(6):2537~2539. ) ( 4]姚殿立,李录久,丁楠,等.芝麻高产高效的平衡施肥技术研究 .安徽农业科学,2009(18):8413~8414. ) ( 5]芝麻研究室.优质芝麻新品种皖芝2号及其高产栽培技术.现代农业科技,2009(5):285. ) ( []芝麻研究室.芝麻高产配套轻简栽培基本技术.现代农业 科技,2009(5):288~291,301. ) ◎China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
确定

还剩1页未读,是否继续阅读?

不看了,直接下载
继续免费阅读全文

该文件无法预览

请直接下载查看

聚光科技(杭州)股份有限公司为您提供《稻谷中千粒重NIR模型检测方案 》,该方案主要用于种子中遗传形状检测,参考标准--,《稻谷中千粒重NIR模型检测方案 》用到的仪器有聚光科技 SupNIR-1000 便携式近红外分析仪