来源:赛斯拜克 发表时间:2023-08-08 浏览量:874 作者:awei
农产品品质检测是农业生产与食品工业的重要环节。传统的品质检测方法主要依赖于化学分析、物理检测和感官评估,然而这些方法往往会造成样品的破坏,且检测过程耗时较长。随着科技的发展,高光谱相机技术逐渐应用于农产品品质的无损检测,为农业生产与食品工业提供了新的解决方案。
农产品品质检测是农业生产与食品工业的重要环节。传统的品质检测方法主要依赖于化学分析、物理检测和感官评估,然而这些方法往往会造成样品的破坏,且检测过程耗时较长。随着科技的发展,高光谱相机技术逐渐应用于农产品品质的无损检测,为农业生产与食品工业提供了新的解决方案。
高光谱相机是一种能同时获取样品在多个光谱波段的图像的技术。它通过将光学、电学、计算机等技术相结合,实现了对样品高分辨率和高空间分辨率的图像获取。这种技术的主要优点包括非破坏性、高速度、高精度和能够获取样品完整的物理化学信息。
1. 外观品质检测:高光谱相机可以捕获农产品的颜色、形状、表面纹理等外观特征,通过对这些特征的图像分析,可以实现对农产品外观品质的无损检测。
2. 内部品质检测:通过将高光谱相机与近红外光谱技术结合,可以获取农产品的内部组织信息,如水分、蛋白质、糖分等营养成分的含量。这种方法不仅无损,而且可以快速获取大量信息,大大提高了检测效率。
3. 新鲜度检测:对于一些需要保持新鲜的农产品,如蔬菜、水果等,高光谱相机可以通过分析其表面的微生物含量和代谢产物,预测其新鲜度。
4. 病虫害检测:农作物的病虫害对其品质和产量有重要影响。高光谱相机可以通过分析农作物叶片的光谱信息,检测出病虫害的存在及其严重程度。
三、高光谱相机在农产品品质无损检测应用研究
农产品表面缺陷检测
外部品质是农产品最重要的感官品质,主要通过颜色、纹理、尺寸、形状和表面缺陷进行评估。目前,传统机器视觉技术已经可以实现大多数外部品质的自动检测,但对于特征不明显的缺陷(如损伤、腐烂、冻伤等),缺陷区域的颜色、纹理等信息和正常区域高度相似,基于 RGB 彩色相机的传统机器视觉无能为力。高光谱成像技术的多波长图像优点弥补了传统成像技术的缺点,结合不断丰富的人工智能算法,近年来已被广泛应用于农产品表面缺陷的检测中 [6]。
当前基于高光谱成像的农产品表面缺陷检测,主要集中在对高光谱图像进行降维处理,从海量高光谱图像信息中选取与缺陷相关的特征,依据选取的特征对缺陷进行判别分析。由于高光谱图像光谱波段范围广、波段数量大,且相邻波段之间相关性强,存在信息冗余 [6]。因此,如何有效地进行高光谱数据降维处理,并提取有效特征成为后续分类判别的关键。现有的高光谱图像数据降维方法,主要包括基于变换的特征提取方法和基于非变换的波段选择方法 [7]。
将高维的光谱特征空间按照一定变换准则,投影到一个较低维数的新特征空间,即特征提取。特征提取后得到的新特征分量主要反映了不同对象某一方面的特性,以及区别于其他对象的光谱参量。目前,基于变换的特征提取方法主要采用线性分析方法,如主成分分析、独立成分分析、最小噪声分离等,将高维数据映射到低维空间来有效地表达原始的高维特征,并尝试从选取新的特征分量中得到原始高光谱图像中每个波长图像的权重系数,根据权重系数得到最佳波长。特征波长选择的最终目的是为了开发基于特征波长的多光谱成像系统,以便提高检测效率 [8]。
基于非变换的波段选择方法,从高光谱图像中不同对象的光谱信息入手,将高光谱图像的每一个波段看作一个特征。进行高光谱图像分类时,在原始光谱信号中尝试去搜索 1 组波长子集,即选择特征波长用于待分类对象的检测。近年来,大量的启发式智能搜索算法被提出用于在高光谱全波段中,选取最优的用于分类判别的特征波段,如模拟退火算法、蚁群算法、遗传算法和随机蛙跳算法等。
分类判别用于得到多维空间中的数据到类别的映射关系,主要分为无监督分类方法和监督分类方法。无监督分类方法自发地发现数据中蕴含的层次,不需要先验知识即可实现对数据的分类。如 K 均值聚类法。监督分类则需要训练样本作为先验知识,通过训练样本进行学习,得到分类模型。常见的分类器有最大似然分类法、贝叶斯分类法、决策树、神经网络和支持向量机等 [9]。
以苹果轻微损伤检测为例简述基于变换的特征提取方法,整个方法流程如图 2 所示。研究人员利用主成分分析对苹果高光谱图像进行降维处理 [10],获取不同主成分图像;根据不同主成分图像中缺陷区域与正常区域的差异,选取最佳主成分图像 PC-4;根据该最佳主成分图像中各波长的权重系数大小,确定用于苹果轻微损伤检测的最佳特征波长图像 (780、850 和 960 nm)。对选取的 3 个特征波长的图像再次进行主成分分析,得到最终处理后的 PC-3 图像用于苹果轻微损伤的有效检测。在上述研究的基础上,搭建了 3 个特征波长的多光谱成像系统,并开发相应的检测算法用于苹果缺陷的实时在线快速检测,实现了较好的检测效果。该研究也实现了由高光谱成像到多光谱成像的苹果损伤检测,对于指导水果缺陷的多光谱在线快速检测具有重要意义。该方法在桃和脐橙等水果的轻微损伤、腐烂检测中都得到了应用 [11-12]。
图 2 由高光谱到多光谱成像的苹果轻微损伤检测 [10]
另外,一些研究人员利用基于非变换的波段选择方法探讨水果缺陷的高光谱成像检测。针对蓝莓的损伤检测 [13],首先提取了损伤部位与健康部位的光谱信息,结合特征波长选取算法,建立基于监督分类算法的损伤判别模型,实现健康区域光谱与损伤区域光谱的判别;进而利用建立好的分类器对水果表面每个像素点进行逐次判别,得到蓝莓损伤分布。其次,研究人员采用波段运算来实现损伤检测。采用方差分析,比较不同波段比图像下两类光谱的差异,根据 F 值大小,确定两类光谱差异最大的波段比图像,即 1 235 nm/1 035 nm 图像用于蓝莓损伤的快速检测。同时需要注意的是,由于蓝莓、苹果和桃等图像中缺陷区域与果梗 / 花萼区域具有相似的灰度特征,导致在缺陷检测过程中很难正确区分果梗 / 花萼与缺陷 [14]。因此,在该过程中避免不了对果梗 / 花萼的识别。上述蓝莓损伤的检测研究也提出了波段比图像 (1 200 nm/1 075 nm) 用于蓝莓花萼部位的识别。综合上述分析,开发了蓝莓损伤的高光谱图像快速检测算法 ( 见图 3(a))。类似方法也被用于梨的轻微损伤检测 ( 见图3(b))[15] 和柑橘的缺陷识别 [16] 等。
图 3 基于高光谱成像技术的蓝莓及梨的损伤检测
近年来,随着深度学习技术的出现,基于深度学习的高光谱遥感图像降维和分类在方法和性能上得到了突破性的进展 [17],为其在农产品无损检测研究领域提供了新的契机。
农产品内部品质检测
随着社会的发展和人民生活水平的提高,农产品品质检测也从单一外部品质检测向内外部品质综合检测方向发展。内部品质检测不仅可以提高农产品国际市场竞争力,增加农产品附加价值,还可以满足人民对高品质农产品的需求。传统的农产品内部品质检测方法繁琐、成本高,而且容易造成样本破坏;而光谱及高光谱成像技术具有快速、无损、多组分同时分析的特点,可有效弥补传统检测方式的不足 [18]。
高光谱图像数据具有高分辨率和图谱合一等特点,能够提供样本详尽的光谱信息,提高农产品内部品质的检测精度;但其高分辨率也带来了数据量大、共线性的问题,不仅给数据的存储和传输带来了困难,也给数据的处理带来了巨大的挑战,使得其很难满足水果在线快速检测的需求。因此,如何有效地降低高光谱图像信息的维数,减少数据量,增加检测效率是将高光谱图像技术应用于农产品内部品质检测的一个重要问题 [19]。
特征波长选择是农产品内部品质检测领域中广泛应用的一种光谱数据降维方法。它通过特定的变量选择算法可以从原始的光谱数据中挑选出共线性最小、冗余最少,且包含样本主要有效信息的特定波长光谱,采用所挑选的特征波长变量代替全波长变量建立校正模型,可以使建立的模型更简单、更稳健、更准确。一般认为,特征波长的选择减少了变量数目和无用信息的干扰,加快了模型的计算速度,所建立的模型效果更准确、更稳健。此外,特征波长的选择对于便携式仪器的开发,以及设备成本的降低和仪器的使用维护都具有重要的现实意义。农产品内部品质的特征波长变量选择算法较多,近年来应用较为广泛的主要有无信息变量消除法(uninformative variable elimination, UVE)、竞争性自适应重加权采样法 (competitive adaptive reweighted sampling, CARS) 和连续投影算法 (successive projections algorithm, SPA) 等。图 4 为基于高光谱成像技术的农产品内部品质检测流程。
图 4 基于高光谱成像技术的农产品内部品质检测流程
UVE 算法是一种可消除光谱变量中对样本组分预测无用的变量,最终剩下有用变量的波长选择方法。它将随机产生的噪声矩阵(与光谱矩阵大小相同)加入光谱矩阵中;然后,基于留一交互验证建立偏最小二乘 (partial least square, PLS) 回归预测模型,得到回归系数矩阵;最后,按列计算回归系数矩阵的平均值 M 及标准差 S,通过计算E(i)=M(i)/S(i),根据 E(i) 的绝对值确定选择的特征波长。通常 UVE 选择的波长数量仍较多,因此也衍生出一些组合方法,如蒙特卡罗无信息变量消除法 (Monte Carlo UVE, MC-UVE)。 与 UVE 相 比,MC-UVE 所 选择的特征波长更可靠、更稳定。Li 等 [20] 采用 MC-UVE 算法从梨的近红外高光谱图像(1 000~2 500 nm) 中提取了可溶性固形物的特征波长,与全光谱 237 个波段相比,MCu0002UVE 算法只选择了 40 个作为特征波长,基于特征波长所建立的梨可溶性固形物预测模型优于全光谱所建模型。
CARS 算法是一种结合蒙特卡罗采样与PLS 模型回归系数的特征变量选择方法,它模仿达尔文进化理论中“适者生存”的原则,每次都通过自适应加权采样保留 PLS 模型中回归系数绝对值权重最大的点作为新的子集;然后,基于新的子集建立 PLS 模型,经多次计算,最终选择 PLS 模型交互验证均方根误差最小的子集中的波长作为特征波长。Tian 等 [21] 采用 CARS 算法分别从苹果果皮-果肉层和果肉层样本的可见近红外高光谱图像 (450~1 000 nm) 中提取了苹果可溶性固形物特征波长,CARS 从果皮-果肉层和果肉层光谱中所提取的特征波长数量分别为 92 和 59 个,与全光谱 706 个波段相比分别减少了 87% 和 92%,基于特征波长所建立的预测模型相关系数分别由全波段的0.895 9 和 0.911 6 提高到 0.964 1 和 0.979 8。
SPA 算法将波长投影到其他波长上,利用向量的投影分析比较投影向量的大小,以投影向量最大的波长为待选波长,然后基于校正模型选择最终的特征波长,它可选择光谱变量中含有最少冗余信息及最小共线性的变量组合。Fan 等 [22] 采用 SPA 算法分别从梨的可见 / 近红外高光谱图像(400~1 000 nm) 中提取梨可溶性固形物和硬度的特征波长,所提取的特征波长数量分别为 47 和 26 个,仅是全 706 个光谱波段的6% 和 3%,基于特征波长所建立模型预测精度与全波长范围所建立模型预测精度相近。
此外,由于单一的变量选择算法所选择的波长数量仍较多,在实际的研究和应用中也衍生出了一些组合方法,如 CARSu0002SPA 就是将 CARS 与 SPA 相结合的变量选择方法。Fan 等 [22] 采用 CARS-SPA 算法从梨的可见 / 近红外高光谱图像中提取了梨可溶性固形物和硬度的特征波长,所选择的特征波长数量分别为 25 和 22 个,分别比单一使用 CARS 算法时减少 21 和 19 个,比单一使用 SPA 算法减少 22 和 4 个,而基于 CARS-SPA 所选择的特征波长建立的可溶性固形物和硬度预测模型效果却更优。