来源:赛斯拜克 发表时间:2023-08-17 浏览量:744 作者:awei
高光谱成像仪作为一种先进的遥感技术,具有同时获取图像和光谱的能力,广泛应用于地质调查、环境监测、农业管理等领域。地物识别分类是高光谱成像仪的重要应用之一,通过对地物的光谱信息进行分析,可以实现精确的分类和识别。本文将探讨如何利用高光谱成像仪对地物进行识别分类。
高光谱成像技术的发展是上世纪末对地观测的重大突破,是当前遥感领域前沿技术.高光谱成像波段数目多达几百个,光谱分辨率高达几个纳米,包含丰富的空间辐射和光谱信息21.高光谱在获得空间地物图像的同时,每个像元可以获得一条“连续”的光谱曲线[],所以高光谱遥感成为地面信息获取,地物识别分类,矿物干度绘制的有力工具.尽管高光谱可以提供丰富的地面信息,但其较多的波段数使其数据量巨大,造成日前高光谱数据处理应用水平还远远滞后于成像光谱仪本身的发展.
高光谱可以提供地物连续光谱信息,因而在高光谱出现初期人们就研究如何利用“光谱信息”进行地物识别分类.传统的分类技术处理高光谱高维数据时非常费时,更为严重的是传统的分类技术是基于统计模式进行得,例如最小距离分类法,最大似然分类法.在分类的过程中一次和二次统计量(均值和协方差)都扮演重要角色.由于高光谱波段数增加导致数据维数急剧增加,因而用于参量估计所需的训练样本数目也急剧增加.如果训练样本数目满足不了特征空间维数增加的要求,则估计出的统计量准确度就难以保证,也就得不到满意的分类结果,最终导致的结果就是,当训练样本数目一定时,随着高光谱影像维数的增加,分类准确度“先升后降”,即产生所谓的“Hughes现象”,
本文提出的基于端元(Endme mber2based)的分类方法不需要训练样本,通过特殊的主成分变换对高维数据进行“降维”处理,提取端元(endme mber)并对其进行识别,最后对整幅影像监督分类.同时也
利用了“降维”后的数据进行了非监督分类.利用了广东赛斯拜克SineSpec所研制的高光谱成像仪的实验数据,对影像所覆盖的地物进行了基于端元的监督分类和IsoData非监督分类,并对两者结果进行了比较.
1 实验数据
实验仪器为广东赛斯拜克SineSpec所自行研制的大孔径静态干涉成像光谱仪(SC230),具有高能量通光力和光谱分辨率.波长范围覆盖了可见光和近红外波段,包含128个波段,光谱分辨率可达3nm.本文采用的影像大小为324 MB,包含了丰富的地物资料,不同材料建造的房屋汽车草地小树水泥路(有阴影和无阴影部分)等等.对ENVI提供的数据库进行了重采样使其与实验数据的光谱相匹配.在没有地面样本信息情况下,完全依靠图像本身数据对影像进行分类,期望达到不同种类的地物完全分开.
2 基于端元的监督分类方法
图1为基于端元的高光谱影像处理流程[,针对所处理影像的特点增加了最优波段选取,端元代表一种物质或者材料具有唯一的光谱特性[1.理想情况下,一个端元代表一种纯净的物质,但是事实上由于地面状况的复杂性以及地元分辨率的限制,在图像上很难找到这样的端元[8].利用传感器得到的辐亮度数据经过大气校正得到表观反射率数据,去掉信噪比不好的波段和大气吸收严重的波段,通过最小噪音变换(MNF)分离噪音减少后续运算量,通过像元纯净指数(PPI)计算减少空间维数据量并且找出纯净像元,n2维可视化(n2D Visualization)确定端元光谱,利用光谱库进行端元光谱识别(ID)最后利用SAM分类技术对高光谱影像进行分类.
2.1大气校正及辐射定标
辐射定标就是将遥感器获得的辐射亮度DN值转换为地物的表观反射率值,这样得出的光谱反身率才能直接与地面测量值,或者光谱库中的值进行比较,便于进行光谱识别处理.高光谱数据严重地受到大气影响°!,包括大气散射吸收.吸收主要由水汽二氧化碳臭氧引起,散射主要由大气中的固体颗粒引起,在中红外波段可以利用CO₂吸收带2.005μm进行大气校正,在可见光和近红外波段利用水汽吸收带0.69,0.72和0.76μm进行大气校正.利用图像本身的数据,通过建立大气传输模型进行辐射定标,本文利用的数据是已经经过大气校正的反射率数据.
2.2最优波段选取
在空间维去掉成像质量非常差的区域,在光谱维把信噪比差的波段去掉,把大气吸收严重的波段去掉,以有利于后续处理.由于前几个波段信噪比差,而且光谱差异较小对分类没有帮助,经调整后的波段范围502~900nm舍弃了前39个波段,保留89个波段参与后面的处理.
2.3光谱维减少数据量:最小噪音变换(MNF)
MNF变换是一种特殊的主成分变换,MNF变换用于确定影像数据内在维数,隔离数据中的噪音减少后续处理计算需求[.MNF本质上通过两次主成分变换来实现,第一步变换基于对噪音协方差矩阵的估计,对数据中的噪音去相关和归一化,产生一个图像序列,使得其中的噪音“白化”,即其中的噪音方差为1在序列之间是互不相关的;第二步是对
第一步产生的图像序列实施标准的主成分变换.变换后各成分按照信噪比从大到小的顺序来排列[²]最后数据分成两部分:一部分与大的特征值相对应的特征图像相关,其余部分与接近一致的特征值少及噪音占主导地位的图像相关.这样选取大特征催相对应的特征影像进行后续处理,去除噪音占主与地位的图像,将会提高处理速度而且有利于提取纯净像元.
利用MNF变换对原始图像进行最小噪音变换处理,把噪音从原始影像中分离出来.根据MNF特征值曲线(图2),选取对应大特征值的前11波段影像进行后续处理,其它影像当作为噪音不参与后续处理.图3显示了从反射率图像到MNF变换后的波段影像,可以看出,经过MNF变换后,波段越算后含有波谱信息越少,即噪音越多,所以去掉11波段以后的所有波段,降低数据维数利于影像的后续处理并且不会丢失有用光谱信息.
2.4空间减少数据量:产生像元纯净指数(PPI图像纯净像元指数是一种在高光谱影像中寻找波谱最纯净像元的方法.把像元光谱与n维空间中的点一一对应时,则纯净像元所对应点应该在n维数据云的犄角.具体做法是,将n维散点图重复投影到单位随机向量上去,每次投影后,根据设置的阈值找出每次投影的极值像元(图4),并对这些极值像元累计计数,产生一个像元纯度指数图.图中像元的值代表该像元在投影过程中被标记为极值像元的次数l²1.纯像元就是像元纯度指数图中数值较大的那些像元.本文利用MNF变换后的前11波段进行PP运算,迭代次数设置为20000次,最后得到纯净像元数为1436.
2.5n维可视化进行端元选取
要进行n维可视化,首先要在PPI影像中定义感兴趣区.选取PPI像元值大于等于1的所有像元定义为感兴趣区(ROI),然后导入到n2维可视化器进行端元选取.波谱可以看成是2维散点图中的点,其中n为波段数,n2维空间中点的坐标由n个值组成,它们是某个给定像元相应每个波段中波谱辐亮度值或反射率值.这些点在n2维空间中的分布可以用来估计波谱的端元数.n2维可视化器为人们选取端元提供了一个交互式工具.在n2维可视化器中如果查看先前通过PPI阈值定义的那些纯净像元更为重要,它们是端元波谱的最佳代表,为人们确定端元波谱黛定基础.利用MNF变换后的前11波段,把定义的感兴趣区(纯净像元)导入n2维可视化器,然后通过旋转2维散点云图定义端元,最后选取5种端元光谱作为分类的5种物质(图5).
2.6端元波谱识别
大多数高光谱数据分析方法,只是从影像中找到纯净物质或者是利用光谱库中的光谱与影像中的光谱进行匹配,并不直接进行物质的识别.波谱分析也只是帮助进行波谱识别,并不能直接进行物质识别.该工具运用如二进制编码波谱角分类以及波谱特征拟合等方法,对未知波谱即这里的端元波谱与波谱库中的光谱进行匹配排序.也可以将自己定义的波谱拟合技术添加到波谱分析中,波谱分析的结果是输入波谱库要素的重排序表,由匹配度最好(得分最大)到匹配度最差(得分最小)排序.
端元波谱分析中利用了二进制编码波谱角分类和波谱特征拟合三种方法.二进制编码分类技术根据波段是低于或高于波谱平均值,将端元波谱编
码为0或1.使用“异或”逻辑函数对每一种编码的参考光谱和编码的端元波谱进行比较,根据端元波谱与波谱库中波谱匹配波段的多少来给出一个拟合度得分.
波谱角匹配12](SAM)技术是在n2维空间将像元(这里的端元)与参考波谱进行匹配.这一技术认为每一个像元波谱与n2维空间中的一个矢量相对
应,这里n为波段数.通过计算波谱间的角度a来判定两个波谱间的相似度.夹角α越小说明两个波谱越匹配,得出的匹配度分数就越高.α= arccosXY
,其中x,Y向量分别代表未知光谱和I|X Y参考光谱.
波谱特征拟合(SFF)是一种基于吸收特征的方法,它将参考波谱与未知波谱(这里的端元波谱)都进行包络线去除,接着每条参考波谱都要按比例缩
放以匹配未知波谱1.逐波段地对每条参考波谱和未知波谱使用“最小二乘”拟合,最后生成一幅“匹配度"影像,它可以度量未知波谱与参考波谱之间匹配的程度.所谓包络线去除(continuum re mo val)是将反射率波谱标准化的一种数学处理方法,它用来孤立特殊的吸收特征,然后对其进行分析.包络线去除是一个在波谱顶部凸起的外壳拟合,它用直线段连接局部的波谱最大值,最后将原始波谱值除以包终线值,进行包络线去除.
利用波谱分析时,二进制编码波谱角分类和波谱特征拟合每种方法的权重设置为0.33,对波谱库进行了重新采样,使其与图像波长范围相匹配.
利用波谱分析器对每一种端元光谱都与五种光谱库分别进行匹配(见图6),根据得分的高低来决同的物质,然后利用这五种识别后的端元对整幅影定相应的分类.最后把五种端元光谱识别为五种不像进行分类.
2.7 基于端元的SAM分类及非监督分类
利用前面介绍的波谱角分类技术,将已经识别出的端元光谱与未知波谱间最大角度α设为0.1弧度,对影像进行分类.分类结果如图7(a).
IsoDat a非监督分类法通过计算数据空间中均匀分布的类均值,然后用最小距离技术将剩余的像
元进行迭代聚集.每次迭代都将重新计算均值,且根据所得的新均值,对像元进行再分类.这一过程持续到每一类的像元变化少于所选的像元变化阈值或者达到了迭代的最大次数[.对MNF变换后的前11波段进行IsoData非监督分类,结果见图7(b).
基于端元的监督分类需要人为提取并且识别端元,最后设置相应的阈值对感兴趣区域进行分类.IsoDat a非监督分类采用自动迭代聚类,在分类过程中并不需要人工参与太多.分类结果中白色矩形框所包含的区域为植物覆盖区,这在后来实地光谱测量中得到了证实.基于端元的监督分类结果也很明确地把它划分为植物覆盖区,但是在IsoData非监督分类结果中却没有把植物和周围地物分开.图中椭圆形区域所覆盖的两屋顶光谱差异较大(光谱图中得到),基于端元的监督分类结果也很好的体现了这一点,但在非监督分类结果中表现并不是很明显总之,基于端元的监督分类能够更好地了解人们所感兴趣的区域,也能够提供更多的分类细节.
3 结论
利用西安光机所研制的成像光谱仪(LASIS)对典型地物进行了识别分类.分析了传统统计分类大法在高光谱数据应用中的缺陷,详细阐述了基于端元的高光谱影像分类方法.利用特殊的主成分变换降低高光谱数据维数,克服了传统分类技术“耗时”的特点(高维数据).整个处理过程不需要统计量估计,避免了“Hughes现象”限制,影像处理速度快而且效果较好.从分类的结果看,把地物分为不同种类例如房屋植物等是完全可以实现的,即使是同一类但是不同物质(反射率差异较大)也可以被区分出来.但是IsoData非监督分类做不到这一点.由于实验时草地生长并不是很茂盛,草地并不是完全被绿色覆盖,草地分类效果不理想.还有水泥地的分类不理想,有阴影的水泥路没有分出来.如果要进行植物种类的精细分类,把不同物种的植物分开,就实验数据波长范围和这种分类方法还不能完全做到.如何去除阴影的影响,提高大气校正准确度,进一步提高高光谱识别分类准确度仍然是我们继续研究的重点.
从实验结果分析,利用本台仪器数据完全可以实现不同种类地物分开.本文只是利用了高光谱中的光谱信息,完全没有利用其提供的图像信息.如果再加入一般图像的模式识别方式来实现阴影部分的分类,这样效果就会更好.