特征选择与深度学习相结合的极化SAR图像分类

极化SAR图像是利用合成孔径原理实现的高分辨率地物成像,含有丰富的极化散射信息[1]。极化SAR图像分类对极化合成孔径雷达图像解译有着重要意义,在灾害检测、观测农作物生长、地物目标检测等方面有着广泛的应用。随着对极化SAR图像处理研究的深入,诸多新成果相继出现[2-3]。根据有无利用到数据的先验信息进行分类可分为无监督分类与有监督分类两种方法。传统的无监督分类方法从极化SAR数据的统计特性与目标分解出发[4],文献[5]提出了一种基于目标散射鉴别的极化SAR图像地物无监督分类算法,该方法利用散射相似性参数大小确定散射类别,克服了人工确定散射类别带来的不足。经典的有监督分类算法将最大似然准则应用于极化SAR数据的Wishart分布[6-7],而当数据不满足服从Wishart分布的统计特性时,则会对分类结果产生影响。上述分类方法虽能够对图像的地物实现分类,但是忽略了极化SAR数据多通道特征信息对分类结果的影响,如何更有效地提取极化SAR图像中对不同类别的地区区分度比较高的特征也是实现高精度分类的关键。

近年来,机器学习尤其是深度学习的方法在诸多领域的应用取得了迅速的发展,如已成功应用于图像分类识别、自然语言处理以及语音识别等方面[8-9],而且在极化SAR图像分类应用中也表现出了其优势[10-15]。文献[10]对不同的极化特征组合结合颜色以及纹理特征分别采用机器学习SVM(Support Vector Machine, SVM)以及随机森林分类器实现对极化SAR图像分类。文献[13]根据极化层次语义模型对极化SAR数据进行初始分类,然后对聚集区域使用堆叠自编码模型得到高层特征表示,进而实现地物分类的目的,但算法复杂,分类过程耗时久。在多种类型的神经网络中,卷积神经网络以其独特的网络结构与计算方式在图像识别分类中应用普遍,效果突出。而且与传统分类方法相比,深度学习的方法通过多层网络自动学习极化SAR数据的复杂结构,得到其高层特征表征。而在实际的分类过程中,由于可提取的原始极化SAR特征集维数高,特征与特征之间存在冗余,训练与分类运算量大,且难以辨别哪些特征对分类结果的好坏产生决定性作用。

针对上述问题,本文给出一种基于特征选择与深度学习的极化SAR的图像分类算法。首先从极化SAR数据中通过特征分解等方式获取原始特征参数集,再利用随机森林的方法对特征参数集进行特征筛选得到最优特征,最后以最优特征为输入卷积神经网络进而得到分类结果。利用AIRSAR实测全极化数据与传统经典有监督地分类方法进行实验对比,验证了本文方法的有效性。

2 极化SAR特征

在后向散射系统中,多视的极化SAR图像的每个像素可以用一个散射矩阵S[1]来表示

在单站互易条件下,极化散射矩阵在Pauli基下的目标矢量k为

极化散射矩阵在Lexicographic基下的目标矢量Ω为

式中,T表示转置。其对应的3×3极化相干矩阵C为

式中,H表示共轭转置,Cij为C矩阵的各个元素。其对应的3×3极化协方差矩阵T为

式中,Tij为T矩阵的各个元素。

首先取C矩阵、T矩阵各自对角线元素C11、C22、C33、T11、T22、T33,以上特征分别依次代表了奇次散射、偶次散射及体散射三种散射成分[16]。极化散射总功率为:

通过对T矩阵目标分解得到如下极化SAR特征集:(1)通过特征分解得到特征值λ1、λ2、λ3(λ1≥λ2≥λ3≥0)[1],分别描述了表面散射、二面角散射以及体散射三种散射机制成分在整个散射过程中所占的比重,特征值越大所占比重越高。(2)通过Cloude-Pottier分解得到极化散射熵H、各向异性度A、极化散射角

其中,散射熵H(0≤H≤1)描述了地物的散射随机性,当H较小时可以看成特征值仅有一个不为零(λ1≠0,λ2=λ3=0)的情况,即只有一种散射机制占优势,散射熵较大时散射体处于一个接近完全去极化的随机散射状态,所含散射信息少;各向异性度A描述了特征值λ2与λ3的比值大小关系,可在散射熵较高时对区分不同类型散射机制;极化散射角

描述了散射机制由表面散射

到单次散射

再到二次散射

的变化过程;(3)通过Yamaguchi分解得到表面散射功率PS、二次散射功率PD、体散射功率PV、螺旋散射功率PH四种散射成分[18]。以上17种极化SAR特征构成原始特征集如表1。

3 特征选择

随机森林是属于集成学习的一类bagging方法,它采用多棵决策树集成在一起形成随机森林,采用投票机制实现数据分类的目的。其步骤包括:首先使用随机且有放回的方法从样本集里抽取部分样本建立一棵决策树,决策树在每次分裂时对输入样本进行投票分类,最终的分类结果由决策树产生的投票决定,因此随机森林多用于解决回归及分类问题。其中,在每次重复抽取样本生成决策树时大约有1/3的数据没有被抽到,该部分数据可以用于计算随机森林模型的预测错误率,称为袋外误差。在极化SAR图像分类的应用中可以通过计算随机森林中每一类训练样本的袋外误差值进而计算每个变量即特征的重要性[19],具体计算过程如下:

首先计算每棵决策树与其对应的袋外数据OOB(out of bag)的误差,记为errOOB1;

然后随机地对袋外数据所有样本的特征k加入噪声干扰,再次计算每棵决策树的袋外数据误差,记为errOOB2;

则特征k的重要性I(k)为

其中,nTree为设置决策树的棵数。如果加入随机噪声后,袋外数据准确率大幅度下降,即errOOB2上升,则说明该特征对于样本的预测结果产生影响,以此说明重要程度比较高。

为去除特征之间的冗余以及随机性的干扰,通过式(7)计算每个特征的重要性并以此降序排列,确定删除比例后,从原始特征集中删除相应比例重要性比较低的特征得到特征子集。重复上述排序和删除的过程直至特征子集剩余m个最优特征,其中m为提前设定值。

4 本文算法

本文采用有监督的极化SAR图像分类方法,算法流程图如图1。

(1)预处理。首先对极化SAR图像进行滤波处理,去除图像中的相干斑噪声对分类结果的影响。

(2)对整幅极化SAR图像进行滑窗处理，步长为1，窗口大小为8×8，选取每类地物的部分区域得到训练样本。

(3)极化特征提取。从极化SAR数据中提取极化特征,构成17维原始特征集{C11、C22、C33、T11、T22、T33、H、A、α、Span、λ1、λ2、λ3、PS、PD、PV、PH}。样本中每个像素点用17维特征向量表示。

(4)RF特征选择。设置随机森林的决策树为100棵、删除比例为10%,将训练样本输入随机森林模型进行训练计算每个特征的重要性,从中筛选6维重要性评分较高的特征作为最优特征集。

(5)CNN训练。将经过特征选择后的训练集输入卷积神经网络学习训练,网络结构与卷积核大小个数设置如图2,卷积层与池化层计算步长均为1。卷积神经网络采用局部连接,权值共享的方式对数据进行学习训练,大大减小了计算量。其中每个卷积层负责对卷积核与输入的特征图进行卷积操作再输出新的特征图;池化层负责对特征图的大小进行降维进一步减少参数数量,避免出现训练模型过拟合,常见的池化方式有最大池化与平均池化。本文网络中池化采用最大池化方式;全连接层负责对高层特征表征输出。

整个训练过程分为前向传播与后向传播两部分。训练样本经过前向传播得到其预测类别,假设输入训练集与期望输出的类别标签为(x,y),计算输出预测类别z与期望标签y之间的误差,交叉熵代价函数为

其中n为训练样本数量。然后再经过反向传播和梯度下降算法进行迭代使代价函数的值达到最小。卷积神经网络训练过程中的超参数设置如下:权值由均值为0标准差为0.01的高斯函数初始化,权值更新优化采用Adam算法,学习率为初始值为0.001,最小批次为64,迭代次数为200次。

(6)分类。将整幅图像作为测试集输入训练好的网络模型中,其中softmax层承担分类器的作用,对全连接层输出的特征进行归一化并计算每类地物的后验概率进而得到分类结果。将测试集中每个8×8图像块的类别作为其中心像素点的类别,以此得到整幅图像的分类结果。

5 实验结果及分析

为验证本文方法的有效性,利用美国机载AIRSAR系统采集的San Francisco地区与荷兰Flevoland地区农田的极化SAR图像进行分类实验,并与文献[6]中有监督的Wishart分类器得到的分类结果进行对比。

选用美国机载AIRSAR采集的San Francisco地区L波段实测全极化SAR数据进行实验,数据大小为900×1024,训练样本数量为29358。该地区大致分为5类地物,分别为海洋、森林、高密度城区、低密度城区以及带有一定倾斜角度的建筑物。图3(a)为该数据对应区域的光学图像,图3(b)为Pauli RGB图;图4(a)为有监督的Wishart分类器的分类结果,图4(b)为本文方法的分类结果。

通过观察两种分类结果对照光学图像与Pauli RGB图,可以看出两种方法的分类结果对5类地物的划分基本一致,但从细节上观察首先图4(a)中海洋与城区交接边缘地带A区域存在大量错误分类,海洋被误分为森林;B区域中水体被误分为森林以及C区域带有一定倾斜角度的建筑物分类不如本文方法结果清晰。综上说明本文分类结果整体效果较好,经过随机森林筛选后的极化SAR特征组合{λ3、H、A、α、PS、λ2}对分类结果有重要的影响。

选用美国机载AIRSAR采集的荷兰Flevoland地区农作物全极化SAR数据进行实验,数据大小为750×1024,分辨率为12×6 m,训练样本数目为14682。基于真值图,该组极化SAR数据一直被广泛用于土地与农作物分类算法研究中,其中包括茎豆、甜菜、马铃薯、豌豆、小麦、油菜籽、苜蓿、水域等在内的11类地物。图5(a)为该数据对应区域的Pauli RGB图,图5(b)为部分规则区域的真值图;图6(a)为有监督Wishart方法的分类结果,图6(b)为本文方法的分类结果。

实验2中经过随机森林筛选的特征组合为{α、λ3、A、H、λ2、λ1},首先从主观观察的角度将两种方法的分类结果图6对比图5中的Pauli RGB图以及真值图,图6(a)中利用有监督Wishart分类器的分类结果中有A水域、B小麦、C小麦、D油菜籽四个区域有明显的错误分类。针对图5(b)真值图中各类农作物的标注区域,表2对每类农作物的分类准确率给出了客观说明,其中Wishart分类器的分类结果参照文献[7]中Flevoland地区全极化数据的分类结果,比较明显地可以看出Wishart分类器小麦精度为64.80%,远低于本文算法得到的精度91.93%;另外本文方法中油菜籽、马铃薯、小麦、苜蓿等有7类农作物分类效果比Wishart分类器得到的分类效果好,精度低于80%的也仅有一类草地,分类总精度为90.99%,也远高于Wishart分类总精度为81.63%。

6 结论

为了提高卷积神经网络的分类准确性,本文提出了一种基于特征选择与深度学习的极化SAR图像有监督分类算法,在原始极化SAR特征参数集的基础上利用随机森林对其进行特征筛选,获取最优特征,减小了特征维度,与传统方法比较也体现了卷积神经网络在图像分类应用上的优越性,通过实验证明本文方法一定程度上提高了分类精度。如何对已有的网络作出改进,不局限于一种卷积网络结构,针对极化SAR数据设计稳定高效的深度网络模型,提高数据训练的鲁棒性,是接下来研究的方向。

[1] 李仲森. 极化雷达成像基础与应用[M]. 北京: 电子工业出版社, 2013.

Lee J S. Polarimetric Radar Imaging: From Basics to Applications[M]. Beijing: Publishing House of Electronics Industry, 2013.(in Chinese)

[2] 孙勋, 杨祥立, 涂尚坦, 等. 结合特征选择和大尺度谱聚类的极化SAR图像非监督分类[J]. 信号处理, 2016, 32(6): 684- 693.

Sun X, Yang X L, Tu S T, et al. Unsupervised Classification of PolSAR Images by Combining Feature Selection and Large Scale Spectral Clustering[J]. Journal of Signal Processing, 2016, 32(6): 684- 693.(in Chinese)

[3] Ren B, Hou B, Zhao J, et al. Unsupervised Classification of Polarimetirc SAR Image Via Improved Manifold Regularized Low-Rank Representation With Multiple Features[J]. IEEE Journal of Selected Topics in Applied Earth Observations & Remote Sensing, 2017, PP(99): 1-16.

[4] Lee J S, Grunes M R, Pottier E, et al. Unsupervised terrain classification preserving polarimetric scattering characteristics[J]. IEEE Transactions on Geoscience & Remote Sensing, 2004, 42(4): 722-731.

[5] 陈强, 蒋咏梅, 陆军,等. 一种基于目标散射鉴别的POLSAR图像地物无监督分类新方法[J]. 电子学报, 2011, 39(3): 613- 618.

Chen Q, Jiang Y M, Lu J, et al. A New Scattering-Identification Based Unsupervised Terrain Classification for POLSAR Image[J]. Acta Electronica Sinica, 2011, 39(3): 613- 618.(in Chinese)

[6] Lee J S, Grunes M R, Kwok R. Classification of multi-look polarimetric SAR imagery based on complex Wishart distribution[J]. International Journal of Remote Sensing, 1994, 15(11): 2299-2311.

[7] Lee J S, Pottier E. Quantitative Comparison of Classification Capability_ Fully Polarimetric Versus Dual and Single-Polarization SAR[J]. IEEE Transactions on Geoscience & Remote Sensing, 2001, 39(11): 2343-2351.

[8] 杨真真, 匡楠, 范露, 等. 基于卷积神经网络的图像分类算法综述[J]. 信号处理, 2018, 34(12):1474-1489.

Yang Z Z, Kuang N, Fan L, et al. Review of Image Classification Algorithms Based on Convolutional Neural Networks[J]. Journal of Signal Processing, 2018, 34(12):1474-1489.(in Chinese)

[9] 陈书贞, 解小会, 杨郁池, 等. 利用多尺度卷积神经网络的图像超分辨率算法[J]. 信号处理, 2018, 34(9): 1033-1044.

Chen S Z, Xie X H, Yang Y C, et al. Image Super-Resolution Algorithm Based on Multi-Scale Convolution Neural Network[J]. Journal of Signal Processing, 2018, 34(9): 1033-1044.(in Chinese)

[10] Uhlmann S, Kiranyaz S. Integrating Color Features in Polarimetric SAR Image Classification[J]. IEEE Transactions on Geoscience & Remote Sensing, 2014, 52(4): 2197-2216.

[11] Liu H, Yang S, Gou S, et al. Polarimetric SAR Feature Extraction With Neighborhood Preservation-Based Deep Learning[J]. IEEE Journal of Selected Topics in Applied Earth Observations & Remote Sensing, 2016, PP(99): 1-11.

[12] Chen S W, Tao C S. Multi-temporal PolSAR crops classification using polarimetric-feature-driven deep convolutional neural network[C]∥International Workshop on Remote Sensing with Intelligent Processing. IEEE, 2017: 1- 4.

[13] 石俊飞, 刘芳, 林耀海, 等. 基于深度学习和层次语义模型的极化SAR分类[J]. 自动化学报, 2017, 43(2): 215-226.

Shi J F, Liu F, Lin Y H, et al. Polarimetric SAR Image Classification Based on Deep Learning and Hierarchical Semantic Model[J]. Journal of Automatica Sinica, 2017, 43(2): 215-226.(in Chinese)

[14] 徐丰, 王海鹏, 金亚秋. 深度学习在SAR目标识别与地物分类中的应用[J]. 雷达学报, 2017, 6(2): 136-148.

Xu F, Wang H P, Jin Y Q. Deep Learning as Applied in SAR Target Recognition and Terrain Classification[J]. Journal of Radars, 2017, 6(2): 136-148.(in Chinese)

[15] Li J, Wang C, Wang S, et al. Classification of very high resolution SAR image based on convolutional neural network[C]∥International Workshop on Remote Sensing with Intelligent Processing. IEEE, 2017: 1- 4.

[16] Huynen J R. Phenomenological Theory of Radar Targets[J]. Electromagnetic Scattering, 1978: 653-712.

[17] Cloude S R, Pottier E. A Review of Target Decomposition Theorems in Radar Polarimetry[J]. IEEE Transactions on Geoscience and Remote Sensing, 1996, 34(2): 498-518.

[18] Yamaguchi Y. Four-Component Scattering Model for Polarimetric SAR Image Decomposition based on Asymmetric Covariance Matrix[J]. Technical Report of Ieice Sane, 2005, 104(8): 1699-1706.

[19] Genuer R, Poggi J M, Variable selection using random forest[J]. Pattern Recognition Letters, 2010, 31(14): 2225-2236.