合成孔径雷达(synthetic aperture radar,SAR)是一种高分辨率成像雷达,可以在能见度极低的气象条件下获得高分辨率雷达图像。它具有不受光照、天气等外部条件限制的优点,还可以进行全天时、全天候、长期的监测[1-2]。随着雷达技术的发展,SAR图像监测已经广泛应用于农林监测、灾害预测和军事调查等领域,具有很高的民用价值和军用价值[3- 4]。SAR图像因其特殊的成像机理和图像特点而与光学图像表现不同,难以直观解读。因此,SAR图像的解译是一个极大的挑战,其中,基于SAR图像的目标识别问题更是国内外研究热点。
SAR目标识别算法可以分为两个模块,即特征提取和分类识别。目前常用的识别方法有基于深度学习的算法[5],如卷积神经网络(Convolutional Neural Network,CNN)等[6],该网络具有深层架构,可以完成特征提取与分类识别两个步骤。但是基于神经网络的识别算法需要依赖大量的样本数据,实际应用中,SAR图像样本数据较少,因此,在特征提取与分类识别中都会面临挑战。
其中,SAR图像的特征提取是确保分类识别性能的关键。如果直接使用SAR图像的全部像素点作为特征进行训练,其数据量较大,对运算量要求过高,且会由于冗余信息带来分类误差。特征提取中的典型算法即主成分分析(principal component analysis,PCA)[7],是通过对原始SAR图像投影变换的方式得到特征矢量,降低维度。但是,该方法需预先把图像矩阵转换为向量形式,不仅会破坏2维图像的结构,且由于向量维数过高导致协方差矩阵难以计算,因此,本文采用二维主成分分析(two-dimensional principal component analysis,2DPCA)方法对SAR图像进行特征提取。
近年来,机器学习在图像分类识别领域取得了较好的结果[1]。由于神经网络具有强大的自学习能力、高速寻找最优解等能力,得到了广泛的应用。但是,网络架构的选择以及参数的设置问题都是影响其性能的关键因素。其中,随机网络由于能够通过随机选取网络参数集,把非线性问题近乎简化为线性问题,且不需要迭代优化网络参数而提高其学习速度等特点引起人们的关注[8-9]。其中随机向量函数功能连接(Random Vector Functional Link, RVFL)[10]是随机网络一个典型的模型,其通过随机权重把输入信息投射到更高纬度空间把需要通过多次迭代优化的网络转换为线性最小二乘问题,因此相比迭代学习大大减少了训练网络所需时间。但是在实际应用中,两个重要的参数即随机权重的范围和隐含层节点个数的设置问题依旧存在。针对上述问题,文献[11]提出一种通过不等式约束而随机配置输入权重和偏置且隐藏层节点数逐渐增加的随机配置网络(stochastic configuration network, SCN),有效的降低网络的复杂度且减少了参数的设置,然而在SAR图像目标识别的应用中,面临SAR数据较少的情况,原始SCN算法中针对大量样本采用早停法来防止过拟合的方法[11],会造成网络的性能未达到最优就停止训练的问题,使得网络测试性能不可靠。因此,本文采用L2正则化项来约束SCN的输出权重,对其中较大的权值进行衰减,以此来避免过拟合问题。基于此,提出一种基于2DPCA-SCN正则化的SAR图像目标识别方法,并经过实验验证其提高了SAR图像目标的识别准确率与泛化能力。
本文的其余部分安排如下。第2节介绍2DPCA特征提取方法;第3节介绍SCN模型;第4节是基于2DPCA-SCN的SAR目标识别算法;第5节是SAR图像目标识别实验;第6节为结论。
PCA算法是一种典型的特征提取算法,提取出的SAR图像目标的特征信息与其散射中心信息相对应,而散射中心信息是SAR目标的关键识别特征[12],相比其他算法,PCA更适合应用于SAR图像的特征提取。但是基于PCA算法的特征提取,需要预先将原始的SAR图像转换为向量,这样会破坏SAR图像的2维结构[13]。因此2DPCA算法相比PCA更适用于SAR图像特征提取,既保留了2维图像矩阵结构,同时也能够有效地提取出目标的散射信息。该算法由Yang等人提出[14], 首先由图像的二维矩阵构造协方差矩阵,然后求出最优投影向量进行特征提取。
假设SAR图像的训练样本为{Ii∈Rk×n,i=1,2,...,N},i是训练集中的SAR图像序列号,N表示训练样本总数。样本的散射矩阵为
(1)
其中T表示转置,为全部训练样本的均值,其优化问题可以表示为
(2)
s.t. ΦTΦ=Er×r
(3)
其中 是r阶单位矩阵,文献[14]提出最优列Φ是G对应于r最大特征值的正交广义特征向量。对于测试样本,得到的特征矩阵为
Yt=ItΦ
(4)
其中Yt∈Rk×r,t表示测试数据集中第t个SAR图像样本。
SCN是一种单隐层随机学习模型,其网络结构如图1所示。SCN由输入层,隐含层,输出层组成。与其他网络相比,其最大的特点在于其输入参数(权重和偏置)是通过一个与网络残差有关的约束条件对参数进行配置,且隐含层是动态的,其节点是通过迭代而逐个增加,直到满足停止条件,即网络隐含层节点个数达到预设的最大隐含层节点数Lmax,或者误差达到最小误差容忍度ε。输出层通过解决全局最小二乘问题来计算当前模型的输出权重。因此SCN模型既具有单隐含层结构简单的特点、运算速度快的优点,也避开了传统全连接网络易陷入局部最小值的问题,同时约束与迭代的引入解决了隐含层节点参数的设置问题。并且由于SCN引入了如下约束条件使得模型更佳紧凑,同隐层节点下比RVFL[10]的学习效果更好。
图1 网络结构
Fig.1 Network architecture
SCN模型的约束条件如公式(5)所示。
(5)
其中,L是网络隐含层节点数量,eL-1是当前网络(L-1个隐含层节点)的残差,由式(6)表示。hL是第L个隐含层节点的输出。c为大于0小于1的序列,在寻找参数过程中可以变化。μL为非负实数序列,μL≤1-c且
e=Hβ-y
(6)
其中,eL-1∈Rm,H=[h1,h2,…hL]∈RL×m,y为网络输出,输出权重[β1,β2,...,βL-1,βL]由伪逆的方法求出,如公式(7)得出,
(7)
其中,是广义逆的倒数,T是标签矩阵,||·||F是Frobenius范数。
文献[11]中提出SCN算法在面临大数据样本的时候,可以采用早停法来防止过拟合,即一旦网络性能开始下降,就停止训练。但是针对SAR图像数据样本比较少的情况,早停法会面临网络还没有进行完全的识别分类就已经停止的问题。L2参数正则化是一种权值衰减的方法,能够在优化目标函数的同时对网络较大的权值进行衰减。因此,本文提出通过使用L2正则化项约束网络的方法来避免过拟合问题,经过L2范数约束后的输出权重为
β=(HTH+λ·I)-1HTT
(8)
其中,λ是正则化参数,I是单位矩阵。
在SCN模型中,加入L2范数后,模型的目标函数则为
[β1,β2,...,βL-1,βL]=
(9)
在模型学习过程中,网络在每一次迭代时先增加一个节点,然后对隐含层的输出权重进行权重衰减得到新的输出权重,之后再重构输出矩阵,继续迭代直到达到约束条件。
本文采用2DPCA特征提取方法与SCN算法进行集成的方法对SAR图像目标进行识别,同时在SCN算法中加入L2正则化项对网络的输出权重进行权值衰减以免网络发生过拟合问题,提出方法的流程图如图2所示。由于目标区域位于原始的SAR图像中心,首先去除原始128*128的SAR图像边缘部分,得到88*88大小的切片以达到减少数据量的目的,然后获取图像像素点数据,再通过2DPCA方法对图像进行特征提取以获得有效的特征信息,最后将训练样本与测试样本的特征信息输入到SCN中进行目标识别。
本文所采用的实验数据是由Sandia国家实验室在90年代由SAR传感器采集的SAR图像,即运动和静止目标获取与识别(Moving and Stationary Target Acquisition and Recognition, MSTAR) [15]。该数据集被广泛用于测试SAR图像目标识别、分类等算法的性能。其中,包括不同的目标类型、俯仰角、方位角、外型配置和型号变化的目标SAR图像,网上公开的数据集包含10类不同的地面目标(装甲车:BMP-2,BRDM-2,BTR- 60,BTR-70;坦克: T-72,T- 62;火箭发射器:2S1;推土机:D7;防空单元:ZSU-234;军用卡车:ZIL-131)。图3显示了该数据集中的10种军事目标及其相应的光学图像。
图2 本文识别算法流程图
Fig.2 Illustration of the proposed target recognition method
图3 十类目标的光学图像及对应的SAR图像
Fig.3 Types of military targets:(top) optical images versus (bottom) SAR images
根据SCN的网络结构可知,网络迭代次数是由最大隐层节点数Lmax这个参数所决定的,因此合适的Lmax是优化网络的整体结构与性能的关键。若Lmax选取过小可能会导致网络处于欠拟合状态,此时网络尚未训练完全,无法发挥网络的全部性能。但如果Lmax选取过大则会导致网络处于过拟合状态,此时随着迭代次数的增加,模型的复杂度逐渐增加,网络的训练误差逐渐减少,但模型的泛化能力下降,网络在测试集上的误差反而会增大,过拟合情况下网络的训练误差与测试误差如图4所示,从图中可以看出,增加隐含层节点个数,会降低训练误差和测试误差,但若节点个数超出表达数据本身的个数,则会出现过拟合现象。因此我们选用加入L2正则化进行约束网络,在训练过程中对输出权重中较大的权值进行衰减,从而避免过拟合。
图4 过拟合情况下的训练误差与测试误差
Fig.4 Training error and test error in the case of overfitting
在本文中,主要利用MSTAR数据集分别在标准操作条件(SOC)下和扩展操作条件(EOC)进行实验,以验证提出方法的性能。标准操作条件即训练集与测试集中的SAR图像目标的外形配置与型号相同,仅成像角度与方位角不同;扩展操作条件是指训练集与测试集中的SAR图像目标存在较大差异,主要是成像角度有很大的改变、外形配置不同等[1]。我们以4∶1的比例从训练集、测试集中随机选取样本构成实验数据集。首先,获取到88*88像素大小的SAR图像切片,为减少数据参数量,将88*88的图像切片压缩至28*28,然后采用2DPCA算法对SAR图像进行特征提取出28*15像素大小的特征信息,对得到的特征信息进行归一化至[0,1],最后将样本特征信息输入到L2-SCN中进行目标识别。
5.2.1 SOC实验
SOC下参照文献[15],训练集是17°俯仰角下采集到的SAR图像,而测试集是15°俯仰角下采集到的SAR图像,俯仰角相差2°被认为差异可以忽略。具体的实验样本数据如表1所示。使用2DPCA结合L2-SCN算法对10类SAR目标进行识别并对比分析其结果,网络的相关参数设置为Lmax=400,ε=0.05,λ=0.1。
表2是SOC实验的识别率混淆矩阵,每一列表示网络的预测结果,每一行表示目标的真实归属类别。从表中可以发现,9类目标的识别率分别达到94%以上,其中有4类目标识别率分别达到100%,仅有BRDM2这一类目标识别率较低,只有76%,这说明该算法能够有效的对10类目标进行识别,通过2DPCA特征提取方法对图像的特征信息进行提取,可以有效地剔除一些冗余信息,从而提高目标识别率。
图5是四种算法即RVFL、SCN、L2-SCN以及2DPCA结合L2-SCN对10类SAR图像目标识别的测试准确率。从图中我们可以看出识别率随着隐含层节点的增加而增加。SCN算法及其优化算法的识别率明显优于RVFL算法,而2DPCA结合L2-SCN算法不仅对目标的识别准确率高于其他三种算法,并且其收敛速度明显更快,在隐含层节点数到达400的时候,识别准确率达到最高,95.8%,且持续稳定下去。
表1 SOC实验数据集
Tab.1 Dataset of experiment SOC
目标型号2S1BMP2BRDM2BTR60BTR70D7T62T72ZIL131ZSU234训练集(17°)200200200200200200200200200200测试集(15°)50505050505050505050
表2 SOC实验的混淆矩阵
Tab.2 Confusion matrix of experiment SOC
Class2S1BMP2BRDM2BTR60BTR70D7T62T72ZIL131ZSU234PCC%2S14702000001094BMP20491000000098BRDM20138004007076BTR600004900001098BTR7000005000000100D71000049000098T6200000050000100T7200000005000100ZIL1310021000047094ZSU23400000000050100Total95.8
图5 4种方法的识别率
Fig.5 Recognition accuracy of four methods
5.2.2 EOC实验
在EOC下,对3类俯仰角度存在差异的SAR图像目标(2S1、BRDM2、ZSU234)进行识别,以验证算法的泛化性能。实验数据集如表3所示。表4是在目标识别准确率方面本文方法与其他方法的对比,网络的相关参数设置为Lmax=150,ε=0.05,λ=0.1。通过2DPCA与L2-SCN结合的算法对SAR图像进行目标识别,在测试集俯仰角30°、45°的情况下,目标识别准确率分别达到98.49%、72.65%,可以看出本文方法在训练样本与测试样本的俯仰角度存在差异的情况下,较传统方法具有更高的识别准确率。
表3 EOC实验数据集
Tab.3 Dataset of experiment EOC
俯仰角度2S1BRDM2ZSU234训练集17°299298299测试集130°288287288测试集245° 303303303
表4 与其他方法的比较
Tab.4 Comparison with other methods
方法识别准确率30°45°本文方法98.49%72.65%SVM[16]98.42%66.01%CNN[17]97.42%64.17%L2-SCN97.33%72.24%SCN94.67%68.01%
本文提出了一种基于2DPCA和正则化约束的随机配置网络的SAR图像目标识别方法。基于2DPCA的特征提取方法不仅能够剔除SAR图像中冗余信息,提取出有效的特征信息,而且通过稀疏表征方式降低样本数据量,在此特征提取的基础上,集成L2正则化约束的SCN算法对SAR图像目标进行识别,能够避免过拟合问题的发生,提高网络的识别率和泛化能力。实验结果验证了该方法较传统方法具有更高的SAR图像目标识别准确率,因此本文提出的方法是一种有效的SAR图像目标识别方法。
[1] 徐丰, 王海鹏, 金亚秋. 深度学习在SAR目标识别与地物分类中的应用[J]. 雷达学报, 2017, 6(2): 136-148.
Xu Feng, Wang Haipeng, Jin Yaqiu. Deep Learning as Applied in SAR Target Recognition and Terrain Classification[J]. Journal of Radars, 2017, 6(2): 136-148.(in Chinese)
[2] 张红, 王超, 张波, 等. 高分辨率SAR图像目标识别[M]. 北京: 科学出版社, 2009: 4-7.
Zhang Hong, Wang Chao, Zhang Bo, et al. High Resolution SAR Image Target Recognition[M]. Beijing: Science Press, 2009: 4-7.(in Chinese)
[3] 盖旭刚, 陈晋汶, 韩俊, 等. 合成孔径雷达的现状与发展趋势[J]. 飞航导弹, 2011(3): 82- 86.
Gai Xugang, Chen Jinwen, Han Jun, et al. Present Situation and Development Trend of Synthetic Aperture Radar[J]. Aerodynamic Missile Journal, 2011(3): 82- 86.(in Chinese)
[4] Moreira A, Prats-Iraola P, Younis M, et al. A tutorial on synthetic aperture radar[J]. IEEE Geoscience and Remote Sensing Magazine, 2013, 1(1): 6- 43.
[5] 田壮壮, 占荣辉, 胡杰民, 等. 基于卷积神经网络的SAR图像目标识别研究[J]. 雷达学报, 2016, 5(3): 320-325.
Tian Zhuangzhuang, Zhan Ronghui, Hu Jiemin, et al.SAR ATR Based on Convolutional Neural Network[J]. Journal of Radars, 2016, 5(3): 320-325.(in Chinese)
[6] LEcun Y, Bottou L, Bengio Y, et al. Radient-Based Learning Applied to Document Recognition[J]. Proceedings of the IEEE, 1998, 86(11): 2278-2324.
[7] Mishra A. Validation of PCA and LDA for SAR ATR[C]∥IEEE TENCON: IEEE, 2008: 1- 6.
[8] Chen T, Chen H. Universal approximation to nonlinear operators by neural networks[J]. Neural Computation, 2002, 14(11): 2561-2566.
[9] Kotsiantis S B. Supervised machine learning: a review of classification techniques[C]∥Conference on Emerging Artificial Intelligence Applications in Computer Engineering: Real Word Ai Systems with Applications in Ehealth, Hci, Information Retrieval and Pervasive Technologies. IOS Press, 2007: 3-24.
[10] Igelnik B, Pao Y H. Stochastic choice of basic functions in adaptive function approximation and the functional-link net[J]. IEEE Transactions on Neural Networks, 1995, 6(6): 1320-1329.
[11] Wang D, Li M. Stochastic Configuration Networks: Fundamentals and Algorithms[J]. IEEE Trans Cybern, 2017, 47(10): 3466-3479.
[12] Mishra A, Mulgrew B. Bistatic SAR ATR[J]. IET Radar Sonar & Navigation, 2007, 1(6): 459- 469.
[13] Pei J, Huang Y, Huo W, et al. SAR Imagery Feature Extraction Using 2DPCA-Based Two-Dimensional Neighborhood Virtual Points Discriminant Embedding[J]. IEEE Journal of Selected Topics in Applied Earth Observations & Remote Sensing, 2017, 9(6): 2206-2214.
[14] Yang J, Zhang D, Frangi A F, et al. Two-dimensional PCA: a New Approach to Appearance-based Face Representation and Recognitio[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2004, 26(1): 131-137.
[15] Chen S, Wang H, Xu F, et al. Target classification using the deep convolutional networks for SAR images[J]. IEEE Transactions on Geoscience and Remote Sensing, 2016, 54(8): 4806- 4817.
[16] Ding B, Wen G, Zhong J,et al. Robust method for the matching of attributed scattering centers with application to synthetic aperture radar automatic target recognition[J]. Journal of Applied Remote Sensing, 2016, 10(1): 016010.
[17] Zhang H, Nasrabadi N M, Zhang Y, et al. Multi-View Automatic Target Recognition using Joint Sparse Representation[J]. IEEE Transactions on Aerospace and Electronic Systems, 2012, 48(3): 2481- 2497.
Reference format: Wang Yanping, Zhang Yibo, Li Yang, et al. Target Recognition Method Based on 2DPCA-SCN Regularization for SAR Images[J]. Journal of Signal Processing, 2019, 35(5): 802- 808. DOI: 10.16798/j.issn.1003- 0530.2019.05.010.
王彦平 男, 1976年生, 山东人。北方工业大学电子信息工程学院, 教授, 博士, 主要研究方向为智能雷达、雷达形变监测、智能预警技术研究。
E-mail: wangyp@ncut.edu.cn
张艺博 女, 1995年生, 北京人。北方工业大学电子信息工程学院, 硕士研究生, 主要研究方向为SAR图像目标识别, 机器学习。
E-mail: zhangyiboncut@outlook.com
李 洋 男, 1983年生, 北京人。北方工业大学电子信息工程学院, 副研究员, 博士, 主要研究方向为极化SAR、简缩极化SAR、相干层析理论研究与应用。
E-mail: haffner@126.com
林 赟 女, 1983年生, 浙江人。北方工业大学电子信息工程学院, 副研究员, 博士, 主要研究方向为SAR三维及多角度成像基础理论方法。
E-mail: ylin@ncut.edu.cn