基于改进的半监督主动学习的雷达信号识别

吴 莹 罗 明

(西安电子科技大学电子工程学院,陕西西安 710071)

摘 要: 为解决在雷达信号分类识别过程中训练样本较少的问题,本文提出了联合主动学习和半监督学习,并对其伪标记样本进行迭代验证改进的分类算法。针对复杂的电磁环境下雷达信号识别率低的问题,本文将径向高斯核时频分析应用于雷达信号,并对时频分布进行奇异值分解,提取出奇异向量作为雷达信号识别的特征参数。针对传统的半监督主动学习算法的不足,利用改进的半监督主动学习算法构建分类器,该算法通过对伪标记样本进行迭代验证来提高伪标记信息的准确性,从而改善了最终的分类性能,实现了在可获取的有标签样本数量较少的条件下对雷达信号的高概率识别。仿真结果表明,本文提出的特征识别方法可以获得较高的识别率。

关键词:径向高斯核时频分布;奇异值分解;特征提取;半监督学习;主动学习

1 引言

近年来,联合时频分析(Time-frequency Analysis,TFA)在不同的信号处理应用上比如水下声学、语音处理和医学分析等领域得到了广泛的应用。雷达研究人员也对它进行了研究,并将其作为雷达信号检测、分析和识别的一个非常有效的工具。本文采用了径向高斯核(Radially Gaussian Kernel,RGK)时频分析方法,其核函数不仅能有效压制交叉干扰项的存在,而且能自适应于多种类型信号。将径向高斯核时频分析方法[1]应用于雷达信号,对获得的时频分布进行奇异值分解,提取奇异向量作为本文雷达信号分类识别的特征参数。

目前用于雷达信号分类识别的方法主要可以划分为:无监督学习、监督学习和半监督学习等。文献[2]利用 K-means方法进行聚类;文献[3]提出基于核模糊C-means的雷达信号识别算法;这两种算法均属于无监督学习,虽然操作简单,成本低,但实际效果不太理想。文献[4]利用支持向量机(Support Vector Machine,SVM)来解决雷达信号识别问题;该方法属于监督学习,监督学习需要大量的训练样本,但实际应用中有标签样本数据特别少,因此有一定的局限性。文献[5]提出基于半监督学习(S3VM)的雷达信号识别方法;文献[6]采用多核半监督学习算法(TSVM-MKL)进行雷达信号识别;半监督学习(Semi-supervised Learning, SSL)方法是在较少量的有标签样本数据下,利用无标签样本数据来改善训练学习效果,但是对于目前的雷达信号分类过程中,获取较少的训练样本仍是一个具有挑战的问题,而可获取的有标签样本的数量相对更少。如何有效的减少训练所需标签样本是本文研究的主要问题。

将主动学习和半监督学习方法相结合,可以有效地减少学习模型训练中需要的标签样本数量。这两种方法都是通过在训练集中加入伪标记样本来提升训练能力,然而仅依赖分类器自身获取样本伪标记,往往是不可靠的。因此,本文提出了改进的半监督主动学习算法,该算法利用对伪标记样本进行迭代验证来提高伪标记信息的准确性,从而改善了最终的分类性能。

2 基于时频分布SVD的雷达信号特征参数提取

2.1 径向高斯核时频分布

对于信号s(t),其频谱可以由该信号的加权模糊函数的二维傅里叶变换得到:

(1)

其中A(θ,τ)是信号s(t)的模糊函数(AF),φ(θ,τ)是信号s(t)的核函数。

通过求解下列优化问题来寻找适应于信号的最优核,

(2)

上述最优化问题的约束条件可表示为:

φ(r,ψ)=e-r2/ 2σ2(ψ)

(3)

a≥0

(4)

其中A(r,ψ)是信号s(t)在极坐标下的模糊函数。扩散函数σ(ψ)决定着相应核的等能量轮廓的基本形状,从而通过求出σopt(ψ)得到适应于信号的最优核φopt。约束条件(3)限制了径向高斯核的优化范围,约束条件(4)限制了核函数的体积aa一般取1~5。约束条件使得最优核成为一个固定体积的低通滤波器,从而使得信号模糊函数的自相能量通过,而抑制交叉干扰项。

径向高斯核时频分析作为一种有效的非平稳信号处理方法,能从时域和频域两个维度反映信号能量的变化分布情况,因此从理论上来讲利用信号最优核时频分布之间的差异性可以进行信号分类的识别。下面选取两种典型的雷达信号进行分析,设置参数a=2,绘制其径向高斯核函数时频分布三维图,如图1所示。

图1 径向高斯核函数时频分布
Fig.1 The time-frequency distribution of RGK function

LFM和BPSK信号分别在迭代次数为14和30时收敛到局部能量最大值。从图1(a)可以看出,对于单一的线性调频信号,径向高斯核函数表现为极高的聚集性;对于二相编码信号,图1(b),RGK算法不但显示了信号的时频分布性质,且噪声抑制能力较强。综上分析,利用径向高斯核时频分布对雷达信号分类是可行的。

2.2 基于SVD的雷达信号特征参数提取

在复杂电磁环境中接收到的雷达信号,由于低信噪比导致雷达回波信号的时频分布会受到严重的扭曲,应用奇异值分解(Singular Value Decomposition, SVD),能够尽可能地消除噪声的影响。SVD是一个被广泛用于提取数据特性的非线性过滤器,得到的奇异向量能够保留雷达信号的固有性质[7],因此利用SVD对雷达信号的径向高斯核时频分布进行去噪和降维是可行的[8],本文正是基于该思想进行了一系列论证。

对于任意矩阵YRm×n,由正交矩阵URm×mVRn×n,使得

Y=U

(5)

该式称为矩阵的奇异值分解(SVD)。其中矩阵的非零对角元素λ1λ2≥…λq称为矩阵Y的非零奇异值,u1,u2,…,uqv1,v2,…,vq分别称为矩阵Y奇异值对应的左右奇异向量。

由于奇异值分解的可逆性,即原始矩阵可以由奇异值和奇异向量完全重构,奇异向量包含了能够反映原始矩阵的特性,能有效体现不同信号之间的细微差异。奇异值对应于不同分量对时频谱包络的贡献,某部分能量越高,其对应的奇异值越大;并且,由于矩阵的对称性,左奇异向量和右奇异向量包含了同样的信息。因此,本文选择左一和左二奇异向量作为雷达信号径向高斯核时频分布的二次特征进行后面的分类识别。

为了验证时频分布奇异值分解的有效性,本文选取了四种不同的雷达信号进行仿真实验,分别为连续波(CW)信号、线性调频(LFM)信号、二进制移频键控(FSK)信号、二相编码(BPSK)信号。其中LFM的带宽为15 MHz,BFSK信号的两个频率分别为f1=15 MHz, f2=20 MHz;BFSK采用6位Costas码,编码规则为:[100110]。图2和图3分别为四种信号径向高斯核时频分布奇异值分解后得到的左一奇异向量和左二奇异向量。

图2 四种典型信号的左一奇异向量
Fig.2 The left one singular vector of the four typical signals

图3 四种典型信号的左二奇异向量
Fig.3 The left two singular vector of the four typical signals

结合图2和图3分析发现,四种信号的幅度峰值各不相同,结合左一和左二奇异向量能够充分地保留原始时频分布矩阵的信息,并且有效地反映了四种信号之间的差异性,进而可以对这四种信号进行区分。由于左一和左二奇异向量维数较高,使用主成分分析法(PCA)对奇异向量进行维数约简,构成低维的特征向量作为改进的半监督主动学习识别器的输入。

3 基于改进的半监督主动学习算法的雷达信号识别

传统的将主动学习与半监督学习相结合的方法称为半监督主动学习算法(Collaborative Active and Semi-Supervised Labeling,CASSL)[9]。主动学习(AL)和半监督学习(SSL)具有不同的工作机制,但在保持分类性能的同时,都减轻了人工标记的成本[10]。在CASSL中,依靠主动学习抓取样本进行人工标记并不能确保所有伪标记的准确性,因而CASSL并不能保证算法性能会随着伪标记样本的加入而提高[11]

针对CASSL算法的不足,本文对半监督主动学习算法进行了改进。改进的半监督主动学习算法(Improved semi-supervised active learning,ISSAL) 基于伪标记技术,使用迭代验证的方法来改进伪标记的准确性。ISSAL使得人类专家和分类器通过协作标记的过程来获取更加准确的标记信息,从而提高最终的分类性能。具体来说,通过 AL在逐渐扩展的标记数据集上训练附加的验证分类器,并与SSL中的分类器一起使用,以提高伪标记准确性,从而促进SSL。因此,在算法复杂度方面,相较于传统的CASSL算法,ISSAL算法多了一个SVM的算法复杂度,即O(N3)。此外,为了获取AL中与识别相关的大部分未标记样本信息,只有在SSL中不能准确地被分配伪标签的未标记数据才能作为AL中的查询候选样本。

首先,利用原始标记好的雷达信号样本集L训练一个分类器,记为SVM1。然后采用MCLU查询函数[12]从候选池中选择h个最具有代表性的雷达信号样本集Q进行专家标记并添加到已标记的样本集L中,更新标记样本集L和未标记样本集U。利用最新的标记样本集来训练另一个的分类器,为SVM2。对于SVM1和SVM2,对无标记样本集U进行分类,将获得两个分类结果,分别为V1,V2,如果V1V2中的样本的标签是相同的,则记为伪标记样本集T。第二次迭代时,使用T和标记数据集L在每次迭代中训练分类器SVM1。在本文的算法中,选择使用基于RBF核函数的SVM模型作为分类器,同时设置每个实验中的RBF核函数参数gamma为0.1,惩罚因子Cs为100。

综上分析,改进的半监督主动学习算法的主要步骤如下:

输入:有标记信号样本集L

伪标记信号样本集T=∅;

未被作为伪标记的信号样本集:S=U

无标记信号样本集U

每次迭代采样个数:h

迭代次数:iter;

步骤1 利用已标记信号样本集L和伪标记信号样本集T训练SVM1;

步骤2 采用MCLU查询函数从S中选择h个信息量丰富的样本集Q由人类专家进行标记,并更新LL=LQ,U=U/Q

步骤3 利用最新的样本集L训练SVM2;

步骤4 利用SVM1和SVM2对U进行分类,获得两个分类器的分类结果为V1,V2

步骤5 更新T=(x,V1(x)|V1(x)=V2(x));

步骤6 更新S=U/T

对步骤1至步骤6进行迭代,直到迭代次数为iter。

输出:基于最新的已标记雷达信号样本集L和被作为伪标记的信号样本集T训练分类器SVM。

为验证分类器SVM的泛化能力,设置一组雷达信号样本作为测试集,输出雷达信号识别率。

4 仿真和结果分析

为验证本文识别算法的有效性,选取五种不同的辐射源信号进行仿真实验,分别为连续波(CW)信号、线性调频(LFM)信号、二进制频移键控(FSK)信号、二相编码(BPSK)信号、多相编码(QPSK)信号。其中LFM的带宽为15 MHz,BFSK信号的两个频率分别为f1=15 MHz, f2=20 MHz;BFSK采用6位Costas码,编码规则为:[100110],BPSK采用7位巴克码,编码规则为:[1110010]。

每种信号分别在信噪比SNR(-2,0,2,4,6)dB下产生100个特征样本,总计500个样本。选择样本的进行标记作为初始标记样本集,的样本作为未标记样本集,的样本作为测试样本集。设置h=10,iter=20。CASSL算法参数设置与ISSAL相同;同时在仅将SVM作为识别器的Full-SVM算法中,设置300个样本作为训练集,200个样本为测试集。对于每一种算法,分别在10次实验下求得识别率的平均值。图4表示在SNR=4 dB时,随着有标记训练集的增加,ISSAL和CASSL算法在测试集上的性能对比。图5为在不同信噪比SNR下,对ISSAL算法和CASSL的识别率进行对比。

图4 ISSAL和CASSL算法的在测试集上的性能
Fig.4 The performance of ISSAL and CASSL on the test set

图5 ISSAL和CASSL算法的识别性能进行对比
Fig.5 The performance comparison of ISSAL and CASSL

图4可以发现,在一定信噪比下,由于借助了迭代验证的方法,随着有标记训练集的增加,ISSAL算法对伪标记样本进行了筛选和更正操作,识别率比CASSL算法提升的更高更快,并且能够看出ISSAL算法的识别率最终收敛于基于SVM的学习模型,由此证明在训练样本较少的条件下,ISSAL算法同样能够获得较好的识别率。从图5可以看出,随着信噪比SNR的增加,ISSAL和CASSL算法的平均识别率都在提高,但是能明显看出ISSAL的算法识别率比CASSL算法高。

对于本文提出的雷达信号识别方法,为证明其二次特征参数提取方法具有较高的准确率,采用基于模糊函数奇异值分解(AF_SVD)[5]的方法和基于Wigner三谱[13]的识别方法进行对比实验。图6为在不同信噪比下三种方法的识别性能比较。

图6 不同模型下辐射源识别性能对比
Fig.6 The comparison of radiation recognition performance under different models

从图6可以看出,基于模糊函数奇异值分解(AF_SVD)和基于Wigner三谱的方法在SNR=-2 dB时,准确率在以下,当SNR=6 dB时,准确率才达到以上,而本文提出的模型在低信噪比下仍保持着优于的准确率。这是因为本文提出的二次特征参数提取方法受噪声的影响程度小,鲁棒性较强,保留了原始数据的基本特征,因此信号识别率高于其他两种模型。

5 结论

雷达信号识别是雷达侦察系统的关键部分,对于日益复杂的雷达体制,较少的训练样本已成为信号识别分类中的一个重要研究课题。本文采用半监督学习和主动学习相结合的方法,并对其进行了改进,ISSAL提供了一种有效的伪标记验证方案,从而提高了伪标记的准确性,在训练样本非常有限的情况下有效改善了最终分类器的性能。同时本文采用基于径向高斯核时频分布奇异值分解的方法,提取奇异向量作为特征参数,有效提高了在低信噪比情况下雷达信号的识别率。

参考文献

[1] Baraniuk R G, Jones D L. Signal-dependent time-frequency analysis using a radially Gaussian kernel[J]. Signal Processing, 1993, 32(3):263-284.

[2] Rong Li, Wang Huaning, Cui Yanmei, et al. Solar flare forecasting using learning vector quantity and unsupervised clustering techniques[J]. Science China, 2011, 54(8):1546-1552.

[3] Guo Qiang, Nan Pulong, Zhang Xiaoyu, et al. Recognition of radar emitter signals based on SVD and AF main ridge slice[J]. Journal of Communications & Networks, 2015, 17(5):491- 498.

[4] 任东方,张涛,韩洁. 结合ITD与非线性分析的通信辐射源个体识别方法[J]. 信号处理, 2018,34(3): 331-339.

Ren Dongfang, Zhang Tao, Han Jie. Individual identification method of communication radiation source combined with ITD and nonlinear analysis[J]. Journal of Signal Processing, 2018,34(3): 331-339. (in Chinese)

[5] 符颖, 王星, 周东青,等. 基于模糊函数SVD和改进S3VM的雷达信号识别[J]. 计算机工程与应用, 2017, 53(6):264-270.

Fu Ying, Wang Xing, Zhou Dongqing, et al. Recognition method of radar signal based on SVD of ambiguity function and improved S3VM algorithm[J]. Computer Engineering and Applications, 2017, 53(6):264-270. (in Chinese)

[6] 吴剑旗, 田西兰. 一种基于半监督学习的窄带雷达目标识别系统[J]. 中国电子科学研究院学报, 2015, 10(1):49-53.

Wu Jianqi, Tian Xilan. A Narrow-Band Radar Target Recognition System Based on Semi-Supervised Learning[J]. Journal of China Academy of Electronics and Information Technology, 2015, 10(1):49-53. (in Chinese)

[7] Akay O, Boudreaux-Bartels G F. Unitary and Hermitian fractional operators and their relation to the fractional Fourier transform[J]. IEEE Signal Processing Letters, 2002, 5(12):312-314.

[8] 陈诗国, 张道强. 半监督降维方法的实验比较[J]. 软件学报, 2011, 22(1):28- 43.

Chen Shiguo, Zhang Daoqiang. Experimental Comparisons of Semi-Supervised Dimensional Reduction Methods[J]. Journal of Software, 2011, 22(1):28- 43. (in Chinese)

[9] Kothari R, Jain V. Learning from labeled and unlabeled data using a minimal number of queries[J]. IEEE Transactions on Neural Networks, 2003, 14(6):1496-1505.

[10] Wang Zengmao, Du Bo, Zhang Lefei, et al. A Novel Semisupervised Active-Learning Algorithm for Hyperspectral Image Classification[J]. IEEE Transactions on Geoscience & Remote Sensing, 2017, 55(6):3071-3083.

[11] Wan Lunjun, Tang Ke, Li Mingzhi, et al. Collaborative Active and Semisupervised Learning for Hyperspectral Remote Sensing Image Classification[J]. IEEE Transactions on Geoscience & Remote Sensing, 2015, 53(5):2384-2396.

[12] Demir B, Persello C, Bruzzone L. Batch-Mode Active-Learning Methods for the Interactive Classification of Remote Sensing Images[J]. IEEE Transactions on Geoscience & Remote Sensing, 2011, 49(3):1014-1031.

[13] 何正日. 雷达辐射源信号识别技术研究[D].西安:西安电子科技大学,2015.

He Zhengri. Research on Radar Emitter Signal Recognition Technology[D]. Xi’an: Xidian University, 2015. (in Chinese)

The Improved Semi-Supervised Active Learning for Radar Signal Recognition

WU Ying LUO Ming

(School of Electronic Engineering, Xidian University, Xi’an, Shaanxi 710071, China)

Abstract: In the process of radar signal recognition, fewer training samples is a common and challenging problem. A novel algorithm named improved semi-supervised active learning is proposed for signal classification, which is based on pseudo-labels verification procedure. For the problem of low radar signal recognition in complex electromagnetic environment, the time-frequency analysis of radially Gaussian kernel is applied to radar signals. Through singular value decomposition of time-frequency distribution, it extracts its singular values as feature parameters for radar signal recognition. In order to overcome the shortcomings of the traditional semi-supervised active learning algorithm, a classifier is constructed using an improved semi-supervised active learning algorithm. The proposed algorithm enables a collaborative labeling procedure by both human experts and classifiers to acquire more confidently labeled samples to improve the final classification performance and realize the high probability of radar signal recognition when the number of available labeled samples is small. Simulation results show that the proposed feature recognition method can achieve higher radar signal recognition at low SNR.

Key words: radially gaussian kernel distribution; singular value decomposition; feature extraction; semi-supervised learning; active learning

中图分类号:TN957.51

文献标识码:A

DOI: 10.16798/j.issn.1003- 0530.2018.06.004

文章编号:1003-0530(2018)06-0661-07

收稿日期:2017-12-01;修回日期:2018-04-26

基金项目:西安电子科技大学基本科研业务费资助项目(JB160221)

作者简介

吴 莹 女,1990年生,江苏宿迁人。西安电子科技大学电子工程学院硕士研究生,研究方向为信息对抗技术。

E-mail: wuyingyingwuok@163.com

罗 明 男,1976年生,四川雅安人。西安电子科技大学副教授,硕士生导师,研究方向为电子对抗、通信信号处理、高速实时信号处理研究。

E-mail:luoming@xidian.edu.cn