Reference format: Wang Bin, Wang Haiwang, Li Yongbin. Modulation Recognition Method of Underwater Acoustic Communication Signals in Impulsive Noise Environment[J]. Journal of Signal Processing, 2020, 36(12): 2107-2115. DOI: 10.16798/j.issn.1003- 0530.2020.12.017.
水声通信信号调制识别是在不依赖先验信息条件下对接收到的不同水域的水声通信信号进行调制方式的自动分类,在民事、军事等领域具有广泛的应用。现有的水声通信信号调制识别方法主要以面向高斯分布背景噪声,而实际的浅海水声信道噪声中存在一些短时尖峰脉冲,此类尖峰脉冲噪声服从Alpha稳定分布[1]。现有针对Alpha稳定分布噪声背景下的调制识别的方法主要是基于特征提取的模式识别方法,比如分数低阶循环谱方法[2],广义循环平稳方法[3],广义循环累积量方法[4],以及多特征融合方法[5]。上述方法需要人工提取特征,并选择合适的分类器,信号处理流程复杂,环境适应性差。为了减少调制识别对人工专业知识的依赖,提高水声通信信号调制识别的智能化水平以及分类识别的准确度,近年来,人们将深度学习技术应用到水声通信信号调制识别任务中[6-11]。现有基于深度学习的水声调制识别方法主要通过不同结构的深层神经网络提取水声通信信号调制特征并进行分类,比如基于卷积神经网络(Convolutional Neural Network, CNN)的水声通信信号调制识别方法[6- 8]、基于稀疏自动编码网络的调制方法[9]、基于长短时记忆网络[7,10]以及基于深层残差网络调制识别方法[11],这些方法主要探究不同网络对水声通信信号的特征提取以及分类能力,验证了深度学习网络对水声通信信号调制识别的有效性。上述方法主要考虑了高斯分布的背景噪声,在浅海脉冲噪声环境下的识别性能下降。另外,基于深度学习的调制识别方法在训练数据稀缺条件下识别性能变差。
本文针对浅海脉冲环境噪声干扰以及目标水域数据稀缺条件下调制识别问题,提出了一种基于降噪自编码器(Denoising Automatic-Encoder, DAE)[12]降噪和数据迁移的卷积神经网络调制识别方法。首先通过DAE网络抑制脉冲噪声,然后再进行基于CNN的调制分类。同时,利用两步迁移学习方法提升目标水域数据量不足条件下的识别性能。最后通过仿真实验和实测实验验证本文算法的有效性。
浅海水声通信信号模型如下所示:
y(t)=s(t)⊗h(t)+n(t)
(1)
其中,y(t)表示接收信号,s(t)为发送的调制信号,调制类型包括:多进制频移键控(Multiple Frequency Shift Keying, MFSK)、多进制相移键控(Multiple Phase Shift Keying, MPSK)、正交频分复用(Orthogonal Frequency Division Multiple, OFDM)和线性调频(Linear Frequency Modulation, LFM),式中符号“⊗”表示卷积运算,h(t)为水声信道的冲激响应,n(t)为脉冲噪声。文献[13]中给出了不同调制方式信号的数学表达式。
浅海水声信道往往存在不同强度的脉冲噪声,服从Alpha稳定分布,其特征函数如式(2)所示[14]:
φ(u)=exp{jau-γ|u|α[1+jβsgn(u)ω(u,α)]}
(2)
其中,-∞<a<+∞表示分布的中心位置,γ>0为分散系数,0<α≤2是特征指数,表示脉冲的强度,α值越小脉冲越强;-1≤β≤1为对称参数,表示该分布的对称程度,sgn(·)表示符号函数,ω(u,α)如式(3)。
(3)
由于Alpha稳定分布在α<2时不存在二阶及以上各阶统计量,因此采用混合信噪比衡量信号和噪声之间的功率关系,其表达式为[5]:
(4)
其中,表示水声通信信号的方差。
本文提出了基于DAE和CNN的调制识别方法,包括降噪处理和分类识别两个部分。具体流程如图1所示。
图1 水声通信信号识别流程图
Fig.1 Flow chart of underwater acoustic communication signal identification
图1所示流程中,首先利用降噪自编码器对脉冲噪声具有降噪能力的特点,对接收到的水声通信信号y(t)进行DAE降噪,然后估计降噪后的信号y′(t)的功率谱,对功率谱图进行基于CNN的分类识别。
DAE对接收信号y(t)进行降噪处理,减弱背景环境中的脉冲噪声。DAE网络结构如图2。
图2 DAE结构图
Fig.2 Architecture of DAE
如图2所示,DAE网络呈对称结构,包括由卷积层构成的编码器和由反卷积层构成的解码器两部分,并通过残差结构相连接。DAE在编码压缩阶段采用卷积层对高维含噪声信号数据y(t)逐层压缩,去除冗余信息,提取信号的本质特征,此阶段将y(t)压缩成一个低维特征向量c,并与随机噪声z相连接输入至解码器。解码器对融合向量解码重构,利用反卷积层对该向量进行解码重构,输出原始高维信号数据y′(t)。然后通过计算DAE输出数据y′(t)和无噪声数据s(t)的L1损失项来衡量降噪效果,通过Adam优化器优化调整网络参数,使DAE输出信号逼近无噪声信号,从而使网络具有降噪功能。L1损失项的表达式为:
L1=|y′(t)-s(t)|
(5)
由于降噪处理后的功率谱图具有较高的调制类型区分度,本文选择水声通信信号的功率谱图作为识别对象。首先对y′(t)进行功率谱估计,得到功率谱图,然后将y′(t)的功率谱图Y作为识别对象,基于CNN对信号功率谱图进行分类识别。
其中采用Welch[14]算法计算功率谱。首先对信号y′(n)样本分为L段,每段数据为估计式如下:
(6)
其中,
(7)
式中,M表示每个分段数据长度,U表示归一化因子,w(n)表示窗函数,本文选用哈明窗。最后通过式(8)计算的平均值,得到Py′(ω)。
(8)
由于DAE主要作用是降低加性噪声的影响,对信号本身影响很小[12],y′(t)的功率谱密度可以表示为:
Py′(ω)=Ps(ω)|H(ω)|2+n′(ω)
(9)
其中,Py′(ω)为接收信号经过DAE降噪处理后功率谱密度,Ps(ω)发送信号功率谱密度,|H(ω)|表示水声信道的幅频响应,n′(ω)表示经过DAE降噪处理后噪声功率谱密度。功率谱密度估计采用Welch谱估计方法[14]。
本文借鉴文献[6]的方法,利用经典的卷积神经网络——AlexNet[6]对降噪信号功率谱图Y进行分类。AlexNet网络结构分为8层,包括5个卷积层和3个全连接层,网络通过卷积、池化等操作提取降噪信号功率谱图的高维特征,并通过Softmax分类器进行分类。
基于深度学习的水声通信信号调制方法在训练数据充足的条件下,具有较好的识别性能。但是在未知水域的标注数据有限的条件下,网络的识别性能严重下降。而实际能够得到的水声通信信号十分有限,针对此类问题,本文提出了基于迁移学习的网络训练方法。训练和测试流程如图3所示。
图3 训练和测试流程图
Fig.3 Flow chart of training and testing
如图3所示,训练过程中,首先将训练数据1输入至DAE进行降噪网络训练,待降噪网络训练完成后,再将训练数据2输入降噪处理模块,将降噪后的数据形成降噪信号功率谱密度图像用于AlexNet分类识别网络的训练。测试过程中,测试数据通过训练好的DAE和AlexNet网络,依次完成降噪和调制识别。
为了使训练好的DAE和AlexNet在测试数据上依然能够有效完成调制识别任务,通常要求训练数据和测试数据具有相同或相近的分布特性。然而,不同水域和信号传输条件下的水声信道往往存在差异。由式(9)可知,不同信道对接收信号功率谱具有不同的影响。在第三方接收条件下,很难预先获取被测水域信道相关信息,即面临着难以预先获取与被测水域数据具有相同或相似信道特性的训练数据的问题。训练数据样本不足,将严重影响网络的降噪和分类识别效果。
本文通过构建迁移数据模型,利用数据迁移,解决训练数据不足问题。迁移数据模型如式(10)所示。
(10)
式中,表示接收信号迁移数据,s(t)表示与式(1)调制类型一致的发送信号,表示不同水域、不同传输条件的信道冲激响应,可以根据需要来设计信道迁移数据,本文采用典型声剖面不同声速梯度条件下、不同传输距离的信道冲激响应作为迁移数据,表示环境噪声。
通过DAE降噪后的迁移数据功率谱密度表示为:
(11)
式中,表示接收信号迁移数据降噪后功率谱密度,Ps(ω)表示与式(9)调制类型一致的发送信号功率谱密度,表示数据迁移信道冲激响应的幅频响应,表示降噪后的迁移数据噪声功率谱密度。
采用两步迁移学习策略[16]来完成网络的训练和测试,具体流程如图4所示。
图4 基于两步迁移学习的训练和测试流程
Fig.4 Training and testing processes based on two-step transfer learning
图4中的预训练数据依据式(10)生成,用于完成网络的预训练,再利用待测信道条件下已知的少量标注数据构成微调数据集,对分类识别网络进行微调,使其能够适应待测水域的数据特点,最后对待测数据进行测试。微调过程中为了防止因数据量过少而引起的过拟合,采用了先冻结再训练的方法,将CNN除最后两层外的网络参数冻结,微调数据集仅对最后两层参数进行训练优化。
本文选择两片水域分别作为训练和测试环境,记为水域1和水域2,声速剖面图如图5所示,水域1是典型深海声剖面,包含了典型海洋声学特征。水域2为典型的浅海声剖面。为了尽可能充分地反映水声信道特点,声源位置分别选择在跃变层、主跃层、声道轴。然后利用Bellhop水声信道仿真软件,产生不同传输条件下的线性时不变水声信道,其参数见表1。
图5 声速剖面图
Fig.5 Sound velocity profile
实验中,在不同水域条件下生成式(1)中六类水声通信信号{2FSK、4FSK、8FSK、MPSK、LFM、OFDM},除LFM信号外每类信号时长1 s,LFM信号时长为20 ms,采样频率48 kHz,具体参数如表1所示,其中,“/”表示不需要设置此参数,“{}”表示在所给集合内随机选择。
在后续不同实验中将采用上述不同信道用于产生训练和测试数据集。此外,依据表2中的信号参数,每类信号产生1000个样本,构成图3中DAE的训练数据1,特征指数α在[1.5,2]范围内随机选取,混合信噪比在[-5,10]dB范围内随机选取,训练过程采用Adam优化器进行优化,学习率设定为0.0002,批大小(batch size)为32,所有数据迭代100个epochs后停止训练。图3中训练数据2包含每类信号500个样本,特征指数α在[1.5,2]范围内随机选取,混合信噪比在[-5,10]dB范围内随机选取,经降噪处理后的数据输入CNN中,并采用SGD 优化器进行优化,学习率设定为0.01,batch size为128,所有数据迭代60 epochs。图3中的测试数据将在后续实验中具体介绍。
表1 信道参数
Tab.1 Parameters of channels
水域信道声源深度/m接收深度/m水平传播距离/km1h12002005h21002003h32005032h41201505
各信道的传递函数如下:
H1(z)=0.04+z-353+0.508z-570+0.283z-644
(12)
H2(z)=0.32+0.45z-48+z-61+0.9318z-267
(13)
H3(z)=0.68+z-184+0.882z-403
(14)
H4=0.8838+0.3175z-365+z-1095+
0.8129z-1274+0.8663z-2963
(15)
首先,为了验证采用 DAE降噪方法对调制识别性能的提升效果,将本文与文献[17]中采用无记忆模拟非线性预处理器(A Memoryless Analog Nonlinear Preprocessor,MANP)的降噪方法进行对比。实验中,在信道h1、h2和h3下产生训练和测试数据,以8FSK信号为例,给出了DAE对接收信号的降噪结果,如图6所示。
图6 降噪效果图
Fig.6 Noise reduction effect diagram
图6(a)为发送信号功率谱图,图6(b)为接收信号的功率谱图,图6(c)为采用MANP方法对接收信号降噪处理的结果,图6(d)为本文方法得到降噪信号功率谱图。通过对比可以看出,MANP和DAE方法都能降低加性脉冲噪声的影响,而DAE方法的降噪能力优于MANP方法,更有利于后续的分类识别。
图7对比了降噪前后六类信号的平均识别率曲线,实验中,混合信噪比在[-6,10]dB范围内间隔2 dB选取,α选取1.6,每种信噪比下每类信号生成500个样本用于测试。可以看出,降噪处理后的信号识别率相比直接对接收信号进行分类的识别性能明显提升。另外,采用本文方法相比于MANP法具有较好的降噪效果,对识别性能有一定提升,验证了本文方法的有效性。
图7 降噪前后识别率对比
Fig.7 Comparison of recognition rate before and after noise reduction
图8对比了不同强度的脉冲噪声对识别率的影响,实验中,混合信噪比选取-2 dB,α在[1.5,2]范围内间隔0.1选取,每种信噪比下每类信号500个样本用于测试。从曲线的对比可以看出,本文降噪方法可以较好的抑制脉冲噪声,进而能够提升信号的识别率,进一步验证了本文方法的有效性。
图8 不同特征指数下的识别率曲线
Fig.8 The recognition rate curve under different α
为了验证本文方法在目标水域只有少量数据可用的情况下,本文所采用的迁移学习方法的有效性,在h1、h2和h3信道条件下构建了预训练数据集,h4设为目标水域测试信道,该信道下分别采用每类信号10、30、50个样本可用于微调网络,得到性能对比曲线如图9所示。
表2 信号参数
Tab.2 Parameters of signals
调制类型码元速率(Baud)调制指数滚降系数载波频率/中心频率/(kHz)子载波数/个调频斜率/(Hz/ms)2FSK{400,600}1/{15,16} //4FSK{320,600}1/{15,16}//8FSK{170,330}1/{15,16}//MPSK{1600,2000,2400,3000}/0.25{15,16}//LFM///{15,16}/{150,250}OFDM{80,100,120}/0.25{15,16}16/
图9 网络微调前后识别性能对比
Fig.9 Comparison of recognition performance before and after network fine tuning
从图9中曲线可以看出,微调后的网络相比于未微调网络识别性能明显提高,说明预训练网络能够通过微调数据学习到待测水域信道的部分信息。同时,随着微调数据量的增加,网络识别效果越好。但是微调数据量增加到一定程度,网络识别性能提高不明显,表明微调数据量为30就能较好提升网络性能,也验证了在待测水域数据量不足条件下采用两步迁移学习的有效性。
表3中给出了本文方法以及文献[6]方法中所涉及网络模型的参数量和计算复杂度。相比文献[6]的CNN,本文方法引入了DAE网络,无论是参数量还是计算复杂度都有所提升。而图7和图8表明本文方法在脉冲噪声环境下识别性能的大幅提升,虽然牺牲了计算量,但是能够利用更多计算量来得到更好的类别预测,而且计算量依然是可接受的。
表3 模型参数量和计算复杂度
Tab.3 Model parameters and computer complexity
网络参数量计算量文献[6]61.1M0.71本文方法118.45M1.25
最后,为了测试本文方法对不同水声信道的适应性,选用不同水域、不同传输条件下的水声信道进行测试,图10给出了测试水域的声速剖面图。在水域3条件下,发送和接收深度分别100 m和200 m,通信距离为15 km。水域4条件下发送和接收深度均为200 m,通信距离为3 km。图11给出了不同测试信道的幅频响应,信道的传输函数为:
HA(z)=1+0.53z-5+0.68z-575+0.07z-619+0.39z-645+
0.08z-1485+0.98z-1715+0.44z-2666+0.45z-2672
(16)
HB(z)=0.1+0.26z-150+0.21z-348+0.85z-369+z-374
(17)
图10 声速剖面图
Fig.10 Sound velocity profile
图11 信道幅频响应
Fig.11 Channel amplitude frequency response
由图11的信道幅频响应可以看出信道hA的相关带宽相对较窄,对信号的衰落严重,具体的测试结果如表4所示。由测试结果可以看出在衰落严重的信道hA的影响下,平均识别率可达到86.3%,其中MPSK、LFM和OFDM信号识别率均达到90%以上,在信道hB的影响下识别效果更优,进一步验证了本文方法的信道适应性。
为了验证算法在实际水声信道的应用效果,选择在学校人工湖进行了水声通信实验,实验水域深度约为1 m~3 m,收发端水下深度均为1 m,设备布放情况如图12(a)所示,S1和S2分别表示发送和接收节点,通信距离约25 m。基于此信道进行水声通信收发实验,发送端信号类型如式(1),每类信号发送时长600 s。在接收端使用Ocean Sonics公司的RB9-ETH水听器对信号进行采集,如图12(b)。RB9-ETH水听器采样率与仿真信号保持一致设置为48 kHz。
表4 不同信道下的测试结果
Tab.4 Recognition results under different channel
方法识别率/%2FSK4FSK8FSKMPSKLFMOFDM平均识别率/%hA74.568.089.098.591.097.086.3hB99.599.099.099.099.098.098.6
图12 人工湖实验场景和设备
Fig.12 The scenes of artificial lake experimental and equipment
为了衡量人工湖通信实验的信道环境,本文采用文献[18]中的方法对实际信道进行估计,图13为人工湖水声信道的冲激响应,可以看出存在明显的多径时延。以4FSK和LFM信号为例,图14给出了两种信号的时域图和时频图,可以看出接收信号具有明显的脉冲噪声和多径拖尾。
图13 人工湖水声通信信道冲激响应
Fig.13 Impulse response of underwater acoustic communication channel in artificial lake
实验中,仍然采用h1、h2和h3信道条件下的标注数据作为预训练数据集,然后采用每种信号30个实际样本进行微调,得到最终的识别率混淆矩阵如图15(a)所示。可以看出,微调后的网络对6类信号的识别率均能达到94%以上,并且每类信号识别率均高于文献[6]方法,可以看出经过网络微调的识别模型更具优势。通过实际信号的测试,更加验证了本文所提出的方法的有效性。
图14 实际接收信号
Fig.14 Actual received signal
图15 信号识别混淆矩阵
Fig.15 Signal recognition confusion matrix
本文针对浅海脉冲噪声环境下水声通信信号识别问题,提出了一种基于降噪自编码器和卷积神经网络的分类识别方法,并利用迁移学习和微调策略,进一步提升了在目标水域训练数据稀缺情况下的识别性能。仿真实验和实际测试验证了本文方法的有效性,另外,本文算法思想不仅适用于水声通信信号,还可以扩展到其他水声信号的降噪和识别中。
[1] Ma X Y, Nikias C L. Parameter estimation and blind channel identifications in impulsive signal environments[J]. IEEE Transaction on Signal Processing, 1995, 43(12): 2884-2897.
[2] 李淼. α稳定分布噪声下数字信号调制识别方法研究[D]. 哈尔滨: 哈尔滨工程大学, 2019.
Li Miao. Research on Digital Signal Modulation Identification Method under Alpha Stable Noise Distribution[D]. Harbin: Harbin Engineering University, 2019.(in Chinese)
[3] 孔豫京, 黄焱, 马金全. Alpha稳定分布噪声背景下衰落信号的调制识别方法[J]. 信号处理, 2015, 31(8): 975-985.
Kong Yujing, Huang Yan, Ma Jinquan. Modulation Recognition Method of Fading Signals under Alpha Stable Distribution Noise Background[J]. Journal of Signal Processing, 2015, 31(8): 975-985.(in Chinese)
[4] 葛轶洲, 叶蓁, 周青, 等. Alpha稳定分布噪声下的水下通信调制识别[J]. 通信对抗, 2016, 35(2): 16-19.
Ge Yizhou, Ye Zhen, Zhou Qing, et al. Modulation Recognition for Underwater Communication Signals in Alpha Stable Distribution Noise[J]. Communication Countermeasures, 2016, 35(2): 16-19.(in Chinese)
[5] 赵自璐, 王世练, 张炜, 等. 水下冲激噪声环境下基于多特征融合的信号调制方式识别[J]. 厦门大学学报(自然科学版), 2017, 56(3): 416- 422.
Zhao Zilu, Wang Shilian, Zhang Wei, et al. Classification of Signal Modulation Types Based on Multi-features Fusion in Impulse Noise Underwater[J]. Journal of Xiamen University(Natural Science), 2017, 56(3): 416- 422.(in Chinese)
[6] 李勇斌, 王彬, 邵高平. 一种基于Alexnet的水声通信信号调制识别方法[C]∥2018年全国声学大会, 2018: 1-2.
Li Yongbin, Wang Bin, Shao Gaoping. A Method of Modulation Recognition of Underwater Acoustic Communication Signals Based on Alexnet[C]∥Technical Acoustics, 2018, 2018: 1-2.(in Chinese)
[7] 邵梦琦. 水声通信信号调制模式识别算法研究[D]. 哈尔滨: 哈尔滨工程大学, 2019.
Shao Mengqi. Research on Modulation Pattern Recognition Algorithm of Underwater Acoustic Communication Signal[D]. Harbin: Harbin Engineering University, 2019.(in Chinese)
[8] Wang Yan, Zhang Hao, Sang Zhanliang, et al. Modulation Classification of Underwater Communication with Deep Learning Network[J]. Computational Intelligence and Neuroscience, 2019, 2019(4): 1-12.
[9] 姜楠, 王彬. 基于稀疏自动编码网络的水声通信信号调制识别[J]. 信号处理, 2019, 35(1): 107-118.
Jiang Nan, Wang Bin. Underwater Communication Signals’ Modulation Recognition Based on Sparse Autoencoding Network[J]. Journal of Signal Processing, 2019, 35(1): 107-118.(in Chinese)
[10] Ding Lida, Wang Shilian, Zhang Wei. Modulation Classification of Underwater Acoustic Communication Signals Based on Deep Learning[C]∥2018 OCEANS-MTS/IEEE Kobe Techno-Ocean (OTO). IEEE, 2018: 1- 4.
[11] 王岩, 吕婷婷. 基于深度残差网络的水下通信调制信号分类[J]. 数字海洋与水下攻防, 2020, 3(3): 242-249.
Wang Yan, Lv Tingting. Classification of Underwater Communication Modulated Signals Based on Deep Residual Network[J]. Digital Ocean & Underwater Warfare, 2020, 3(3): 242-249.(in Chinese)
[12] 殷敬伟, 罗五雄, 李理, 等. 基于降噪自编码器的水声信号增强研究[J]. 通信学报, 2019, 40(10): 119-126.
Yin Jingwei, Luo Wuxiong, Li Li, et al. Enhancement of underwater acoustic signal based on denoising automatic-encoder[J]. Journal on Communications, 2019, 40(10): 119-126.(in Chinese)
[13] 张俊林. α 稳定分布噪声下通信信号调制分析技术研究[D]. 郑州: 信息工程大学, 2017.
Zhang Junlin. Research on Modulation Analysis of Digital Communication Signals in Alpha-Stable Distribution Noise[D]. Zhengzhou: PLA Information Engineering University, 2017.(in Chinese)
[14] Samorodnitsky G, Taqqu M S. Stable non-gaussian random processes: Stochastic models with infinite variance[J]. Journal of the American Statal Association, 1996, 90(430): 805- 806.
[15] 赵晓迪. 基于谱分析的通信信号调制识别与参数估计研究[D]. 成都: 西南交通大学, 2010.
Zhao Xiaodi. Modulation Recognition and Estimation of Communication Signal Based on Spectral Analysis[D]. Chengdu: Southwest Jiaotong University, 2010.(in Chinese)
[16] Yosinski J, Clune J, Bengio Y, et al. How transferable are features in deep neural networks?[C]∥Advances in Neural Information Processing Systems(NIPS), 2014: 3320-3328.
[17] Barazideh R, Sun W, Natarajan B, et al. Impulsive noise mitigation in underwater acoustic communication systems: experimental studies[C]∥IEEE 9th Annual Computing and Communication Workshop and Conference (CCWC), 2019: 880- 885.
[18] 殷敬伟. 水声通信原理及信号处理技术[M]. 国防工业出版社, 2011: 237-241.
Yin Jingwei. Principle of underwater acoustic communication and signal processing technology[M]. National Defence Industry Press, 2011: 237-241.(in Chinese)
王 彬 女, 1971年生, 河南郑州人。中国人民解放军战略支援部队信息工程大学副教授、硕士生导师。主要研究方向为软件无线电、无线通信中信道盲均衡等。
E-mail: commutech@163.com
王海旺 男, 1996年生, 河北高邑人。中国人民解放军战略支援部队信息工程大学研究生, 主要研究方向为水声通信信号分析与处理。
E-mail: oceanw_ang@163.com
李勇斌 男, 1996年生, 江西婺源人。中国人民解放军战略支援部队信息工程大学研究生, 主要研究方向为水声通信信号分析与处理。
E-mail: xcwwbin@163.com