基于1DCNN-BiLSTM网络的ADS-B欺骗式干扰检测

王文益 古亭亭

(中国民航大学天津市智能信号与图像处理重点实验室, 天津 300300)

摘 要: 在空中交通监视系统中使用的现代技术中,广播式自动相关监视(ADS-B)是当今最引人注目的一种,它具有更高的准确性和更少的人为依赖。但其在没有任何认证和加密的情况下广播消息,信息可能会被恶意伪造或修改。本文介绍了两种基于1DCNN-BiLSTM的网络模型,此模型根据ADS-B时域采样数据提取真实信号与欺骗信号的特征并识别出欺骗信号。在航迹较短时,该模型能提取ADS-B信号详细的时间特征信息;在航迹较长时,先利用一维卷积神经网络(1D-CNN)提取每条航迹内每个空中位置的详细的时间特征信息,然后利用双向长短期记忆网络(BiLSTM)挖掘不同空中位置之间的空间关系。经过仿真实验,1DCNN-BiLSTM网络与只具有时间特征提取的网络相比,例如DNN和LSTM,有更好的检测效果。

关键词:广播式自动相关监视;欺骗检测;深度学习;卷积神经网络;长短期记忆网络

1 引言

ADS-B系统主要任务是提取和处理航空器的位置和其他附加信息,以形成清晰直观的飞行航迹。但其在没有任何认证和加密的情况下广播消息[1],攻击者可以对ADS-B系统发起各种无线攻击,例如干扰、窃听、修改、消息注入和删除消息[2]。随着ADS-B系统在民航领域内的广泛使用,检测抑制欺骗干扰极其重要。

近年来,深度学习日益发展[3- 4],应用于实际生活中的各类识别,例如图像识别[5- 6]、语音识别[7]和无线通信[8-12]。在过去两年中,深度学习也被用于解决无线电信号分类问题[13-14]。文献[15]使用inception-residual网络模型对大量的ACARS信号和ADS-B信号进行分类。在文献[16]中,提出了一种基于深度残差网络(Deep residual network,DRN)的ADS-B信号辐射源识别算法,该算法利用自定义的DRN模型挖掘IQ信号的联合深度特征,进行分类识别。文献[17]中利用ADS-B原始报文,采用神经网络seq2seq模型把ADS-B报文根据时序特点进行预测重新生成,然后计算生成报文与原始报文的误差来检测其是否有报文添加、报文删除和报文篡改等欺骗干扰,但此算法需要解码得到飞机的各类具体的身份信息作为数据的基本特征,特征数较多,计算比较复杂。文献[18]中基于真实ADS-B信号的多普勒频偏变化规律与报告位置的变化规律相符合的特征,提出了一种改进型的AlexNet网络模型,识别率较高,但此方法需要计算多普勒频偏,计算较为复杂。此外,Ying[19]等人还提出了一种完整的基于深度神经网络的ADS-B 欺骗检测器,利用DNN模型提取ADS-B信号的原始IQ数据特征并检测欺骗干扰,此方法可以达到端对端的操作。

本文针对ADS-B信号具有周期性、时间关联性强,从接收航迹长短的角度出发,介绍了两种1DCNN-BiLSTM模型,用于检测ADS-B欺骗式干扰,该方法不需要改变现有协议,也不需要解码获得报文信息或计算多普勒频偏,只需要得到原始时域采样数据,当接收的一条航迹只有一条ADS-B信号时,一维卷积神经网络(1D-CNN)对接收信号进行一个预处理得到一个序列特征,减少数据长度的同时又挖掘了主要特征,然后将序列特征作为BiLSTM的输入,以提取信号的详细时间特征信息。当接收的一条航迹含有多条ADS-B信号时,该方法利用一维卷积神经网络(1D-CNN)提取一条航迹内每个空中位置的详细时间特征信息,利用 BiLSTM网络挖掘不同空中位置之间的空间关系。本文方法样本只需采用时域采样数据,不需要复杂或者多维的特征,与只具有时间特征提取的网络相比,1DCNN-BiLSTM网络模型能更好地提取ADS-B信号的特征以及一条航线上信号间的空间关系。

2 信号模型和问题描述

2.1 ADS-B信号

ADS-B系统常用的数据链是1090ES数据链,ADS-B信号的消息结构如图1所示,其中“AA”域是民航组织发给每架飞机的唯一标识符,“ME”域包含标识、位置、速度和紧急代码等监视信息,最后“PI”域是用于验证前面消息的正确性。

图1 ADS-B消息结构
Fig.1 ADS-B message structure

其中数据域采用的调制方式为PPM(Pulse Position Modulation),信号调制方式为ASK(Amplitude Shift Keying),当单天线的接收机在时刻t接收到一条信号时信号可表示为:

(1)

其中P表示信号功率,D(t)为基带信号,φ为初相位, f0为载波频率,e(t)为复高斯白噪声。

2.2 问题描述

一个位于地面的ADS-B接收机(单天线)接收ADS-B信号,左上角是真实飞机航迹。右下角的干扰机在接收机接收范围之内静止不动或匀速运动,并向接收机发送航迹较短的或者航迹较长的ADS-B欺骗信号(调制方式和报文格式与真实信号相同),右上角是假飞机航迹。如图2所示。

图2 欺骗场景示意图
Fig.2 Schematic diagram of the fraud scene

3 ADS-B数据集

因为ADS-B欺骗式干扰在实际生活中不是大量存在,所以网络训练实验中所采用的样本数据集由MATLAB平台仿真,其中样本数据集包括真实ADS-B信号以及航迹长短不同的欺骗信号。对样本数据集预处理之后,然后选定适合两种数据集的网络进行训练和测试。

3.1 生成信号

假设地面ADS-B接收机位于东经118.3594,北纬39.1128,在接收机附近随机生成2000条航迹,飞机高度为10 km,距离接收机水平范围30 km内,生成的航迹时长为5 s,那么每条航迹共发送10段ADS-B信号。假设干扰机位于地面静止不动或者在接收机附近5 km内运动,方向可能是随机的,向接收机发送欺骗信号。本文实验利用随机生成的2000条航迹信息分别生成真实信号与欺骗信号,信噪比为20 dB,采样率为30 MHz。在实际应用中,接收机获得同一架飞机的航迹信息成本较高,本文为了应对接收航迹不同长度情况下,采用两种数据集,不同数据集采用不同的1DCNN-BiLSTM模型。为获得两种数据集,需要经过数据预处理。

3.2 制作样本数据集

接收机随机生成2000条航迹,每条航迹时长为5 s,每条航迹包含10条空中位置消息。利用这些航迹分别生成只含有真实ADS-B信号的航迹和只含有欺骗ADS-B信号的航迹各2000条,每条航迹包含10段独立携带一组报文信息的ADS-B信号,其中欺骗信号包含了干扰机静止或匀速运动两种欺骗场景产生的欺骗信号,两种欺骗信号为1∶1的比例。为了验证在1DCNN-BiLSTM的网络模型下,不论数据样本只含有一段独立携带一组报文信息的ADS-B信号或者含有多段ADS-B信号,该网络模型都能够高准确率识别欺骗ADS-B信号,只是对于不同数据样本该网络采用不同的结合形式。那么我们需要对生成的这些航迹做数据预处理得到两种数据样本。数据1只包含一条空中位置消息,其采用的网络模型根据飞机的一条空中位置信息就可以判断飞机的真假;数据2包含10条空中位置消息,其采用的网路模型根据同一架飞机的多条位置信息判断飞机的真假。

由于接收机生成的每条航迹有10条空中位置消息,每条空中位置消息持续时间为120 μs,在30 MHz的采样率下,不考虑信号之间的噪声,只保留有效信息,一条航迹将产生长度为36000的样本。在制作数据集样本的时候,如图3,对于数据1来说,为了得到一段独立携带一组报文信息的ADS-B信号,需要将航迹中的每段信号截取作为一个样本,每个样本长度为3600。即真实信号与欺骗信号样本数量各20000,样本总量为40000。对于数据2来说,保留带有10段独立携带一组报文信息的ADS-B信号,样本长度为36000。即真实信号与欺骗信号样本数量各2000,样本总量为4000。

图3 数据样本
Fig.3 Data sample

在训练神经网路之前,通常会数据样本集处理成同一量化标准。本文使用的是min-max标准化[20],使输入的数据落入到我们需要的范围内,处理后的数据范围为[0,1]。此外,为了尽大程度地缩短训练时长,这里将标准化处理后的数据转换成单精度浮点型的数据格式,这样不仅不会影响训练的精度效果,而且还提高了训练速度。

4 1DCNN-BiLSTM网络模型

CNN-LSTM网络模型是CNN结合RNN的网络模型。此网络模型一般用于视频识别,在文献[21]中利用该网络进行了视频动作识别。最近,在文献[22]中,提出1DCNNs-BiLSTM模型对光纤分布式声学传感器(DAS)信号识别,由于以往大多数的DAS信号识别只考虑了不同光纤位置的每个采样节点的振动信号的时间特征提取,而忽略了它们之间的空间关系。因此文献中的算法以每个采样节点信号的波形图作为网络模型的输入特征,先采用相同的1DCNN提取每个采样节点振动信号的详细时间结构特征,从而学习每个节点信号波形的整体结构,然后将提取的1D-CNN 特征向量并行输入到BiLSTM 网络中,旨在提取不同节点信号之间的空间关联;最后,将提取的时空特征叠加并输入到整个网络的全连接层中,以识别DAS信号。本文借鉴了文献[22]的思想,在航迹较长时,不仅考虑每个空中位置的时间特征,同时考虑不同空中位置之间的空间关联。在本文中,对两种数据样本集,我们采用两种不同1DCNN-BiLSTM网络模型进行欺骗检测分类。即适用于数据1的网络模型A,适用于数据2的网络模型B,两种模型中的输入特征都是一维的采样数据,图4描述了两种模型的输入层,其中xi为数据1采样点对应的采样数据,i=1,2,...,n,n为3600,ym为数据2采样点对应的数据,m=1,2,...,l,l为36000。为了在画网络模型图时简便直观地显示网络输入层,这里输入层只显示它的输入形状,则网络模型A的输入大小为1×N,N为3600,网络模型B中将输入数据分为10 段,则每一段ADS-B信号输入大小也是1×N

图4 两种网络模型的输入层
Fig.4 The input layer of the two network models

4.1 网络模型A

图5所示,网络结构A主要由1DCNN部分和BiLSTM部分组成,然后是一个全连层和Softmax的输出层。表1是网络模型A的参数设置。

图5 网络模型A
Fig.5 Network model A

表1 网络模型A的参数设置

Tab.1 Parameter setting of network model A

分层参数CNNConv: 1*10*32,activation=’relu’Maxpooling: 1*10Conv: 1*10*64,activation=’relu’Maxpooling: 1*10BiLSTM50DenseDense(100,activation=’relu’)Dense(2,activation=’softmax’)

在图5中,输入层以1×N的大小输入该网络模型,首先进入的是1DCNN模块,这里采用是一维卷积核,通过多层卷积池化将ADS-B信号预处理,池化层通常在卷积层之后立即使用,将卷积后的数据简短,不仅能增快计算速度,也能解决过拟合。之后将1DCNN输出的特征作为BiLSTM的输入,对于长时序数据,LSTM比RNN适合,其可以一定程度上的避免梯度消失以及长期依赖的现象,但随着信号长度的增加,信息丢失的程度将变得明显。BiLSTM 神经网络是一种基于 LSTM 神经网络的新模型,其双向结构可以为输出层中的每个节点提供完整时序数据上下文信息。然后将BiLSTM的输出输入全连接层,整个网络能够很好地提取到ADS-B信号采样数据在时间上的变化,最后对真假ADS-B信号进行二分类。

4.2 网络模型B

对于数据2,每个数据样本含有10段ADS-B信号。每一段信号的输入也是1×N的一维数据。图6是网络模型B结构,表2是其参数设置。

图6 网络模型B
Fig.6 Network model B

表2 网络模型B的参数设置

Tab.2 Parameter setting of network model B

分层参数CNNTimeDistributed(Conv: 1*3*64,activation=‘relu’)TimeDistributed(Maxpooling: 1*5)TimeDistributed(Dropout(0.5))TimeDistributed(Conv: 1*3*32,activation=‘relu’)TimeDistributed(Maxpooling: 1*5)TimeDistributed(Flatten())BiLSTM50DenseDense(100,activation=‘relu’)Dense(2,activation=‘softmax’)

如图6,网络模型B中每个相同的CNN模块提取在一条航线里每段独立携带一组报文信息的ADS-B信号时间特征信息,这些信息可以按实际空间顺序拼接成一个特征序列,将特征序列作为BiLSTM的输入挖掘每段独立携带一组报文信息的ADS-B信号在空间上的关系,此模型可以同时提取一段航线上的ADS-B信号的时空信息,从而更好地区分真假ADS-B信号。从表2的参数设置中可得知,CNN模型包装在TimeDistributed层中,此操作是让每一段ADS-B信号读取相同的CNN模型,除了将输入数据卷积和池化以外,还加入了平坦层,这层的作用是将卷积、池化后的数据转换为一维数据,以作为下一层BiLSTM的输入,然后连接全连接层,最后对真假ADS-B信号进行二分类。

5 仿真性能比较

在实验中,根据数据预处理得到的两种样本数据集,把两种样本数据集都按照9:1的比例分为训练集与测试集。并且将DNN和LSTM两种模型分别与本文模型A、B进行识别性能对比。图7显示了网络模型A的训练过程中的准确率与损失函数的关系,此模型是在tensorflow框架上搭建的,当训练到600次左右,准确率与损失值趋于稳定。表3显示了DNN、LSTM和网络模型A的测试精度。

图7 准确率与损失值关系
Fig.7 Relationship between accuracy rate and loss value

表3 数据1识别性能对比

Tab.3 Data 1 Comparison of identification performance methods

识别方法训练时间/min识别准确率/%DNNLSTM1DCNN-BiLSTM2025508695.598.3

图8显示了网络模型B的训练过程中的准确率与损失值的关系,此模型因为含有TimeDistributed层,所以在keras框架上搭建。由图可知,当训练到10次左右,准确率与损失值趋于稳定。表4显示了DNN、LSTM和网络模型B的测试精度。

图8 准确率与损失值关系
Fig.8 Relationship between accuracy rate and loss value

表4 数据2识别性能方法对比

Tab.4 Data 2 Comparison of identification performance methods

识别方法训练时间/min识别准确率/%DNNLSTM1DCNN-BiLSTM183570899799.7

从表3、表4中可以看出,对ADS-B欺骗式干扰信号的检测,基于1DCNN-BiLSTM的网络模型A、B的测试精度明显高于DNN和LSTM网络。在本文提出的方法中,即使是在航迹长度较短时也具有很高的识别率;在航迹含有位置消息条数为10条时,三种网络模型识别准确率比含有一条位置消息高。从理论上分析,位置消息只有一条时信号特征较少,而位置消息含有多条时,神经网络不但可以提取信号特征,还能学习信号间的联系。

6 结论

本文介绍一种融合网络模型1DCNN-BiLSTM,将CNN和BiLSTM相结合,直接将接收机接收的ADS-B时域采样数据预处理之后送入1DCNN-BiLSTM网络进行训练和测试。在接收航迹不同长度条件下,该网络通过不同的结合方式组成适合数据1的网络模型A,适合数据2的网络模型B,通过实验仿真结果,本文两种算法与常用的单一时间特征提取的模型相比,识别准确率更高,使其更具有现实可行性。本文没有采取更加稳定的特征去识别欺骗信号,使用多维且更稳定的特征识别欺骗信号值得进一步探讨。

参考文献

[1] BAEK J, HABLEEL E, BYON Y J, et al. How to protect ADS-B: Confidentiality framework and efficient realization based on staged identity-based encryption[J]. IEEE Transactions on Intelligent Transportation Systems, 2017, 18(3): 690-700.

[2] STROHMEIER M, SCHFER M, LENDERS V, et al. Realities and challenges of nextgen air traffic management: The case of ADS-B[J]. IEEE Communications Magazine, 2014, 52(5): 111-118.

[3] LECUN Y,BENGIO Y,HINTON G E,et al.Deep learning[J]. Nature, 2015, 521(7553): 436- 444.

[4] GOODFELLOW I, BENGIO Y, COURBILLE A. Deep Learning[M]. The MIT Press, 2016.

[5] LIU Weibo, WANG Zidong, LIU Xiaohui, et al. A survey of deep neural network architectures and their applications[J]. Neurocomputing, 2017, 234: 11-26.

[6] IOANNIDOU A, CHATZILARI E, NIKOLOPOULOS S, et al. Deep learning advances in computer vision with 3D data: A survey[J]. ACM Computing Surveys, 2017, 50(2): 20.

[7] HINTON G,DENG Li,YU Dong,et al.Deep neural networks for acoustic modeling in speech recognition: The shared views of four research groups[J]. IEEE Signal Processing Magazine, 2012, 29(6): 82-97.

[8] O’SHEA T, HOYDIS J. An introduction to deep learning for the physical layer[J]. IEEE Transactions on Cognitive Communications and Networking, 2017, 3(4): 563-575.

[9] DÖRNER S, CAMMERER S, HOYDIS J, et al. Deep learning based communication over the air[J]. IEEE Journal of Selected Topics in Signal Processing, 2018, 12(1): 132-143.

[10] HUANG Hongji, YANG Jie, HUANG Hao, et al. Deep learning for super-resolution channel estimation and DOA estimation based massive MIMO system[J]. IEEE Transactions on Vehicular Technology, 2018, 67(9): 8549- 8560.

[11] GUI Guan, HUANG Hongji, SONG Yiwei, et al. Deep learning for an effective nonorthogonal multiple access scheme[J]. IEEE Transactions on Vehicular Technology, 2018, 67(9): 8440- 8450.

[12] WANG Tianqi, WEN Chaokai, WANG Hanqing, et al. Deep learning for wireless physical layer: Opportunities and challenges[J]. China Communications, 2017, 14(11): 92-111.

[13] O’SHEA T J, ROY T, CLANCY T C. Over-the-air deep learning based radio signal classification[J]. IEEE Journal of Selected Topics in Signal Processing, 2018, 12(1): 168-179.

[14] MERCHANT K,REVAY S,STANTCHEV G,et al.Deep learning for RF device fingerprinting in cognitive communication networks[J]. IEEE Journal of Selected Topics in Signal Processing, 2018, 12(1): 160-167.

[15] CHEN Shichuan, ZHENG Shilian, YANG Lifeng, et al. Deep learning for large-scale real-world ACARS and ADS-B radio signal classification[J]. IEEE Access, 2019, 7: 89256- 89264.

[16] 翁琳天然,彭进霖,何元,等. 基于深度残差网络的ADS-B信号辐射源个体识别[J/OL].航空兵器, 2012,49(8):1- 8.

WENG Lintianran,PENG Jinlin,HE Yuan,et al.Individual Recognition of ADS-B Signal Radiator Based on Deep Residual Network[J/OL]. Aviation Weaponry, 2012,49(8): 1- 8.(in Chinese)

[17] 丁建立,邹云开,王静,等.基于深度学习的ADS-B异常数据检测模型[J].航空学报,2019,40(12):167-177.

DING Jianli, ZOU Yunkai, WANG Jing, et al. ADS-B anomaly data detection model based on deep learning[J].Acta Aeronautica Sinica,2019,40(12):167-177.(in Chinese)

[18] 王文益, 吴庆. 利用改进型AlexNet的ADS-B欺骗式干扰检测[J]. 信号处理, 2020, 36(5): 741-747.

WANG Wenyi, WU Qing. ADS-B spoofing interference detection using improved AlexNet[J]. Journal of Signal Processing, 2020, 36(5): 741-747.(in Chinese)

[19] YING Xuhang, MAZER J, BERNIERI G, et al. Detecting ADS-B spoofing attacks using deep neural networks[C]∥2019 IEEE Conference on Communications and Network Security (CNS). Washington, DC, USA. IEEE, 2019: 187-195.

[20] 李益兵, 宋东林, 王磊. 基于混合PSO-Adam神经网络的外协供应商评价决策模型[J]. 控制与决策, 2018, 33(12): 2142-2152.

LI Yibing, SONG Donglin, WANG Lei. Based on hybrid PSO-Adam neural networks decision making model for outsourcing supplier evaluation[J]. Control and Decision, 2018, 33(12): 2142-2152.(in Chinese)

[21] ULLAH A, AHMAD J, MUHAMMAD K, et al. Action recognition in video sequences using deep Bi-directional LSTM with CNN features[J]. IEEE Access, 2018, 6: 1155-1166.

[22] WU Huijuan, YANG Mingru, YANG Siqi, et al. A novel DAS signal recognition method based on spatiotemporal information extraction with 1DCNNs-BiLSTM network[J]. IEEE Access, 2020, 8: 119448-119457.

ADS-B Deceptive Jamming Detection Based on 1DCNN-BiLSTM Network

WANG Wenyi GU Tingting

(Tianjin Key Laboratory of Intelligent Signal and Image Processing, Civil Aviation University of China, Tianjin 300300, China)

Abstract: Among the modern technologies used in air traffic surveillance systems, Automatic Dependent Surveillance-Broadcast (ADS-B) is the most eye-catching one today, with higher accuracy and less human dependence. However, it broadcast messages without any authentication and encryption, and the information may be maliciously forged or modified. This article introduced two network models based on 1DCNN-BiLSTM. This model extracted the characteristics of the real signal and the spoofed signal based on the ADS-B time-domain sampling data and identified the spoofed signal. When the trajectory was short, the model could extract the detailed time feature information of the ADS-B signal; when the trajectory was long, first used one-dimensional Convolutional Neural Network (1D-CNN) to extract each air position in each trajectory The detailed time feature information of the, Then used the Bi-directional Long Short-Term Memory (BiLSTM) to mine the spatial relationship between different air positions. After simulation experiments, the 1DCNN-BiLSTM network has a better detection effect than the network that only has time feature extraction, such as DNN and LSTM.

Key words automatic dependent surveillance-broadcast; spoofing detection; deep learning; convolutional neural network; long short-term memory network

中图分类号:TN973.3

文献标识码:A

DOI: 10.16798/j.issn.1003- 0530.2021.06.010

引用格式: 王文益, 古亭亭. 基于1DCNN-BiLSTM网络的ADS-B欺骗式干扰检测[J]. 信号处理, 2021, 37(6): 984-990. DOI: 10.16798/j.issn.1003- 0530.2021.06.010.

Reference format: WANG Wenyi, GU Tingting. ADS-B deceptive jamming detection based on 1DCNN-BiLSTM network[J]. Journal of Signal Processing, 2021, 37(6): 984-990. DOI: 10.16798/j.issn.1003- 0530.2021.06.010.

文章编号: 1003-0530(2021)06-0984-07

收稿日期:2021-01-28;修回日期:2021-03-14

基金项目:国家自然科学基金项目(U1833112)

作者简介

王文益 男,1980 年生,湖北人。中国民航大学教授,硕士生导师,博士,主要研究方向为自适应信号处理、卫星导航、无线电通信等领域的研究工作。E-mail: wenyi_wang@126.com

古亭亭 女,1994年生,重庆人。中国民航大学硕士研究生,主要研究方向为ADS-B抗欺骗和深度学习等领域的研究工作。E-mail: 1228701484@qq.com