露天矿山边坡地区因坍塌及滚石造成的人员伤亡和财务损失,大大阻碍了矿产资源的开发与利用,因此加强研究坡体变化规律和趋势的边坡形变监测工作尤为关键[1]。相较于全站仪等传统的监测手段设施繁重、工作量大,或GPS等空间对地监测手段易受气候、环境和地貌影响导致监测精度不稳定,灵活便携、稳定精准的地面监测技术便成为主流的监测手段[2]。其中地基合成孔径雷达(Synthetic Aperture Radar,SAR)通过对复杂场景的实时连续观测获取干涉时序数据进而分析形变结果,是当前普遍使用的形变监测方式[3]。
永久散射体法(Permanent Scatterers, PS)[4]是传统的地基SAR形变误差校正算法,通过阈值筛选出高相关性的散射点来获取形变信息。目前国内学者朱茂[5]、黄其欢[6]、吕森[7]等人通过设定幅度离差和相关系数等阈值在地基SAR时序数据中筛选出稳定的PS点,对滤除植被、大气这几类误差有很好的效果[8]。但矿山边坡地区存在的误差来源主要集中在多径误差,难以通过筛选PS点的三阈值法[9]将形变区域与误差区域区分开,残余的多径误差相位会导致提取到的真实形变区不准确,对危害预警造成影响。多径误差[10]主要是因为雷达低角度测量时,会受到地面、设备等影响,导致电磁波会从不同路径传播到达接收机,其接收到的回波信号除直达信号外,还存在着多径信号进行干扰。异常相位变化在重轨干涉形变监测过程中被错误识别为形变,精度低的形变结果对后续研究坡体变化趋势有着较为严重的影响。
因此,通过差分干涉相位时序特征表达的研究,利用像素或区域的序列数据特征在三阈值法筛选出的PS点中进一步区分真实形变与差分相位误差,进而提高识别形变分布的准确率。地基SAR时序数据特征表示和相位分类这两个核心研究内容与自然语言处理(Natural Language Processing, NLP)相类似,目前在这一领域中广泛使用的卷积神经网络(Convolutional Neural Networks, CNN)、循环神经网络(Recurrent Neural Network,RNN)和长短期记忆网络(Long Short-Term Memory,LSTM)在处理长时间序列上都有着训练效率低或长期依赖性问题[11],而注意力网络模型应用注意力机制[12]可以对长序列实现并行操作,高效探索元素间的相关程度,通用架构可以很好的处理地基SAR时序数据。
本文以形变趋势与区域范围作为差分相位分类特征,将通用的注意力网络模型架构匹配差分相位分类任务,从位置编码、网络超参数设计和提高收敛参数效率等方向进行具体改进,实现在PS点中进一步提取出形变区的目标。文章其余章节内容安排如下,第2节介绍坡体形变产生机理和判别真实形变的时序特征,第3节介绍基于注意力网络实现差分相位分类的模型,最后利用边坡实验数据验证方法的准确性。
矿山边坡灾害的形成过程通常是由形变位移随时间变化的曲线来体现,根据斜坡演化三阶段的物理机制[13],发现坡体的初始形变阶段是缓慢增长的,接下来是较长一段时间的匀速变化,最后便迎来曲线斜率急剧增长的加速形变阶段,如图1所示。
图1 斜坡演化三阶段示意图
Fig.1 Three stages of slope evolution
通过对形变值的序列特征进行研究能较好反映形变趋势,因此采用形变位移、形变速率和形变离差这三个特征从序列变化和稳定性两个角度进行判断。形变位移序列能最为简单直观的表示形变曲线,同时相邻时刻间的形变速率也可以很好的刻画形变趋势,即形变一阶差分,计算公式如下:
(1)
公式中dt表示在t时刻下的形变值,Vd则表示形变速率。一阶差分的形式可以更好的补充坡体被破坏产生的形变值变化。
除了形变位移的变化性要考虑之外,这些形变值的稳定性还需要考虑。将幅度离差的概念引用到形变特征中,幅度离差是通过对幅度的计算筛选出幅度信息稳定的PS点,那么在本文中就可以引申为形变离差,计算公式如下:
(2)
其中D是指以各个时刻下目标像素点为中心的3×3窗口中计算得到的形变离差指数,δD表示通过该窗口中9个形变值的标准差,mD则表示窗口中形变值的平均值。计算各个时刻下目标点所在窗口中的形变离差,而非计算目标点在各个时刻下的形变离差,这是因为本文选取的特征要体现时序的变化性。通过对形变离差这一概念的刻画,可以较为准确反映出各个窗口的稳定性,从而判断目标像素点是否符合真实形变缓慢增长的特性。
在实际发生的边坡事故中,可以发现局部性或整体性的形变区域才会造成损失,因此区域性信息对于灾害探测和防治是更加有价值的。由于形变点是在提取到PS点的基础上反演得到的,那么相对密集的PS点区域中较大概率可以产生形变区域,而相对孤立的PS点便无法组成形变局部,所以本文以PS点分布密度作为特征来考虑形变范围,计算公式如下:
(3)
其中ρD代表在以目标像素点为中心的5×5的窗口中PS点的分布密度,QD表示该窗口下PS点的数量,S则表示该窗口的像素点数量,即窗口面积。
通过PS点分布密度这一特征,可以区分目标像素点是否处于相互连接的区域中,以消除孤立形变点的干扰,为网络生成形变区域提供关键的支撑。
由上文可知,本文采用以注意力机制为核心的网络模型对像素点进行分类,进而识别出坡体发生形变的区域。首先以幅度离差、相关系数和相位噪声这三类阈值筛选出PS点作为参考区域,接着将挖掘出参考区域的形变位移、形变速率、形变离差和分布密度这四类特征作为分类网络的输入集。
编码器实质上是带有注意力机制的前馈神经网络,将输入数据向量化,利用位置编码并行存储顺序关系后,经全连接层分配权重来线性映射出查询向量Q、键向量K和值向量V,通过多头注意力机制获取当前PS点不同时刻间的关联程度,再经过前向反馈神经网络映射为隐藏层;解码器与编码器结构相类似,主要通过掩码多头注意力机制来计算该PS点与每一种相位类别的关联性,所谓“掩码”,是指只考虑历史点训练结果来对当前PS点分类产生影响,而掩盖后续点未知的信息,待编码器输出隐藏层至解码器后,解码器的输出嵌入处输入start符,使解码器开始对隐藏层中输出的第一个时刻进行掩码多头注意力计算,将得到的第一个时刻的分类标签再作为输出嵌入参与到第二个时刻的分类,待解码器得到了第二个时刻的分类标签后再作为输出嵌入得到第三个时刻的分类标签,重复循环直至模型输出嵌入end符分类结束。本文网络模型主要对位置编码、多头注意力机制和全连接前馈网络这三个环节进行改进来匹配PS点分类任务:
(1)位置编码:注意力网络架构的优势在于并行操作,其中位置编码便能很好的体现这一特点。位置编码是对像素点的绝对位置和相对位置进行信息的记录,原始结构中是使用三角函数以绝对位置的编码方式来记录相对位置,数学描述为:
PE(pos,i)=
(4)
公式中PE含义是Positional Encoding,即为位置编码,pos表示位置索引,d表示每个像素点位置向量的维度,而i则表示维度为偶数或奇数下的计算模式:当维数为偶数时,使用正弦公式计算出位置信息,当维数为奇数时,则是使用余弦公式进行计算。然而仅仅使用三角公式实现的编码方式过于单一,因为普遍情况下局部信息突出的重点才是关键之处,所以在后续注意力机制的应用中加入高斯分布[14]作为注意力层的加性偏置予以补充,增强局部性建模来对“距离”敏感,在(2)中着重说明。
(2)多头注意力机制:顾名思义,注意力机制是将人类的注意力模式应用到神经网络中,着重强调关键信息,消除不重要信息的干扰。本文的多头注意力机制,以候选PS点区域的形变位移、形变速率、形变离差和分布密度这四类特征作为四条通道来获取多重语义信息。首先将特征向量线性映射,利用全连接层训练出的权重分配至PS点的特征向量中,经过计算得到查询向量Q、键向量K和值向量V。接着根据四类特征,对Q、K、V进行四等份分割,保证每个注意力头下都包含着一类特征信息,计算过程如下:
MultiHead(Q,K,V)=Concat(Attention(Q1,K1,V1),
…,Attention(Q4,K4,V4))
(5)
(6)
(7)
公式(6)计算注意力矩阵,以点积的方式计算当前像素点的某一时刻与各个时刻间相关程度,相关性越大,Q和K点积得到的结果越大,反之亦然;将点积结果除以向量维度以防止梯度消失;而Softmax则是将各个时刻间的相关程度归一化,是分配给V的权重,将所有时刻的信息融入到当前时刻中。注意前文中提到的增强局部性信息描述的方法就体现在公式(7)中,以某PS点的当前时刻为曲线尖峰开展正态分布,以此来提高记录当前时刻下相对位置信息的质量,G表示补充的局部信息,xt表示当前时刻下的位置信息,σx表示该PS点下各个时刻位置信息的标准差,示意图见图2。
图2 高斯正态分布示意图
Fig.2 Sketch map of Gaussian normal distribution
(3)全连接前馈网路:此时每个时刻都融入了全部时刻与之相关联的程度信息,接下来除了残差连接和标准归一化的普遍操作,提高模型训练的准确率,本文还加入Adam梯度下降[15],能自适应快速收敛更新参数,不易陷入局部极小点。而后经过的完全连接的前馈神经网络,含有两个带有ReLU激活的线性转换,着重突出关键信息,滤除不相关信息的影响,最后将这些重要信息映射为隐藏层,传入解码器中。
此次实验将地基SAR设备安置在乌煤矿山边坡地区,现场边坡地形示意图如图4所示。监测时间为2020年8月8日19时30分44秒至8月8日21时40分04秒,以7分钟左右为间隔,历时2小时9分钟20秒,共得到地基SAR边坡时序影像20景。
图3 注意力网络模型架构
Fig.3 Attention network model architecture
图4 乌煤边坡地形示意图
Fig.4 Topographic map of Wumei slope
实际现场勘测到的形变结果、形变位移曲线和速率曲线见图5、图6和图7,使用传统三阈值法筛选PS点进行误差校正,以七分钟为间隔,取其中四个连续时刻的校正结果,如图8所示。
图5 现场形变监测结果
Fig.5 On site deformation monitoring results
图6 形变位移曲线
Fig.6 Deformation displacement curve
图7 形变速率序列曲线
Fig.7 Deformation rate series curve
通过这些实验结果图不难发现,图5中的区域1可以认为是无形变区域,因为图6中的累积形变曲线在0上下小范围起伏,且图8中的四个连续时刻下的初步校正结果中区域1基本维持为绿色;区域2是真实形变区域,由于累积形变序列曲线呈正向上升趋势,且在图8中可以看出四个时刻下区域2中都有一处相同颜色的细小区域,可以认为是缓变的真实形变;区域3的累积形变曲线呈小幅度反向增长趋势,但在间隔7分钟左右的相邻时刻下,校正结果中的区域3会发生较大程度的跳变,这不符合图1 所示的斜坡演化规律,真实的形变是不会在短暂的时间内发生多次大范围的变化,而颜色突变实质就是相位发生了突变,因此暂定区域3为差分相位误差区域。通过对区域的分析,在这三个区域中选取样本,如图9所示。
图8 传统阈值校正结果
Fig.8 Traditional threshold correction results
图9 训练集样本区域
Fig.9 Training set sample region
在像素点2000*2831的边坡影像中,分别从区域1、区域2和区域3样本中随机抽取500、137、500个像素点作为训练区域,再根据第2章节中介绍到的差分干涉相位时序特征表达,以形变位移、形变速率、形变离差和PS点分布密度这四个特征,从形变序列趋势和区域限制两个方向对PS点进行判别。由于形变特点是借助相邻时刻间的关系进行探索的,因此获取到的20个边坡影像通过计算得到19个形变数据。最终,由19个时刻下三个区域样本中每个像素点的四个特征作为网络输入集,形成1137行、19*4列的输入矩阵。根据对深度学习基础知识的学习以及实验累积经验,选择8∶2作为训练数据和验证数据的比例,从三个区域样本中随机抽取数据,得到训练集和验证集。
根据多次训练效果,实验参数设置情况如表1所示。
表1 注意力网络模型参数表
Tab.1 Attention network model parameter table
参数参数值batch_size512num_heads4num_units30num_epochs150max_learning_rate0.005min_learning_rate0.004decay_coefficient0.001dropout_keep_prob0.8evaluate_every5num_blocks6
本文采用的注意力网络使用一层Encoder、decoder,每批次512个随机打乱的样本,全连接隐藏层单元个数为30个,学习率设为0.0005,根据4个特征将模型分为4个头,形成多个子空间,可以让模型去关注不同方面的信息。训练过程使用Adam梯度下降方法快速收敛更新参数,学习效果更为有效,不易陷入局部极小点。
本文的注意力网络模型进行训练,并对验证集进行测试,得到的准确率、损失率曲线如图10所示,针对验证集,评价本文模型的受试者工作特征曲线(Receiver Operating Characteristic Curve,ROC)见图11,曲线下面积占总方格的比例(Area Under Curve,AUC)见表2,AUC越接近1,表示分类精度越高。
图10 注意力网络模型运行结果
Fig.10 Results of attention network model
表2 本文模型的评价结果
Tab.2 The evaluation results of this model
评价指标评价结果宏平均0.956微平均0.976类别1(无形变)AUC0.963类别2(真实形变)AUC1.000类别3(误差相位)AUC0.962训练精度0.974验证精度0.940
图11 ROC曲线
Fig.11 ROC curve
接下来利用模型进行全图预测来识别潜在的形变分布。但由于边坡影像中存在5662000个像素点,如果每个像素点都进行预测会导致时长慢、效率极低。形变点前提是PS点,因此本文先通过传统的三阈值法,以幅度离差、相干系数和噪声相位为阈值筛选PS点,PS点图如图12所示,在这些PS点中进行预测,得到的预测图如图13所示,蓝色表示无形变,红色代表真实形变,黄色代表时序差分相位误差;并根据预测图中像素点的分类情况手动划分形变区,便于观察形变分布,如图14所示。
图12 PS点图
Fig.12 PS point chart
图13 全图预测形变种类
Fig.13 Types of deformation predicted by whole map
从图14中可以看出三种形变区中对于无形变、真实形变和差分相位误差的判断与图5中的真实形变分布基本一致,将真实形变与差分相位误差区分开,较好的提取出真实形变区域。此外还发现了潜在的形变区域,值得后续深入研究。
图14 三形变区分类示意图
Fig.14 Classification diagram of three deformation areas
除了对本文模型进行评价和预测,还需要与传统获取形变的方法进行比较。传统方法是通过阈值法筛选出散射性高的PS点后相位转形变来得到形变分布,但是传统方法主要针对植被去相干和大气效应进行处理,无法消除多径误差的影响。所以通过表3中提取形变点数量来对比两种方法。
表3 提取形变点数量对比表
Tab.3 Comparison table of number of extracted deformation points
时刻时刻一(19:57)时刻二(20:04)时刻三(20:11)时刻四(20:18)传统方法1261086695126971893本文模型745698652621
以图8中的四个时刻为例,通过起始时刻至目标时刻(四个时刻)的序列数据来统计形变点数量,因为形变值缺少真值比较,根据图8中显示的形变量集中在-5 mm至5 mm范围内,所以传统方法将-3 mm至3 mm以外的形变点规定为真实形变,而本文则是通过注意力网络模型对PS点序列特征进行分类预测得到真实形变,将两组形变点数量进行比较,可以发现传统方法得到形变点数量并不稳定,当序列数据越长,形变点数量会相应减少,不稳定的形变点数量不能有力的说明形变结果,而且输入较长的序列才能获取较为准确的形变分布,这样也会影响形变监测的实时性;而本文模型不论序列长短,都可以得到比较稳定的实验结果。对比结果中发现本文模型实时性更好,识别形变精度也更好。
注意力机制是模仿人类的注意力模式,通过较高的关注度来锁定重要事项。同样地,本文采用注意力机制就是为了着重探索时刻与时刻间的关联程度,以此确定是否符合形变规律。而注意力可视化可以更为直观的观察到四种特征与判断是否为形变点之间的关系,如图15所示。
图15 特征-相位分类关系可视化
Fig.15 Visualization of feature and phase classification relationship
图中的颜色深浅程度就可以表示关系的密切程度,在判断目标像素点是否为无形变点时,形变速率和形变离差这两个特征起了较大的作用;在判断是否为差分相位误差时,形变离差和PS点分布密度这两个特征较为有效;而在判断是否为真实形变时,形变位移、形变离差和PS点分布密度提供了较大的帮助。通过可视化可以清晰直白的观察到形变离差在判断每一种差分相位类型时都起了很大的作用,而形变速率帮助作用并不大,可视化结果方便后续在特征方面进行改进。
本文针对形变区域误判的问题,提出一种关于地基SAR时序差分相位分类的注意力网络模型,选用乌煤矿山边坡数据对分类方法加以验证,实验得到了全图形变分布和注意力机制可视化结果。实验结果表明:通过注意力网络模型根据形变规律趋势和区域限制这两个方向的特征,对PS点判断是否为形变点的方法,相较传统的阈值法筛选PS点校正误差,可以较为准确的识别出真实形变区域,以防误差干扰带来的错误预警。
在后续的研究实验中,本文模型仍有需要改进的地方。首先,从特征-相位分类可视化中可以观察到特征选取的好坏,以此对特征输入集进行调整;其次模型超参数如果能自动化调整,那么对与模型的泛化性能会有很大的提升。地基SAR数据处理与网络模型相结合,会是未来地基SAR的研究热点之一,本文验证了注意力网络模型处理时序数据的可行性,后续加强模型的泛化性能,提高处理的实时性,对危害预警会有很大的帮助。
[1] 张世贝,申成锋.GB-InSAR技术在矿山采矿边坡形变监测中的应用[J].中国锰业,2020,38(5):81-83,87.
ZHANG Shibei, SHEN Chengfeng.The application of GB-InSAR technology in mining slope deformation monitoring[J].China’s Manganese Industry, 2020,38(5):81-83,87.(in Chinese)
[2] 刘斌, 葛大庆, 李曼,等.地基InSAR技术及其典型边坡监测应用[J].中国地质调查, 2018, 5(1):73-81.
LIU Bin, GE Daqing, LI Man, et al.Ground-based interferometric synthetic aperture radar and its application in monitoring typical slopes[J].Geological Survey of China, 2018, 5(1):73-81.(in Chinese)
[3] 杨红磊,彭军还,崔洪曜.GB-InSAR监测大型露天矿边坡形变[J].地球物理学进展,2012,27(4):1804-1811.
YANG Honglei, PENG Junhuan, CUI Hongyao.Slope of Large-scale Open-pit Mine Monitoring deformations by Using Ground-Based interferometry[J].Progress in Geophysics, 2012,27(4):1804-1811.(in Chinese)
[4] 高胜,曾琪明,焦健,等.永久散射体雷达干涉研究综述[J].遥感技术与应用,2016,31(1):86-94.
GAO Sheng, ZENG Qiming, JIAO Jian, et al.A review on persistent scatterer interferometric synthetic aperture radar[J].Remote Sensing Technology and Application, 2016,31(1):86-94.(in Chinese)
[5] 朱茂.基于动态PS的地基合成孔径雷达高精度形变测量技术研究[D].北京:北京理工大学,2016.
ZHU Mao.High precision deformation measurement using ground based synthetic aperture radar(GBSAR)based on dynamic persistent scatterer(PS)technique[D].Beijing:Beijing Institute of Technology, 2016.(in Chinese)
[6] 黄其欢, 付五洲, 岳建平,等.海量时序地基SAR影像相干目标选取[J].数据采集与处理, 2016, 31(6):1199-1204.
HUANG Qihuan, FU Wuzhou, YUE Jianping, et al.Selection of coherent targets in large number of time series ground based SAR images[J].Journal of Data Acquisition and Processing, 2016, 31(6): 1199-1204.(in Chinese)
[7] 吕森.基于长时间序列观测误差校正的地基SAR高精度形变反演方法研究[D].北京:北方工业大学,2020.
LV Sen.Research on high-precision deformation inversion method of ground-based SAR based on long-term sequence observation error correction[D].Beijing: North China University of Technology, 2020.(in Chinese)
[8] 陈强,李永树,刘国祥.干涉雷达永久散射体识别方法的对比分析[J].遥感信息,2006(4):20-23,85.
CHEN Qiang, LI Yongshu, LIU Guoxiang.Comparison and Evaluation of Identification Methods of Permanent Scatterers in Radar Interferometry[J].Remote Sensing Information, 2006(4): 20-23,85.(in Chinese)
[9] 王彦平,吕森,曹琨.地基SAR多阈值迭代优化PS点选择方法[J].信号处理, 2019, 35(6):1104-1110.
WANG Yanping, LV Sen, CAO Kun, et al.Ground-based SAR multi-threshold iterative optimization PS point selection method[J].Journal of Signal Processing, 2019, 35(6): 1104-1110.(in Chinese)
[10] 汪安戈,胡国平,周豪.雷达多径效应抑制技术分析及展望[J].火力与指挥控制,2019,44(5):12-16,21.
WANG Ange, HU Guoping, ZHOU Hao.Analysis and Prospect of Multipath Effect Suppression Technologies for Radars[J].Fire Control & Command Control, 2019, 44(5): 12-16,21.(in Chinese)
[11] 夏瑜潞.循环神经网络的发展综述[J].电脑知识与技术,2019,15(21):182-184.
XIA Yulu.A Review of the Development of Recurrent Neural Network[J].Computer Knowledge and Technology, 2019,15(21):182-184.(in Chinese)
[12] WU Hongqiu, ZHAO Hai, ZHANG Min.Not all attention is all You need[EB/OL].2021: arXiv: 2104.04692[cs.CL].https:∥arxiv.org/abs/2104.04692.
[13] 秦宏楠,马海涛,于正兴.地基SAR技术支持下的滑坡预警预报分析方法[J].武汉大学学报·信息科学版,2020,45(11):1697-1706.
QIN Hongnan, MA Haitao, YU Zhengxing.Analysis method of landslide early warning and prediction supported by ground-based SAR technology[J].Geomatics and Information Science of Wuhan University, 2020,45(11):1697-1706.(in Chinese)
[14] YANG Shan, LU Heng, KANG Shiyin, et al.On the localness modeling for the self-attention based end-to-end speech synthesis[J].Neural Networks, 2020, 125: 121-130.
[15] YI D, AHN J, JI Sangmin.An effective optimization method for machine learning based on adam[J].Applied Sciences, 2020, 10(3): 1073.
Reference format: WANG Yanping, CUI Ziwei, CAO Kun, et al.Time series differential phase classification of ground-based SAR based on attention network[J].Journal of Signal Processing, 2021, 37(7): 1207-1216.DOI: 10.16798/j.issn.1003-0530.2021.07.010.