在日常生活中,准确可靠的室内位置有着广泛的应用场景。人们在室外环境中主要采用全球定位系统(Global Positioning System, GPS)来进行导航和定位。在室内环境中,由于卫星信号的衰减,GPS无法提供准确的位置。虽然Wi-Fi、UWB(Ultra wideband indoor navigation system)和蓝牙等无线信号定位技术在室内定位领域已经获得了良好的定位效果,但这些室内定位方法的信号源依赖于基础架构的建设,既昂贵又难以维护。
相比之下,地磁场无处不在,并且无需基础设施就能完成定位,因此在室内定位领域受到越来越多的关注。但由于地磁场的低分辨率,地磁信号在不同位置可能非常相似,导致定位算法精度下降甚至失效。为了解决这个问题,一些研究人员使用地磁场来确定行人航线推测系统(PDR, pedestrian dead reckoning)中人行走的方向[1]。然而,这种方法容易受到铁磁建筑材料和电子设备的干扰,导致方向传感器采集的数据存在很多噪点。基于蒙特卡罗模型的粒子滤波(PF, Particle filter)[2]则在室内定位中使用一系列粒子来估计用户位置。动态时间规划算法(DTW, Dynamic time warping)[3- 4]主要用于匹配语音识别中不同长度的发音,用于计算地磁序列的匹配度。这些方法的定位精度已经达到了可接受的范围,但是当室内地图数据库很大时需要大量的计算。Liu等人[5]使用卷积神经网络(CNN, convolutional neural network)在室内定位中提取场景图像和地磁场的混合特征。Bhattarai等人[6]则先将室内地图分为几个区域作为地标,然后使用基于LSTM(Long Short-Term Memory)的深度RNNs (Recurrent Neural Networks)对位置进行分类。但是,为了达到较高的分类精度,需要将区域划分得非常大,这使得算法的定位精度有限。
本文设计了一种新的地图构建方法来搭建地磁室内定位的地磁数据库。这种使用地磁序列搭建的地磁数据库更适合用于神经网络,并能改善地磁信号分辨率低的问题。此外,本文使用时域卷积网络(TCN, temporal convolutional network)估计位置,并对比了TCN和一些机器学习算法的性能差异。实验结果表明TCN在提取地磁序列特征方面可以达到更好的效果。
使用磁力计或智能手机可以在任何地方测量地磁场。地磁信号通常由四维向量〈Mx,My,Mz,M〉表示,其中Mx、My和Mz分别代表地磁传感器在三个直角坐标系下的测量值,M是地磁场强度,为Mx、My和Mz的二阶范数。地磁信号在不同场景中分辨难度不一样,故将连续的地磁信号矢量化为轨迹序列,以提高地磁场的分辨率。地磁轨迹序列(GTS, Geomagnetic trajectory sequence)可以定义为:
(1)
其中,t表示地磁轨迹序列的长度。GTS是行人通过轨道时记录的一组地磁信号,其特征比单个地磁信号更丰富。
根据GTS的定义,可以重建地磁轨迹序列的波形。地磁作为定位信号具有以下优点,一是由于建筑材料产生的局部干扰,波形在特定位置会呈现出明显的变化,二是磁场在室内环境中能保存稳定性,三是在室内环境中一些随身携带物品对地磁的影响有限。例如,在一天的不同时间以及在相距三天的三个不同的日期沿一条笔直的走廊匀速地收集地磁轨迹序列,结果如图1所示。可以发现这些地磁轨迹序列尽管是在不同时间收集的,但从统计学的角度看非常相似,一些细微的区别也主要是地磁场的不稳定性造成的。这种统计上的相似性可以使用机器学习进行识别。
图1 在不同时间和不同天数测量的地磁轨迹信号
Fig.1 Geomagnetic trajectory signals measured at different time and different days
本文所提出的地磁定位系统的总体框架如图2所示。该系统由数据建模和定位两部分组成,数据建模部分首先对地磁传感器采集到的地磁轨迹信号进行预处理,保证数据的均匀性,然后将室内地图划分为均匀网格进而搭建地磁数据库;定位部分使用为序列信号而设计的TCN提取地磁轨迹信号的深层特征,通过使用数据集对网络进行训练从而使其具备完成室内定位任务的能力。
图2 地磁室内定位系统
Fig.2 Geomagnetic indoor positioning system
数据建模包括两个部分:数据预处理和地磁数据库搭建。在数据预处理过程中,地磁轨迹信号需要均匀且线性地收集。此外在同一路径的不同时间,重复收集地磁轨迹信号。为了使地磁数据库的数据与神经网络具有相同的长度,使用线性插值算法对地磁信号进行处理。
地磁数据库的搭建首先需要将室内地图划分为网格,地图构建方法如图3所示。在主方向上重叠相邻的网格,重叠的相邻网格有助于解决行人起点不确定性的影响。步长代表相邻网格中心点之间的距离,本文将步长设置为0.6 m,因为0.6 m之间的地磁场变化不明显。网格长度表示数据库中地磁轨迹信号的长度,实验表明在不同网格长度下搭建的地磁数据库对地磁定位精度有很大影响。划分室内地图后,以用户在不同时间的步行方向将沿着网格中线收集的地磁轨迹信号划分为网格。每个网格的中心都分配了一个相应位置坐标作为标签。
图3 室内地图构建
Fig.3 Indoor map-building
由于TCN具有灵活的接收域,因此本文在定位中使用TCN提取地磁数据库的深层特征。TCN是为序列信号而设计的卷积架构,它利用循环结构来使输出长度与输入长度相同。与RNN不同,RNN的后续时间步长的预测必须等待其前一个预测完成,而TCN可以处理整个序列信号,所以TCN在训练速度上比RNN更快。首先将因果膨胀卷积(causal dilated convolutions)的公式定义为[7]:
(2)
其中,i和t分别表示磁轨迹序列和地磁轨迹序列的长度, f表示卷积核,k为卷积核的大小,d为膨胀因子。
图4(a)中展示了具有两层因果膨胀卷积的残差块。为了归一化和非线性化,在因果膨胀卷积后添加了权重归一化[8]和线性整流函数(RELU, rectified linear unit)[9]。然后在每个RELU之后添加了空间层面的Dropout[10]进行正则化,并使用1×1卷积来确保输入和输出具有相同的宽度。
图4 (a)残差块[11]. (b)用于地磁定位的7层TCN. 因果膨胀卷积,膨胀因子d=1,2,4,…,64. 卷积核大小k=8
Fig.4 (a) The residual block[11]. (b) A seven-layer TCN for geomagnetic positioning. The causal dilated convolution with dilation factors d=1,2,4,…,64. And kernel size k=8
系统中使用的TCN的体系结构如图4(b)所示,特殊的超参数如表1所示。可以观察到,膨胀因子d与TCN的深度有关,膨胀因子d随着网络的级数增加呈指数增长(在第i级TCN中d=2i-1)。考虑到如果膨胀因子超过地磁序列的长度,则膨胀卷积等于1×1卷积,因此实验中将TCN的最高级设置为7。TCN输出的最后一级中的最后一层经过全连接层后得到估计的位置。训练过程中使用的损失函数θ为均方误差(Mean Square Error, MSE):
(3)
表1 TCN的超参数
Tab.1 Summary of hyperplasia of TCN
参数参数值损失函数MSE优化器Adam学习率0.001层数7卷积核大小8通道数100训练批次量128迭代次数1000Dropout率0.1
其中,y是一个二维向量,关联每个网格的位置标签,表示估计标签。
在本节中,首先介绍实验环境和地磁数据库的一些配置,然后展示实验结果和对地磁室内定位系统的分析。
图5 室内实验环境
Fig.5 Experimental indoor environments
本文的实验在杭州电子科技大学的教学楼中完成。图5展示了两个走廊的测试区域,大小分别为5.4 m×36 m,2.4 m×60 m。在收集地磁轨迹的过程中,使用MI 6来感应地磁场,并将收集地磁信号的频率设置为50 Hz。在实验中,将本文提出的算法与KNN[12]、基于LSTM的DRNN[13]、基于BILSTM的DRNN[14]和基于GRU的DRNN[15]进行了比较。表2为深度DRNNs中学习率、层数等超参数[16]。
表2 DRNNS的超参数
Tab.2 Summary of hyperplasia of DRNNS
参数参数值损失函数MSE优化器Adam学习率0.001层数3隐藏单元256训练批次量128迭代次数1000
网格长度越长,地磁轨迹将所带来的信息会越多。但是网格长度也存在限制,较长的网格长度意味着用户需要走更长的轨迹,从而给用户带来一定程度的不便。实验中,使用不同的网格长度来构建地磁数据库,长度分别为7.2 m、7.8 m、8.4 m、9.0 m、9.6 m和10.2 m。在不同网格长度的情况下,测试了深度RNNs和TCN的定位精度。地磁数据库的大小与网格长度有关,当网格长度为7.2 m时数据量最大,两个走廊的地磁数据库的大小分别为3626和10146;当网格长度为10.2 m时数据量最小,两个走廊的地磁数据库大小分别为3256和9576。
表3和表4展示了DRNNS和TCN中不同网格长度的平均定位精度。可以观察到,在所有网格长度和两个室内环境中,用TCN比KNN和深度RNNs可以得到更好的定位结果。另外当网格长度较短时,TCN可以实现更高的定位精度。与其他方法相比,当网格长度为7.2 m时,两个走廊中TCN的定位精度分别最少提高了0.5 m和1 m;当网格长度为10.2 m时,TCN在两个走廊中的定位精度最少提高了0.3 m。
实验结果表明,在地磁室内定位中使用神经网络是可行的。且TCN在地磁室内定位中的性能优于深度RNNs,并且可以通过使用较少的特征实现更好的定位精度。
表3 室内环境中不同算法的平均定位精度(5.4 m×36 m)
Tab.3 Average positioning accuracy of different algorithms in indoor environment 5.4 m×36 m
网格长度/m算法KNN[12]LSTM[13]BILSTM[14]GRU[15]Prop7.22.7212.1532.1601.8231.3277.82.3111.6791.4331.1341.2268.41.9071.6061.3311.3861.0879.01.6591.3721.2111.0990.9569.61.3911.0601.0621.0910.84210.21.2231.0211.0420.9760.735
表4 室内环境中不同算法的平均定位精度(2.4 m×60 m)
Tab.4 Average positioning accuracy of different algorithms in indoor environment 2.4 m×60 m
网格长度/m算法KNN[12]LSTM[13]BILSTM[14]GRU[15]Prop7.22.4422.3221.7472.0700.7327.82.2241.7441.1931.6000.7028.42.0101.7070.9701.3490.6719.01.8891.4680.9501.3050.5139.61.8201.2980.7561.1340.43210.21.7341.1500.7120.7750.420
本文设计了一种新的地图构建方法来搭建用于室内定位的地磁数据库,并使用时域卷积网络(TCN)提取地磁轨迹序列的深层特征。实验结果表明,TCN在室内地磁定位中是有效的,同时在实验中表明了不同网格长度对定位精度存在一定影响。通常TCN具有灵活的接受域,并且可以通过使用膨胀卷积接受更长的历史信息,在某些序列建模任务中取得了较好的结果,这是本文在地磁定位中使用深度卷积体系结构的出发点。实验结果也表明,TCN的性能明显优于深度循环网络,并具有良好的定位精度、较少的地磁轨迹特征等优点。
[1] WOODMAN O, HARLE R. Pedestrian localisation for indoor environments[C]∥Proceedings of the 10th International Conference on Ubiquitous Computing-UbiComp′08. Seoul, Korea. New York: ACM Press, 2008: 114-123.
[2] SHU Yuanchao, BO Cheng, SHEN Guobin, et al. Magicol: indoor localization using pervasive magnetic field and opportunistic WiFi sensing[J]. IEEE Journal on Selected Areas in Communications, 2015, 33(7): 1443-1457.
[3] ZHANG Chi, SUBBU K P, LUO Jun, et al. GROPING: geomagnetism and cROwdsensing powered indoor NaviGation[J]. IEEE Transactions on Mobile Computing, 2015, 14(2): 387- 400.
[4] SHU Yuanchao, SHIN K G, HE Tian, et al. Last-Mile navigation using smartphones[C]∥Proceedings of the 21st Annual International Conference on Mobile Computing and Networking. Paris France. New York, NY, USA: ACM, 2015: 512-524.
[5] LIU Zhenguang, ZHANG Luming, LIU Qi, et al. Fusion of magnetic and visual sensors for indoor localization: Infrastructure-free and more effective[J]. IEEE Transactions on Multimedia, 2017, 19(4): 874- 888.
[6] BHATTARAI B, YADAV R K, GANG H S, et al. Geomagnetic field based indoor landmark classification using deep learning[J]. IEEE Access, 2019, 7: 33943-33956.
[7] YU F, KOLTUN V. Multi-scale context aggregation by dilated convolutions[J]. arXiv preprint arXiv:1511.07122, 2015.
[8] SALIMANS T, KINGMA D P. Weight normalization: A simple reparameterization to accelerate training of deep neural networks[EB/OL]. 2016.
[9] NAIR V, HINTON G E. Rectified linear units improve restricted boltzmann machines[C]∥Icml. 2010.
[10] SRIVASTAVA N, HINTON G, KRIZHEVSKY A, et al. Dropout: A simple way to prevent neural networks from overfitting[J]. Journal of Machine Learning Research, 2014, 15: 1929-1958.
[11] BAI Shaojie, KOLTER J Z, KOLTUN V. An empirical evaluation of generic convolutional and recurrent networks for sequence modeling[J]. arXiv preprint arXiv:1803.01271, 2018.
[12] LIU Dongzhuo, GUO Songtao, YANG Yuanyuan, et al. Geomagnetism-based indoor navigation by offloading strategy in NB-IoT[J]. IEEE Internet of Things Journal, 2019, 6(3): 4074- 4084.
[13] HOCHREITER S, SCHMIDHUBER J. Long short-term memory[J]. Neural Computation, 1997, 9(8): 1735-1780.
[14] HUANG Zhiheng, XU Wei, YU Kai. Bidirectional LSTM-CRF models for sequence tagging[J]. arXiv preprint arXiv:1508.01991, 2015.
[15] CHO K, VAN MERRIENBOER B, BAHDANAU D, et al. On the properties of neural machine translation: Encoder-decoder approaches[C]∥Proceedings of SSST- 8, Eighth Workshop on Syntax, Semantics and Structure in Statistical Translation. Doha, Qatar. Stroudsburg, PA, USA: Association for Computational Linguistics, 2014: 103-111.
[16] GRAVES A, MOHAMED A R, HINTON G. Speech recognition with deep recurrent neural networks[C]∥2013 IEEE International Conference on Acoustics, Speech and Signal Processing. Vancouver, BC, Canada. IEEE, 2013: 6645- 6649.
孙垚棋 男,1993年生,浙江杭州人。杭州电子科技大学硕士研究生,主要研究方向为深度学习、模式识别等。E-mail: syq@hdu.edu.cn
巩鹏博 男,1996年生,浙江金华人。杭州电子科技大学硕士研究生,主要研究方向为模式识别、机器学习等。E-mail: 2244014060@qq.com
徐浙峰 男,1998年生,浙江温州人。杭州电子科技大学硕士研究生,主要研究方向为计算机视觉。E-mail: silence_33_@outlook.com
李文钧 男,1977年生,浙江富阳人。杭州电子科技大学教授,主要研究方向为集成电路设计、物联网技术和人工智能应用等。E-mail: liwenjun@hdu.edu.cn
颜成钢 男,1984年生,浙江杭州人。杭州电子科技大学教授,主要研究方向为智能信息处理。E-mail: cgyan@hdu.edu.cn
郑博仑 男,1991年生,湖北武汉人。杭州电子科技大学讲师,主要研究方向为视频/图像处理、计算机视觉与模式识别、工业机器视觉检测等。E-mail: blzheng@hdu.edu.cn
张继勇 男,1977年生,湖北黄冈人。杭州电子科技大学教授,主要研究方向为人工智能、大数据、云计算和智能人机交互等。E-mail: jzhang@hdu.edu.cn