多任务群智频谱感知算法

吕鑫鑫 朱 琦

(南京邮电大学江苏省无线通信重点实验室,江苏南京 210003)

摘 要: 频谱感知是认知无线电系统中的关键技术。本文将群智感知的激励机制与协作频谱感知有效结合,提出了一种基于多任务群智感知的协作频谱感知算法。该算法考虑检测概率和感知时间建立了参与感知的次用户效用函数,次用户通过优化感知时间得出次用户的最优效用并确定感知的信道,通过贪婪算法在有限预算限制下来选取参与感知的次用户,在次用户感知完成后发放一定的报酬,以激励次用户参与频谱感知的积极性。仿真结果表明,该算法可以获得优于对比算法的检测性能。该算法可以同时感知多个信道,通过激励提高了次用户的参与度,使得协作频谱检测概率得到有效的提升。

关键词:认知无线电;频谱感知;群智感知;数据质量

1 引言

为了提升无线频谱的利用效率,认知无线电技术被广泛使用于无线通信技术中。其中,认知无线电技术主要包括频谱感知,频谱管理和共享等多种技术[1]。频谱感知是指某频谱已被分配给某个用户,但是该用户在某些时间和位置并没有使用该频谱。为了让一些未授权用户可以使用特定区域该频段频谱以提升频谱利用率,可以安排一些次用户对这一区域的频谱使用情况进行感知[2]。频谱感知技术按感知人数的不同主要可以划分为单用户感知与协作频谱感知。在移动通信中,无线信号存在大尺度衰落与多径效应,所以单用户感知并不是十分准确,所以需要多用户协作感知。

为了使各个相互合作的次用户的数据融合,文献[3]提出了“与”融合、“或”融合、表决融合、最大后验概率融合和贝叶斯融合五种准则,分别给出了这五种准则融合后检测概率与虚警概率的表达式。为了提升协作感知精度,降低开销,文献[4]提出了一种通过可靠次用户提交的数据来提升频谱检测性能的算法,只有次用户检测结果较为精确时,才能向次用户基站提交自己的检测结果,反之,次用户不提交数据。为了获得更优的检测概率,文献[5]统计检测信号的功率谱峰谷差,推导出感知门限和检测概率的表达式。同时,在协作频谱感知的研究中,博弈论的方法也被广泛使用。文献[6]提出了基于联盟博弈的协作频谱感知模型,模型算法用于解决形成最优联盟的大小与联盟核心的动态选择。模型也从次用户汇报时间和能量的角度来控制次用户的合作开销,以提升感知性能。文献[7]引入进化博弈方法,在噪声不确定的情况下,次用户可以选择是否参与感知,通过迭代学习的方法来产生一个进化稳定策略。

大多数协作频谱感知的文献的研究前提是次用户无条件愿意进行频谱感知,忽视了感知次用户的招募和感知积极性。因此,本文将群智感知激励机制引进了协作频谱感知。

群智感知的激励机制可以分为有报酬激励与无报酬激励两种[8],无报酬激励机制主要由娱乐激励和社会荣誉激励组成,适用范围较窄。有报酬激励机制主要采用的是博弈论方面的方法。文献[9]最早将博弈论中的拍卖机制引入群智感知激励机制的研究中,主要提出了基于反拍卖的动态虚拟积分参与机制。在此基础上,文献[10]使用贪婪算法来解决有预算的群智感知激励机制的覆盖范围和数据质量问题。文献[11]采用斯塔科尔伯格博弈设计激励算法,服务器作为领导者,次用户作为跟随者,其竞争策略是调整感知时间。服务器先公布总的报酬,次用户通过调整感知时间来获得最大效益。为了平衡用户效益和平台效益,文献[12]采用了贝叶斯博弈,提出了一个在次用户满意的情况下,使次用户补偿最小化的参与等级决定和报酬分配机制。文献[13]提出了基于跨空间多元交互的群智感知动态激励模型CSII,利用跨空间数据分析并通过系统、任务发布者和次用户三者之间的多元交互来激励次用户高质量完成感知任务。为了提升感知数据的时效性,文献[14]提出了时间相关的移动群智感知数据收集机制,在这个机制中每一个感知数据都含有一个时间标签值,随着时间的推移,数据质量会下降。

大多数群智感知激励机制的文献并没有考虑到多人感知多任务的场景,也没有将群智感知的场景具体化到协作频谱感知中去。群智感知激励机制作为一种激励感知次用户的有效机制,恰好可以与协作频谱感知相结合。本文首次将群智感知的激励机制应用于协作频谱感知中,提出了一种感知次用户效用最优的基于多任务群智感知的协作频谱感知算法,先建立参与感知次用户的效用函数,通过计算感知次用户的最优采样点数得出次用户的最优效用,通过贪婪算法在有限预算的来选取进行感知的次用户,在次用户感知完成后发放一定的报酬,以激发用户的感知积极性。

本文内容安排如下:第2部分是系统模型,第3部分介绍了次用户效用最优的多任务算法并对最优效用的计算进行了推导,第4部分是本文算法的性能仿真与分析,最后是本文的结束语。

2 系统模型

如图1所示,系统的场景是一个半径为4 km的圆形区域,圆形区域内有N个待感知信道,将每一个待感知信道称为一个感知任务Tii=1,2,...,N。在仿真场景内均匀分布着若干参与感知的次用户,每个次用户都可以感知所有任务,但在同一时间只能感知一个任务。为了激励次用户进行频谱感知,基站会给被选中的完成任务的次用户一定的报酬。

图1 多任务系统模型

Fig.1 Multi-Task system model

假设主用户系统中共有N个信道,每个次用户可以感知各个信道,但同时只能感知其中一个信道,次用户采用能量检测的方式进行频谱感知,由文献[15]可知,次用户j感知信道i的检测概率pji的表达式为

(1)

式中,pf为次用户j的虚警概率,γji表示次用户j感知任务i的信噪比,tji代表次用户j感知信道i的感知时间。tjifs表示次用户j的采样点数,记为nji,采样频率fs是一个定值。Q函数表达式为

(2)

由Q函数性质可知,当检测概率pji大于0.5时,Q函数中的x小于0。当检测概率小于0.5时,由于数据质量不具有参考价值,该次用户不参与感知,所以

(3)

次用户存在错误概率,错误概率由两部分组成,即主用户不存在时的虚警概率和主用户存在时的漏检概率[2],表达式为

pe=p(u1)(1-pd)+p(u0)pf

(4)

次用户通过控制信道将感知数据上报给基站,次用户基站对次用户的感知结果进行融合,做出最终的频谱感知判定。协作频谱感知的数据融合算法有“或”融合、“与”融合、表决融合等多种融合算法。本文采用基于表决融合准则的算法。这个准则是在M个感知用户中,设置一个表决门限k,当有k个以上的感知用户支持一个假设时,此假设被判定成立[2]。表决融合系统的检测概率pD和虚警概率可以分别表示为:

(5)

(6)

公式中pj表示的是第j个感知次用户的检测概率和虚警概率。而uj表示的是感知次用户j的判决结果,当不存在主用户时判决为0,存在主用户时判决为1。在文献[2]的仿真中可以得知,当判决门限k=M/ 2时,性能最佳。

3 效用最优算法

本文提出了基于激励机制的多任务协作频谱感知算法,流程如图2所示,次用户基站先发布待感知信道的任务,次用户根据建立的次用户效用,优化次用户的采样点数以获得次用户的最优效用,最优效用若大于次用户的阈值,则将选择的任务和检测概率一并提交至基站,基站采用贪婪算法选取参与的次用户,在次用户将感知后的判决结果提交至基站后,基站将由检测概率决定的报酬发放至参与的次用户。

图2 次用户与次用户基站交互流程

Fig.2 Communication process between SUs and the base station

3.1 激励模型构建

首先次用户基站公布需要感知的任务集合{Ti}和Ti的预算bi,i=1,2,...,N。其中Ti表示任务i(即对信道i进行感知),N个信道对应于N个任务。任务i的预算bi是基站由所有任务的总预算B按一定的规则分配而得。

次用户收到基站公布的任务后,将根据效用进行任务选择,次用户j感知任务i的效用定义为

uji=k·pji·bi-tji·ci,i=1,2,...,N, j=1,2,...,M

(7)

式中pji代表次用户j感知任务i的检测概率,ci代表单位时间次用户感知任务i的检测代价,k是一个价格系数,由基站决定。效用的前一部分表示次用户的收益,与检测概率和预算有关,后一部分是感知的代价,与感知时间有关。

3.2 效用优化算法

次用户为了获得最优效用,需要对公式(7)中的某些变量进行优化来增大效用uji,由于公式中的参数只有感知时间可以由次用户决定,所以下面证明存在次用户j感知任务i效用最大的最优感知时间。因为感知时间采样频率fs是一个定值,次用户的采样点数在推导过程中可以代替采样时间,则用户效用为

(8)

次用户效用存在最大值的一个必要条件是uji关于nji的一阶偏导数单调递减且存在负值,所以需要证明uji关于nji的二阶偏导数小于或等于0。需要说明的是,在实际情况下次用户的采样点数为离散整数,这样就无法求导。为了方便数学推导,这里先假设采样点数为连续值,计算完成后再对其取整。首先求一阶偏导数得

(9)

式中

(10)

求二阶偏导数,可以得到

(11)

由于信噪比、价格系数和预算都是正数,所以s>0,又所以由前面分析知m≤0,所以可以得出

(12)

所以一阶偏导数单调递减,下面分析是否存在负值。由于m≤0,所以采样点数nji取最小值时,可以得出而当nji→∞时,可以得出ci>0且是一个非常小的正值,所以当nji→∞时,一阶偏导数为

(13)

所以存在负值。又由(12)可知,单调递减,所以存在一个正数如果一阶偏导数的最大值大于0,那么当nji小于时,大于0,而当nji大于时,小于0,所以uji在点处存在一个最大值。所以只需解方程

(14)

就能得到次用户使效用最大的采样点数。 如果一阶偏导数的最大值小于0,效用uji随采样点数nji单调递减,那么次用户使效用最大的采样点数就是最小采样点数

次用户j计算自己感知各个信道任务的效用,求得所有的效用集合{uji}后,选择一个最大效用,当最大效用大于次用户j的阈值thj(可以承受的最低效用)后,即max{uji}≥thj,向次用户基站提交选择的感知任务和预计的检测概率,即<Tij,pij>j。次用户基站在收到所有次用户提交的选择情况后得出各任务的预次用户集合,对不同任务按检测概率的大小进行排序,选取出检测概率较大的次用户集,其中被选中的次用户的报酬和不能超过预算。然后,次用户基站通知选中的次用户开始进行频谱感知,在次用户将感知结果发送到次用户基站后,次用户基站将报酬发放到次用户。

3.3 算法流程

综上所述,本文提出的基于多任务群智感知的协作频谱感知算法步骤如下:

步骤1 次用户基站公布任务集{Ti}以及对应的bii=1,2,...,N

步骤2 各个次用户分别计算感知不同信道的效用,并选择其中最大的效用,如果这个效用大于该名次用户的阈值,那么向次用户基站提交选择的感知任务和预计的检测概率<Tij,pij>j

步骤3 次用户基站在收到所有信息后,在有限的预算条件下对各任务按检测概率的大小挑选次用户;

步骤4 基站通知被选中的次用户开始频谱感知;

步骤5 次用户将感知后的判决结果发送至基站;

步骤6 基站发放报酬。

4 仿真结果与分析

首先是优化算法在不同次用户数量下的性能比较,并将结果与文献[16]和文献[17]中的算法进行对比与分析,来展示算法的性能。

本文选取文献[16]和文献[17]的两个算法作为对比算法。文献[16]将频谱感知与群智感知相结合,次用户的收益与汇报的结果相关。汇报结果与融合判决结果相同将获得较多收益,否则收益较少。文献[17]是一个群智感知算法,本质上是采用了拍卖机制的贪婪算法。仿真中需要对上面两种算法进行一些调整,以适应本文系统模型。文献[16]中的次用户就近选择感知任务,感知成功的报酬取任务预算的十分之一,失败的报酬为成功的一半。将文献[17]算法中次用户的感知质量具体化为检测概率,次用户效用函数中的距离改为采样点数,增加感知成本,与采样点数相关。两个算法中的次用户的采样点数都取固定值,这个固定值取的是本文算法中次用户采样点数的平均值。

仿真的场景内,共存在6个待感知信道,占用了这6个感知任务的主用户坐标分别为(1333,1000)、(1333,2000)、(1333,3000)、(2666,1000)、(2666,2000)和(2666,3000),所有次用户的采样频率都是10 kHz,感知代价与感知时间有关,为每毫秒0.139,0.141,0.143,0.145,0.147,0.149,价格系数k取0.14,次用户的虚警概率设为0.1。次用户心理阈值th取0.1。

仿真中,信号的传播同时考虑大尺度衰落和小尺度衰落,大尺度衰落采用经验路径损耗模型,衰落系数取3.4,小尺度衰落服从瑞利分布。

图3给出了次用户人数为50时的算法性能。图(a)、图(b)和图(c)分别描述的是融合后的检测概率、次用户平均效用和融合后的错误概率随预算的变化情况,图中的检测概率和错误概率是各任务协作检测概率的均值。可以看出检测概率和平均效用随预算递增,错误概率随预算递减。显然本文算法的性能要优于对比算法,原因是本文算法能够使次用户效用取得最优,从而激励更多次用户参与感知,提升融合后的检测概率,降低错误概率。当预算较低时,文献[17]算法的检测概率不存在且平均效用为0,这是由于当预算较低时,价格高的次用户都被淘汰,价格低的次用户能获得的效用也比较低,低于其心理阈值,所以不选择参与感知,导致任务无人参与感知。

图4给出的是次用户人数为80时的算法性能仿真图。对比图3和图4中的检测概率和错误概率曲线,可以看出次用户人数增加时,曲线走势大致相同,但是次用户较少时的检测概率要低于次用户较多时,错误概率要高于次用户较多时。这是因为当次用户数量少时,次用户分布比较分散,其距离主用户的距离较远,信噪比偏低,不同的任务的检测人数会变少,参与检测的次用户的数据质量也会较低,所以融合后的检测概率会比人数多时低,与此同时错误概率会变高。对比图3(b)和图4(b),可以看出这三种算法的次用户平均效用基本不受次用户人数影响,因为这三种算法的效用函数都和人数无关。

图3 次用户数为50时的频谱检测性能

Fig.3 Spectrum detection performance in the case of 50 SUs

图5讨论了不同心理阈值对算法性能的影响,仿真中次用户数量取50。由图中可以看出,检测概率随着心理阈值的增大而减小,原因是心理阈值低时,参与感知的次用户多,所以检测概率会随之提高。当预算较低时次用户得到的报酬很少,如果此时心理阈值较大,则任务无人参与,如心理阈值为0.15的曲线所示。

图4 次用户数为80时的频谱检测性能

Fig.4 Spectrum detection performance in the case of 80 SUs

图5 心理阈值对检测概率的影响

Fig.5 The effect of mental threshold on detection probability

5 结论

协作频谱感知可以有效地提升频谱感知准确率,然而在多数的协作频谱感知文献中,感知用户的积极性并没有被考虑到。本文首次将群智感知的激励机制与协作频谱感知相结合,提出了一种感知次用户效用最优的多任务激励算法,通过优化次用户的采样点数来提升次用户的个人效用。最后通过数值仿真显示,在感知数据质量得到保证的情况下,次用户的个人效用得到了有效的提升,提升了次用户的感知积极性。

参考文献

[1] Cichoń K, Kliks A, Bogucka H. Energy-Efficient Cooperative Spectrum Sensing: A Survey[J]. IEEE Communications Surveys & Tutorials, 2016, 18(3):1861-1886.

[2] 卞荔. 认知无线电系统中基于数据融合的协作频谱感知算法的研究[D].南京:南京邮电大学, 2010.

Bian Li. The Study of the Cooperative Spectrum Sensing Algorithm in Cognitive Radio based on Data Fusion[D]. Nanjing: Nanjing University of Posts and Telecommunications, 2010. (in Chinese)

[3] 卞荔, 朱琦. 基于数据融合的协作频谱感知算法[J].南京邮电大学学报:自然科学版, 2009, 29(2):73-78.

Bian Li, Qi Zhu. Cooperative Spectrum Sensing Algorithm Based on Data Fusion[J]. Journal of Nanjing University of Posts and Telecommunications: Natural Science Edition, 2009, 29(2):73-78. (in Chinese)

[4] 岳文静, 陈志, 郑宝玉,等. 基于可靠次用户信息的协作频谱感知算法研究[J]. 电子与信息学报, 2012, 34(5):1208-1213.

Yue Wenjing, Chen Zhi, Zheng Baoyu, et al. Cooperative Spectrum Sensing Based on Reliable Secondary User Information[J]. Journal of Electronics & Information Technology, 2012, 34(5):1208-1213.(in Chinese)

[5] 赵知劲, 吕曦, 尚俊娜,等. 利用功率谱最大最小值的频谱感知算法[J]. 信号处理, 2017, 33(2):152-157.

Zhao Zhijin, Lv Xi, Shang Junna, et al. The Spectrum Sensing Algorithm Using the Maximum Value and Minimum Value of the Power Spectral Density[J]. Journal of Signal Processing, 2017, 33(2):152-157.(in Chinese)

[6] Deka S K, Chauhan P, Sarma N. Constraint Based Cooperative Spectrum Sensing for Cognitive Radio Network[C]∥International Conference on Information Technology. IEEE, 2015:63- 68.

[7] 岳文静, 沈冬冬, 陈志. 噪声不确定下基于进化博弈论的协作频谱检测研究[J]. 信号处理, 2017,33(10):1385-1392.

Yue Wenjing, Shen Dongdong, Chen Zhi. Research on Cooperative Spectrum Detection Based on Evolutionary Game Theory under Noise Uncertainty[J]. Journal of Signal Processing, 2017,33(10):1385-1392.(in Chinese)

[8] Jaimes L G, Vergara-Laurens I J, Raij A. A Survey of Incentive Techniques for Mobile Crowd Sensing[J]. IEEE Internet of Things Journal, 2015, 2(5):370-380.

[9] Lee J S, Hoh B. Dynamic pricing incentive for participatory sensing[J]. Pervasive & Mobile Computing, 2010, 6(6):693-708.

[10] Jaimes L G, Vergara-Laurens I, Labrador M A. A location-based incentive mechanism for participatory sensing systems with budget constraints[C]∥IEEE International Conference on Pervasive Computing and Communications. Lugano, Switzerland : IEEE, 2012:103-108.

[11] Yang D, Xue G, Fang X, et al. Crowdsourcing to smartphones: incentive mechanism design for mobile phone sensing[C]∥International Conference on Mobile Computing and Networking. Istanbul, Turkey: ACM, 2012:173-184.

[12] Koutsopoulos I. Optimal incentive-driven design of participatory sensing systems[C]∥INFOCOM, 2013 Proceedings IEEE. Turin, Italy: IEEE, 2013:1402-1410.

[13] 南文倩, 郭斌, 陈荟慧,等. 基于跨空间多元交互的群智感知动态激励模型[J]. 计算机学报, 2015, 38(12):2412-2425.

Nan Wenqian, Guo Bin, Chen Huihui, et al. A Cross-Space, Multi-Interaction-Based Dynamic Incentive Mechanism for Mobile Crowd Sensing[J]. Chinses Journal of Computers, 2015, 38(12):2412-2425.(in Chinese)

[14] Ho C J, Vaughan J W. Online task assignment in crowdsourcing markets[C]∥Twenty-Sixth AAAI Conference on Artificial Intelligence.Toronto,Canada: AAAI Press, 2012:45-51.

[15] Liang Y C, Zeng Y, Peh E C Y, et al. Sensing-Throughput Tradeoff for Cognitive Radio Networks[J]. Wireless Communications IEEE Transactions on, 2008, 7(4):1326-1337.

[16] Chen Bin, Zhang Bi-ling, Yu Jung-Lang, et al. An indirect reciprocity based incentive framework for cooperative spectrum sensing[C]∥IEEE International Conference on Communications. Paris, France: IEEE, 2017:1- 6.

[17] Hu T, Xiao M, Hu C, et al. A QoS-sensitive task assignment algorithm for mobile crowdsensing[J]. Pervasive & Mobile Computing, 2017,41(5):333-342.

A Multi-Task Crowd Cooperative Spectrum Sensing Algorithm

LV Xin-xin ZHU Qi

(Jiangsu Key Lab of Wireless Communications, Nanjing University of Posts and Telecommunications,Nanjing, Jiangsu 210003, China)

Abstract: A core technology of cognitive radio is spectrum sensing. In this paper, we combine the incentive mechanism of crowd-sensing with cooperative spectrum sensing effectively, and put forward an cooperative spectrum sensing algorithm based on multi-task incentive mechanism. This algorithm considers about the detection probability and recognition time. The algorithm establishes utility functions of secondary users (SUs) who take part in the sensing. SUs get the optimal utilities by optimizing the recognition time, and determine which channel to sense by comparing the utilities from different channel. Under the budget constraint, the base station chooses the SUs to take part in the sensing with greedy algorithm. SUs will get some reward after they finish the sensing. The simulation results show that this algorithm can get an outstanding detection performance, which is superior to the algorithms compared. SUs can get large rewards. Hence, this algorithm can get multiple channels sensed, and promotes the cooperative detection probability effectively by stimulating the involvement of SUs.

Key words: cognitive radio; spectrum sensing; crowd-sensing; data quality

收稿日期:2017-10-20;

修回日期:2018-01-17

基金项目:国家自然科学基金(61571234,61631020)

中图分类号:TN929.531

文献标识码:A

DOI:10.16798/j.issn.1003- 0530.2018.04.012

文章编号:1003-0530(2018)04-0486-08

作者简介

吕鑫鑫 男,1993年生,江苏连云港人。南京邮电大学通信与信息工程学院 硕士研究生,主要研究方向为群智感知与认知无线电。

E-mail:76691615@qq.com

朱 琦 女, 1965年生,江苏苏州人。南京邮电大学通信与信息工程学院 教授,主要研究方向为移动通信与无线技术。

E-mail: zhuqi@njupt.edu.cn