摘要浏览排行

  • 最近一个月内用户统计排行(不含本月)
  • 半年内用户统计排行(不含本月)
  • 一年内用户统计排行(不含本月)
  • 两年内用户统计排行(不含本月)
  • 三年内用户统计排行(不含本月)
1
摘要:

无人机因其固有的低雷达散射截面和复杂的飞行模式,给雷达系统对其检测、跟踪与识别提出了严峻挑战,已经成为低空安全领域研究的热点和难点问题。而当前公开发布的雷达目标探测数据集仍十分稀缺,针对“低慢小”目标的雷达回波信号数据集目标类型、运动状态以及试验场景较为单一,数量更显匮乏。针对上述问题,本文通过精心设计试验场景、外场数据录取与数据加工处理,提供了一套简单野外背景条件下地面雷达对“低慢小”无人机探测的数据集。该数据集涵盖了多旋翼和固定翼两类五型无人机目标,航迹包括由远及近、由近及远、进出雷达波束等,目标运动状态包括加速、减速、悬停、爬升、俯冲、航向调整等,数据包含高信噪比、低信噪比等情况,充分考虑了“低慢小”目标特性分析、检测、跟踪、识别等雷达信号处理方法研究对实测数据的迫切需求,为相关学者提供了一套全面且多元化的数据资源,可有效推动雷达低空慢速弱小目标探测与识别技术的发展。

2
3
摘要:
随着大数据的到来以及计算能力的提高,深度学习(Deep Learning, DL)席卷全球。传统的图像分类方法难以处理庞大的图像数据以及无法满足人们对图像分类精度和速度上的要求,基于卷积神经网络(Convolutional Neural Network, CNN)的图像分类方法冲破了传统图像分类方法的瓶颈,成为目前图像分类的主流算法,如何有效利用卷积神经网络来进行图像分类成为国内外计算机视觉领域研究的热点。本文在对卷积神经网络进行系统的研究并且深入研究卷积神经网络在图像处理中的应用后,给出了基于卷积神经网络的图像分类所采用的主流结构模型、优缺点、时间/空间复杂度、模型训练过程中可能遇到的问题和相应的解决方案,与此同时也对基于深度学习的图像分类拓展模型的生成式对抗网络和胶囊网络进行介绍;然后通过仿真实验验证了在图像分类精度上,基于卷积神经网络的图像分类方法优于传统图像分类方法,同时综合比较了目前较为流行的卷积神经网络模型之间的性能差异并进一步验证了各种模型的优缺点;最后对于过拟合问题、数据集构建方法、生成式对抗网络及胶囊网络性能进行相关实验及分析。
4
摘要:

多天线技术通过在收发端部署天线阵列,从而提供额外的空间自由度(degrees of freedom,DoFs),大幅提升了无线通信的可靠性与有效性。与此同时,多天线技术应用于雷达感知领域,实现了空间角度分辨能力并提升了感知自由度,大幅增强了无线感知性能。然而,无线通信与雷达感知领域在过去数十年里独立发展。因此,尽管多天线技术在这两个领域分别取得了巨大的进步,但并没有通过发挥它们的协同作用来实现深度融合。随着感知与通信的融合被确定为第六代(the sixth-generation,6G)移动通信网络的典型应用场景之一,多天线技术的发展面临新的机遇以填补上述空白。为此,本文围绕未来天线阵列规模持续扩张、阵列架构更加多样、阵列形态更为灵活等发展趋势,对面向6G通信感知一体化的多天线技术进行综述。首先介绍未来多天线的不同架构类型,包括以传统紧凑式阵列和新兴稀疏阵列为代表的集中式阵列架构、以无蜂窝大规模MIMO(multiple-input multiple-output)为代表的分布式天线架构,以及三维连续空间阵元位置与朝向灵活可调的可移动天线/流体天线。然后,本文将介绍基于上述天线架构的远场/近场信道建模,并进行通信与感知性能分析。最后总结不同天线架构的特点,并展望解决因天线阵列规模的持续扩展及阵列形态的灵活多变引起的信道状态信息获取困难的新思路。

5
摘要:
水下空间的主动权竞争越来越激烈,针对复杂的海洋环境和多样的目标类型,现有水面水下单平台单传感器探测能力有限、稳定性差,很难满足未来对水声目标的准确探测和识别需求。随着水下探测手段增加以及多源信息融合技术的迅速发展,研究基于融合理论的水声目标探测与识别技术,可实现对水声目标更准确的状态估计和属性判别,进而提高水下探测预警能力。本文首先对现有水面水下探测传感器和平台进行了简要介绍,在此基础上,讨论了水声目标立体观测系统的网络组成和结构特点,并给出一种跨域异构水声目标立体探测系统设计设想,根据现有融合结构给出了基于多信息源的水声目标融合功能框架;然后根据水声融合探测技术的具体应用,分别论述和分析了基于目标信号级和非目标信号级融合检测方法,基于时空特征、运动特征和海洋物理场的融合定位方法,以及基于经典非线性滤波、数据关联和随机集理论的水声目标跟踪方法;最后重点总结了水下目标的各物理场特征,并针对水声识别中普遍存在的目标信息不确定性问题,归纳了基于Bayes理论、D-S证据理论和深度学习算法的三类典型的融合识别方法及框架。指出了基于信息融合的水声目标探测和识别技术所具有的优势和前景,并分析了水下立体观测网络、融合结构、融合探测和识别算法以及工程应用等方面面临的问题和挑战。
6
摘要:

微表情识别旨在揭示目标对象隐藏的真实情感,其在人机交互、心理诊断以及意图预测等领域具有重要应用价值。然而,微表情表达强度微弱、时间短暂且面部运动单元间存在长距离依赖,使得传统卷积神经网络难以有效表征微表情动态特征。此外,微表情特征与受试者身份以及面部外观信息存在强耦合性,不利于分离和提取微表情语义信息。为了解决上述问题,本文提出了一种基于视觉Transformer和运动特征选择的微表情识别算法。首先,利用TV-L1光流算法计算水平和垂直光流运动图,用以表征面部运动。随后,利用视觉Transformer网络编码微表情发生时面部运动单元间的运动依赖关系,为了进一步提升特征表达能力,本文设计了特征选择融合模块(Feature Selection Fusion Module,FSFM)以实现微表情关键的局部信息的有效获取,并引入空间一致性注意力模块(Spatial Consistency Attention Module,SCAM)以确保不同运动特征在空间分布上的一致性。此外,本文提出的交叉注意力融合模块(Cross Attention Fusion Module,CAFM)能够增强微表情语义信息的表征能力。与现有方法相比,本文所提出的算法在三个权威的微表情数据库上微表情识别任务中表现出显著的准确率提升,进一步验证了该方法的有效性与优越性。

7
摘要:

为实现全时全域“泛在连接”,构建天空地一体化网络已成为国家重大需求,而基于天空地一体化网络下跨域协同系统进行多目标跟踪是其中一个重要的发展方向,其在军民用领域都极具应用价值。本文详细阐述了天空地一体化网络背景下多目标跟踪方法研究进展。首先,介绍了天空地一体化跨域协同多目标跟踪的研究背景与意义。其次,从基于视觉的多目标跟踪、基于模型的多目标跟踪和基于多模态融合的多目标跟踪三个方面概述了当前的代表性研究方法:在基于视觉的多目标跟踪算法方面,介绍了单摄像头和多摄像头融合的多目标跟踪方法;对于基于模型的多目标跟踪,先介绍了单传感器多目标跟踪方法,以及在多种复杂场景下的改进,然后介绍了多传感器融合方法;在基于多模态信息融合的目标跟踪方面,在对多传感器时空配准方法和有代表性的多模态信息融合方法介绍的基础上,概括了基于多模态融合的多目标跟踪算法。最后探讨了当前存在的问题和未来发展方向:无论基于视觉的还是基于模型的多目标跟踪方法都有不少问题有待解决,特别是两种方法的结合值得深入研究;在面临复杂干扰时,基于多传感器信息融合的多目标跟踪由于能实现信息的互补,成为未来的主流发展方向;此外,跨域协同系统,由于能利用更多的资源和信息,其多目标跟踪问题研究极具价值,不过其中通信安全问题和多目标跟踪模型轻量化问题值得探讨。本文对从事目标跟踪及空天地一体化协同控制相关理论与技术研究的科研工作者具有重要参考价值。

8
摘要:

在长期的计算机视觉技术发展过程中,研究者们主要处理的对象是通过图像信号处理器(Image Signal Processor,ISP)处理后的标准RGB图像。这类图像体积小,方便使用和网络传播,因而在许多传统应用场景中得到广泛应用。然而,在低光照或极端成像条件下,这类经过压缩和处理的图像往往因模糊、量化等不可逆操作,导致细节丢失,限制了其性能表现。为应对这些挑战,越来越多的研究开始关注直接处理相机传感器输出的RAW图像。RAW图像未经过复杂的ISP处理,具有线性响应、高比特深度和无损压缩的特点,能够保留更多的原始感光信息。这些特性使其在低光、高动态范围以及复杂视觉场景中表现出优异的灵活性和潜力。在近年来的研究中,RAW图像处理技术取得了显著进展,其应用已从高质量图像与视频的获取、去噪与增强,扩展到目标识别、场景理解等计算机视觉任务。相比传统RGB图像,RAW图像处理能够更好地保留细节信息,并在特定条件下显著提升视觉任务的精度和鲁棒性。此外,随着深度学习技术的发展,基于RAW数据的端到端模型设计成为了新的研究方向,能够充分利用图像中的原始信号信息来提升视觉处理效果。本文系统性地综述了RAW图像处理技术的最新进展,并探讨了这些技术在计算机视觉各领域中的应用。同时,本文还展望了未来的发展趋势,特别是RAW图像数据在更复杂场景下的应用潜力,为相关研究者和从业者提供了有价值的参考和启示。

9
摘要:
语音情感识别是利用计算机建立语音信息载体与情感度量之间的关系,并赋予计算机识别、理解人类情感的能力,语音情感识别在人机交互中起着重要作用,是人工智能领域重要发展方向。本文从语音情感识别在国内外发展历史以及开展的一系列会议、期刊和竞赛入手,分别从6个方面对语音情感识别的研究现状进行了梳理与归纳:首先,针对情感表达从离散、维度模型进行了阐述;其次,针对现有的情感数据库进行了统计与总结;然后,回顾了近20年部分代表性语音情感识别发展历程,并分别阐述了基于人工设计的语音情感特征的情感识别技术和基于端到端的语音情感识别技术;在此基础之上,总结了近几年的语音情感识别性能,尤其是近两年在语音领域的重要会议和期刊上的语音情感识别相关工作;介绍了语音情感识别在驾驶、智能交互领域、医疗健康,安全等领域的应用;最后,总结与阐述了语音情感识别领域仍面临的挑战与未来发展方向。本文旨在对语音情感识别相关工作进行深入分析与总结,为语音情感识别相关研究者提供有价值的参考。
10
摘要:

近年来,随着虚拟现实等沉浸式技术的发展,全景视频技术的应用前景也在逐步扩展。全景视频提供了逼真的沉浸式体验,但同时也给网络带宽带来了极大的传输压力。因此,如何降低其传输带宽成为了研究的焦点,视口预测则是该领域的研究热点。当前,主流的视口预测方案多是利用观看者的视点轨迹和画面内容,结合神经网络输出结果,并进行评估。现有的方法大多不能在长时间预测取得较好的效果,且没有充分利用多用户场景下的数据。为此,本文借鉴了目前流行的Transformer网络中的注意力机制,提出了一种在多用户场景下预测未来较长时间视口的方案。由于不同用户在观看同一视频的视点轨迹具有相似性,本文首先提出了一种多用户视口轨迹相似性比较方案,该方案利用目标用户的视口轨迹数据和历史用户的视口轨迹数据预测目标用户未来视口轨迹数据。其次,由于全景视频视口轨迹存在着不连续性,本文对不连续视口轨迹进行映射处理来解决单次预测轨迹数据不连续的问题,在实验中使用此方法处理数据集的效果较好。最后,本文通过实验对比了两个近年提出的具有相似输出的模型,结果显示本文提出的全景视频预测算法在平均绝对误差、曼哈顿距离以及本文提出的角度距离误差指标下有所减少,部分指标减少超过10%。这说明本文提出的方案能在较长时间视口预测取得更高的精度,引入注意力机制和多用户相似性比较有助于提升模型性能和泛化能力。

11
摘要:
全球卫星导航系统(GNSS)提供精确的定位、导航和授时功能,在军事和国民经济各行各业发挥着关键作用,其安全问题成为目前人们关注的焦点。GNSS信号强度较弱且民用GNSS具有开放结构,因此容易受到干扰或欺骗。GNSS干扰和欺骗轻则影响GNSS定位精度或提供错误的路线,降低服务质量;重则导致GNSS中断,提供虚假时间和位置信息,造成经济损失和军事行动失败等严重后果。虽然GNSS系统安全问题研究成果丰富,但相关研究论文分散在不同领域的刊物上,缺乏从无线电监管的角度论述GNSS干扰和欺骗检测、实验系统和数据集方面的综述性论文。基于此,该文从原理、检测方法、实验系统和开源数据集方面调研了大量代表性文献,按照“原理-检测-实验系统-数据集”较为系统地阐述了GNSS干扰和欺骗检测的研究现状。首先,介绍了GNSS干扰的原理和分类,讨论了基于统计的干扰检测方法、基于时频分析的干扰检测方法和基于机器学习的干扰检测方法;其次,介绍了欺骗的原理和分类,并从是否需要附加硬件和卫星信号从生成到最终实现定位过程两个方面介绍了欺骗检测方法;然后,介绍了国内外研究GNSS干扰和欺骗的实验系统和开源数据集;最后,对研究现状和未来的发展趋势进行总结和展望,旨在促进GNSS干扰和欺骗检测理论和技术的发展及其在无线电监测领域的推广应用。
12
摘要:

缺失多视图聚类是一种处理多源数据的方法,它能够在数据中发现一致和互补的信息,并将数据分成不同的簇。这种方法可以有效解决复杂环境下的无监督多源数据分析问题,因此受到了广泛关注。然而,现有的缺失多视图聚类算法存在一些问题。它们往往忽视了数据中的一些差异,这些差异源于特殊群体的敏感属性。这会导致算法对这些特殊群体产生偏见,从而引发聚类的不公平问题。此外,经过修复之后的缺失样本,缺乏样本的独特性。针对以上问题,本文提出了一种基于公平感知的缺失多视图聚类方法,以缓解无监督聚类任务对特殊群体的不公平对待,同时解决了多视图数据一致性融合和缺失数据恢复问题。首先分别为每一个视图训练一个自动编解码器,利用信息论对经过编码器得到的多视图嵌入特征进行一致性融合,同时训练一个生成网络以恢复缺失视图数据,在使用嵌入特征进行聚类时,约束各簇中特殊群体的分布,使得各簇中特殊群体分布与整个数据集中的分布接近以保证算法的公平性。实验在3个常用多视图数据集上与最新的5种缺失多视图聚类方法进行了比较,在Bank数据集上缺失率为0.5时,相比于性能第2的方法,标准化互信息(Normalized Mutual Information,NMI)值提高了0.82%,公平值(Balance)提高了3.03%;在Credit Card数据集上缺失率为0时,相比于性能第2的方法,NMI值提高了3.53%,Balance值提高了5.62%。同时也在Credit Card数据集中进行了可视化实验以验证聚类算法的性能和公平性,消融实验证明了提出的多视图一致性融合和缺失视图恢复机制的有效性。本文所提出的方法考虑了缺失多视图场景下无监督聚类算法的公平性问题,在保证算法聚类性能的前提下提高了无监督聚类任务的公平性。

13
摘要:

多功能雷达(Multi-Function Radar, MFR)是先进体制雷达辐射源的典型代表,其能够在雷达时间线上对多个目标调度多个同时执行的任务,具有波束指向瞬时调度、工作模式灵活动态、信号调制复杂多变的特点。随着计算智能、认知理论、数字阵列、软件自定义及硬件可重构系统的不断发展,先进多功能雷达系统自由度和性能潜力不断提升,给现代电子侦察与对抗系统带来了巨大挑战。本文首先较为全面地给出了雷达系统行为的分类,依据雷达系统行为活动的内容与目的将雷达行为分为推理行为、决策行为和动作行为三类,并从雷达方和侦察方两个不同视角对上述三类行为进行了归类划分。然后围绕对先进MFR系统行为的感知识别难题,从侦察方视角对多功能雷达行为进行分析识别的侦察分析模型建模表征、雷达系统外显行为识别、内隐行为推理以及对未来行为预测等四方面对相关基础理论、实现技术的研究进行了全面梳理,并对未来研究面临的挑战和重点进行了分析,旨在为针对先进MFR系统行为相关的后续理论研究与技术发展提供有益参考。

14
摘要:

视频字幕生成 (Video Captioning) 旨在用自然语言描述视频中的内容,在人机交互、辅助视障人士、体育视频解说等领域具有广泛的应用前景。然而视频中复杂的时空内容变化增加了视频字幕生成的难度,之前的方法通过提取时空特征、先验信息等方式提高生成字幕的质量,但在时空联合建模方面仍存在不足,可能导致视觉信息提取不充分,影响字幕生成结果。为了解决这个问题,本文提出一种新颖的时空增强的状态空间模型和Transformer(SpatioTemporal-enhanced State space model and Transformer, ST2)模型,通过引入最近流行的具有全局感受野和线性的计算复杂度的Mamba (一种状态空间模型),增强时空联合建模能力。首先,通过将Mamba与Transformer并行结合,提出空间增强的状态空间模型(State Space Model, SSM)和Transformer (Spatial enHanced State space model and Transformer module, SH-ST),克服了卷积的感受野问题并降低计算复杂度,同时增强模型提取空间信息的能力。然后为了增强时间建模,我们利用Mamba的时间扫描特性,并结合Transformer的全局建模能力,提出时间增强的SSM和Transformer (Temporal enHanced State space model and Transformer module, TH-ST)。具体地,我们对SH-ST产生的特征进行重排序,从而使Mamba以交叉扫描的方式增强重排序后特征的时间关系,最后用Transformer进一步增强时间建模能力。实验结果表明,我们ST2模型中SH-ST和TH-ST结构设计的有效性,且在广泛使用的视频字幕生成数据集MSVD和MSR-VTT上取得了具有竞争力的结果。具体的,我们的方法分别在MSVD和MSR-VTT数据集上的绝对CIDEr分数超过最先进的结果6.9%和2.6%,在MSVD上的绝对CIDEr分数超过了基线结果4.9%。

15
摘要:

COVID-19是由新型冠状病毒引起的一种传染性疾病,给全球公共卫生带来了巨大的挑战。在临床实践中,胸部X射线(Chest X-ray, CXR)检查是识别COVID-19感染和其他常见肺部疾病的重要手段,然而放射科医生对COVID-19患者进行检查需要耗费大量时间和精力,而且增加医生感染的风险。因此,能够从胸部X射线的图像中,自动识别COVID-19的算法显得尤为重要。本文提出了一种基于深度学习的CXR图像分类框架,该框架能够在有限的训练数据下生成更具判别力的特征。具体而言,首先通过残差神经网络(ResNet34和ResNet50)和Transformer组成多分支分类网络,其中ResNet分支通过深度残差结构,有效地提取丰富的语义信息和细腻的纹理信息;而Transformer分支则通过自注意力机制,捕捉图像的全局语义特征。随后,利用特征交互模块将ResNet分支提取丰富的语义信息和纹理信息,与Transformer提取的全局语义特征进行特征交互。最后,再通过特征融合模块来提取图像的多尺度语义特征。该方法能够在有限训练数据的条件下提取多尺度特征表示,以对COVID-19感染区域进行特征提取和定位。实验在公开DLAI3和COVIDx数据集上与15种方法进行了比较,相比于ResNet50的模型,准确率分别提高了1.37%和0.76%。本文提出的分类方法,结合ResNet和Transformer网络在特征提取上的优点,使得网络对CXR图像的识别结果更加准确。

16
摘要:

语音驱动的三维虚拟形象情感表情动画,旨在合成与输入语音具有同步嘴唇动作和面部表情的三维人脸动画。然而,现有方法受限于三维人脸先验,在合成具有口腔内部结构的三维人脸动画方面存在一定的局限性,导致最终生成结果缺乏真实感。此外,现有多数方法往往重点关注虚拟形象唇部动作与语音的同步,而较少关注语音情感变化对面部表情的影响,使得生成的表情动画不够自然,真实感受到限制,影响了用户体验。针对以上问题,本文提出了一种情感可控的个性化完整三维虚拟形象表情动画生成方法,以生成具有完整口腔结构和丰富情感表情的人脸动画,提高三维虚拟形象的真实感。该方法由三个核心模块组成:具有完整口腔结构的中性表情动画生成模块、表情检索模块和表情融合模块。具有完整口腔结构的中性表情动画生成模块首先通过基于Transformer的自回归模型实现语音到三维人脸动画序列的跨模态映射,输出中性人脸动画序列,并通过交叉监督的训练图,引入了文本驱动的一致性损失,确保了输入语音与嘴唇区域的同步性。接着,本文在该模块中提出并应用了一种基于人脸关键点的口腔结构三维模型形变算法,依次将生成的口腔模型与对应的中性人脸动画序列进行融合,输出包含口腔结构的中性表情模型序列。表情检索模块根据输入的语音序列和人脸图片进行情感识别和检索,获取带有情感的三维人脸模型。表情融合模块通过深度神经网络将包含口腔结构的中性表情动画与带有情感的三维人脸模型融合,生成具有口腔结构与情感表情的三维人脸表情动画。此外,本文还提出了一种基于线性插值的表情过渡算法实现了表情动画在多种情绪间的平滑过渡。现有实验表明,本文生成的包含口腔结构且具有情感表情的三维人脸动画均能在保持唇部动作与语音同步的同时,有效提高三维虚拟形象的真实感。

17
摘要:

基于深度学习的方法在图像超分辨重建任务中已经取得了显著突破。它们成功的关键在于依赖大量成对的低分辨率和高分辨率图像来训练超分辨模型。然而,众所周知,获取如此大量一一对应的真实高-低分辨率图像对是一个具有挑战性的任务。且基于仿真图像对训练的模型在面对具有与训练集退化类型不同的图像时往往表现不佳。在本文中,我们提出了用于单帧图像超分辨重建的自监督图像扩散模型(Self-supervised Diffusion Model for Single Image Super-resolution,SSDM-SR)来突破数据集的限制,从而避免这些问题。该方法基于扩散模型来学习单帧图像内的信息分布,并为待超分辨重建的图像训练一个小型的特定图像扩散模型。训练数据集仅从待超分辨图像本身中提取,因此SSDM-SR可以适应不同的输入图像。另外,该方法引入了坐标信息以帮助构建出图像的整体框架,从而使模型收敛更快。在多个公开基准数据集和具有未知退化核的数据集上的实验表明,SSDM-SR不仅在图像失真度方面优于近期先进的有监督和无监督图像超分辨重建方法,并且能生成具有更高感知质量的图像。在真实世界低分辨率图像上,它也生成了视觉上令人满意且无明显伪影的结果。

18
摘要:
抑郁症作为一种常见的心理健康问题,严重影响人们的日常生活甚至是生命安全,对抑郁症及抑郁情绪的检测具有重要意义。抑郁检测的常用模态包括脑电、图像、文本和语音等,其中语音信号具有易获取和使用限制少的优势,基于语音的抑郁检测研究也因此成为当前的研究热点。本文对近几年基于语音的抑郁检测的最新进展进行综述。首先介绍了目前研究中所常用的抑郁语音数据集,对其中数据不平衡问题的处理方法进行了概括分析。然后对抑郁检测中常用的韵律特征、音质特征、基于谱的特征等语音特征进行了概述,并对特征的特点展开分析。另一方面,针对抑郁检测研究中所遇到的数据量少的问题,从数据增强、度量学习、元学习和迁移学习四个方面,简述了目前主流的小样本学习方法。考虑到抑郁语音数据的隐私性问题,介绍了基于联邦学习的语音抑郁检测研究,从数据安全性和边缘设备部署两方面做了具体陈述。最后,针对基于语音的抑郁检测研究现状和难点问题进行了总结与展望。
19
摘要:
脑机接口(brain-computer interface,BCI)旨在大脑与外部环境之间建立一种不依赖于外周神经系统的交流与控制通道,从而实现大脑与外部设备的直接交互。脑机接口的初衷是帮助运动障碍患者利用其意图直接控制辅助设备,提高患者生活质量并重拾生活信心。随着脑机接口技术的发展,脑机接口应用已拓展至游戏娱乐、学习教育、智能家居和军事等领域。作为脑科学与类脑智能研究的重要部分,脑机接口已成为多个国家的科技战略重点。随着脑科学、计算科学、人工智能等领域快速发展,脑机接口技术的进步步伐加速,脑机接口已成为全球科技前沿热点。脑机接口技术主要涉及硬件、软件和算法,其中硬件主要包括脑信号采集与处理器件,是保障脑机接口性能的前提;软件的优化将降低脑机接口系统的使用门槛,惠及更多人群;算法则主要是对脑信号进行分析与处理,以又准又快地解读用户意图。脑机接口在硬件、软件和算法三方面的技术进步不仅推进脑机接口从实验室演示走向实际应用,同时也将拓宽脑机接口的应用范围。因此,本文从关键技术、典型应用等方面着手对2022年脑机接口领域的研发热点进行回顾和梳理,以期增进脑机接口研究现状的了解。同时,对当前脑机接口技术发展进行总结与展望,希望能够为脑机接口领域的研究者提供有益的借鉴与启示。
20
摘要:

血压是评估心血管系统健康状况的重要生理指标,定期进行血压监测有助于及早诊断和干预心血管疾病。相对于传统电子血压计测量方法,毫米波雷达具有非接触等优势,在未来具备一定应用前景。本文提出了一种基于神经网络的毫米波雷达血压测量方法,旨在通过无接触的方式实现精确的血压值测量和波形重建。首先,使用扩展的微分交叉相乘算法和平均值滤波对雷达信号进行预处理,以有效提取雷达回波中的相位信息并去除相位常数。接着,利用小波滤波去除信号中的高频噪声和基线漂移,以获得高质量的脉搏波信号。随后,本文通过构建一个具备编码器-解码器结构的两阶段递进式特征融合与映射网络,分别建立脉搏波到血压值和血压波形的映射关系,以实现准确的血压测量和波形重建。所提模型在第一阶段使用MultiResUNet作为主干网络,实现对脉搏波多尺度特征的提取和融合,同时在多分辨率模块之间引入自注意力机制以挖掘特征向量间的长距离依赖关系,从而准确地重建血压波形;在第二阶段,模型利用第一阶段训练的编码器自动提取脉搏波深层特征,然后借助卷积神经网络和长短期记忆网络实现进一步的特征融合与映射,从而估计收缩压和舒张压。最后,使用雷达生命体征数据集对所提方法进行验证,得到收缩压的测量误差为3.49±5.75 mmHg,舒张压为2.40±3.59 mmHg,两者的测量性能均达到英国高压协会标准的A级要求。同时,所提模型对血压波形的重建误差为3.33 mmHg,偏差率为3.74%,亦证明了该方法在血压波形重建上的有效性。

  • 首页
  • 上一页
  • 1
  • 2
  • 3
  • 4
  • 5
  • 末页
  • 共5页
  • 跳转
  • Go
x 关闭 永久关闭