面向内容的语音信号压缩感知研究

高畅, 李海峰, 马琳

高畅, 李海峰, 马琳. 面向内容的语音信号压缩感知研究[J]. 信号处理, 2012, 28(6): 851-858.
引用本文: 高畅, 李海峰, 马琳. 面向内容的语音信号压缩感知研究[J]. 信号处理, 2012, 28(6): 851-858.
GAO Chang, LI Hai-Feng, MA Lin. Content-based Compressive Sensing for Speech Signal[J]. JOURNAL OF SIGNAL PROCESSING, 2012, 28(6): 851-858.
Citation: GAO Chang, LI Hai-Feng, MA Lin. Content-based Compressive Sensing for Speech Signal[J]. JOURNAL OF SIGNAL PROCESSING, 2012, 28(6): 851-858.

面向内容的语音信号压缩感知研究

基金项目: 语言语音教育部微软重点实验室开放基金资助项目(HIT.KLOF.2011XXX);中央高校基本科研业务费专项资金(HIT.NSRIF.2012047)以及国家自然科学基金项目(61171186)的支持
详细信息
  • 中图分类号: TP391.42

Content-based Compressive Sensing for Speech Signal

  • 摘要: 压缩感知理论依据信号的稀疏性质进行压缩测量,将信号的获取方式从对信号的采样上升为对信息的感知,是信号处理领域的一场革命。本文提出一种基于非确定基字典(Uncertainty Basis Dictionary, UBD)对语音信号进行稀疏表示的方法,将压缩感知理论应用于对语音信号稀疏表示的压缩,并提出了基于求解线性规划问题的方法重构语音信号的算法。通过语音识别、话者识别和情感识别实验,从面向内容分析的角度,研究这种基于压缩感知理论的信息感知方法是否保留了语音信号的主要内容。实验结果表明,语音识别、话者识别和情感识别的准确率,与目前这些领域研究方法得到的结果基本一致,说明基于压缩感知理论的信息感知方法能够很好地获取语音信号的语义、话者和情感方面的信息。
    Abstract: Compressive sensing theory compress measurements using sparsity of signal, changes the method of signal obtaining from signal sampling to information sensing, and is a revolution of signal processing. The speech signal is sparse represented based on Uncertainty Basis Dictionary proposed in this paper, the sparse representation of speech signal is compressed by compressive sensing theory,and proposes an speech signal reconstruction algorithm based on the method of solving linear programming problem. Through the experiments of audio, speaker and emotion recognition, we research that this information sensing method based on compressive sensing theory weather preserves the main content from the angle of content-based analysis. Experiment results show that the precision of audio, speaker and emotion recognition is general the same with methods in these research domain, and proves that it can acquire the audio, speaker and emotion information of speech signal using the information sensing method based on compressive sensing theory.
  • 期刊类型引用(8)

    1. 王豪,廖云朋,彭宽,黄忠朝. 基于语义分割的单导心电图心拍分类研究. 生物医学工程研究. 2024(03): 207-213 . 百度学术
    2. 朱椰毅,姜博文,范骁,林浩立,韦强. 基于毫米波雷达的城市轨道交通乘客统计分析方法研究. 现代城市轨道交通. 2024(08): 116-124 . 百度学术
    3. 刘喜洋,余建宇,陈威,谢煜晨. 基于FPGA的改进单比特接收机门限设计方法研究. 火控雷达技术. 2023(01): 82-86 . 百度学术
    4. 郭田雨,严荣国,方旭晨,徐玉玲,陶争屹. 基于希尔伯特变换和自适应阈值的R波检测算法. 计算机与现代化. 2022(02): 114-119 . 百度学术
    5. 徐原,王少娜. 外界干扰下体外自动除颤仪室颤信号高精度检测方法. 自动化与仪器仪表. 2022(11): 291-295 . 百度学术
    6. 戴世杰,李哲明. 基于融合模糊聚类算法的异常心电多频段弱信号快速捕捉方法. 现代电子技术. 2022(21): 62-66 . 百度学术
    7. 孙浩,吴世鹏. 一种基于恒虚警检测的无线电监测方法. 通信技术. 2021(03): 647-653 . 百度学术
    8. 余顺,张平,王曾. 基于K-means算法的QRS波群检测研究. 安徽职业技术学院学报. 2021(01): 25-28 . 百度学术

    其他类型引用(5)

计量
  • 文章访问数:  741
  • HTML全文浏览量:  3
  • PDF下载量:  1648
  • 被引次数: 13
出版历程
  • 收稿日期:  2011-12-26
  • 修回日期:  2012-05-09
  • 发布日期:  2012-06-24

目录

    /

    返回文章
    返回