搜索关键词:compressed sensing,压缩感知

2109,李俊鑫,基于压缩感知的快速语音编解码方法研究


  • 基本信息:广东工业大学,期刊论文,2021

  • 核心原理:

    • 压缩感知:y = Ax, A(m, n), x(n, 1), y(m, 1)

    • 前提:x是个稀疏向量

    • 要求:m < n,从而达到降维压缩的效果

    • 步骤:

      • x是信号输入向量,根据测量矩阵A的变换,得到测量值y向量
      • 再经过重构算法,即x = A^(-1)y,恢复出x
      • 如果不满足,可以通过小波变换,得到稀疏基,即低频、高频分量,从而具备稀疏性
  • 重要:压缩感知在采样的同时,进行压缩(获得较少的采样数据),可以替代奈斯采样

  • 链接:https://m.fx361.com/news/2021/0913/8867679.html

1207,李尚靖,基于压缩感知的语音数字编码技术研究


  • 基本信息:南京邮电大学,硕士学位论文,2015

  • 核心原理:

    • 编码端

      • 对采样点进行压缩感知,得到观测序列
      • 对观测序列建模,得到每帧序列的幅度、相位和频率三个参数
      • 对信号序列进行压缩编码,并传输到解码端
    • 解码端

      • 用基追踪算法重构语信后,后置低通滤波器提高听觉效果
  • 结论:有效降低码率

引申资料


扩展资料:

  • 福州大学,余轮,基于压缩感知的音频和语音统一编解码算法研究

开放提问:

  • 如何在采样的同时进行压缩?即没有原始文件直接就得到我们的bin?

个人想法:

  • 照这个理论,将mdct再做一次mdct得到更高维的压缩信息,使高维的做损失小些,恢复的时候做些trick,记录残差。这样是否可以更省比特?