【一起读论文系列1】基于压缩感知的语音编解码方向研究
搜索关键词:compressed sensing,压缩感知
2109,李俊鑫,基于压缩感知的快速语音编解码方法研究
-
基本信息:广东工业大学,期刊论文,2021
-
核心原理:
-
-
压缩感知:y = Ax, A(m, n), x(n, 1), y(m, 1)
-
前提:x是个稀疏向量
-
要求:m < n,从而达到降维压缩的效果
-
步骤:
-
- x是信号输入向量,根据测量矩阵A的变换,得到测量值y向量
- 再经过重构算法,即x = A^(-1)y,恢复出x
- 如果不满足,可以通过小波变换,得到稀疏基,即低频、高频分量,从而具备稀疏性
-
-
重要:压缩感知在采样的同时,进行压缩(获得较少的采样数据),可以替代奈斯采样
-
链接:https://m.fx361.com/news/2021/0913/8867679.html
1207,李尚靖,基于压缩感知的语音数字编码技术研究
-
基本信息:南京邮电大学,硕士学位论文,2015
-
核心原理:
-
-
编码端
-
- 对采样点进行压缩感知,得到观测序列
- 对观测序列建模,得到每帧序列的幅度、相位和频率三个参数
- 对信号序列进行压缩编码,并传输到解码端
-
解码端
-
- 用基追踪算法重构语信后,后置低通滤波器提高听觉效果
-
-
结论:有效降低码率
引申资料
扩展资料:
- 福州大学,余轮,基于压缩感知的音频和语音统一编解码算法研究
开放提问:
- 如何在采样的同时进行压缩?即没有原始文件直接就得到我们的bin?
个人想法:
- 照这个理论,将mdct再做一次mdct得到更高维的压缩信息,使高维的做损失小些,恢复的时候做些trick,记录残差。这样是否可以更省比特?