线谱对

来自testwiki
跳转到导航 跳转到搜索

线谱对(LSP)或线谱频率(LSF)用于表示在信道上传输的线性预测系数(LPC)。[1]LSP具有一些特性,如对量化噪声的敏感度较小,优于LPC的直接量化。因此,LSP在语音编码中非常有用。

LSP表示法是日本电信电话的板倉文忠[2]于1975年发明的。[3]1975年到1981年,他研究了基于LSP的语音分析与合成问题。[4]1980年,他的团队开发出了基于LSP的语音合成芯片。LSP是语音合成和编码的一项重要技术,20世纪90年代的几乎所有国际语音编码标准都将其作为重要组成,为提高全球移动信道和互联网上的数字语音通信水平做出了很大贡献。[3]1985年,Bishnu S. Atal、Manfred R. Schroeder基于LSP开发了CELP算法。

数学原理

线谱多项式A(z)=1k=1pakzk可写作A(z)=0.5[P(z)+Q(z)],其中:

  • P(z)=A(z)+z(p+1)A(z1)
  • Q(z)=A(z)z(p+1)A(z1)

根据构造,P回文多项式Q反回文多项式;物理上,P(z)对应声门关闭时的声道,Q(z)则对应声门打开时的声道。[5]可证明:

  • PQ零点位于复平面中的单位圆
  • 绕圆运动时,PQ的根交替出现。
  • 由于PQ系数都是实数,因此根以共轭对的形式出现。

LP多项式的线谱对表示简单地包含了P、Q根的位置(即使z=eiω,P(z)=0ω)。由于根成对出现,因此只需传输一半的根(一般(0, π))。因此,PQ的系数总数等于原LP系数数p(不计a0=1)。 确定系数的常用算法[6]是在单位圆上间隔较近的点串上求多项式值,观察结果何时变号;变号时,根必定位于测试点之间。由于PQ的根穿插在一起,因此只要一次就能找到两个多项式的根。

LSP分析

要转回LPC,就要计算P(z), Q(z)的根。下面只考虑线性预测多项式A(z)阶数为偶数N的情形,这时LSP多项式的P(z), Q(z)N+1多项式。

LSP多项式的P(z), Q(z)可分别被(1+z1)(1z1)整除,剩余多项式用(z+z1)/2除,在单位圆上可表为(z+z1)/2=cosω。即,P(z), Q(z)可进行如下因式分解:

P(z)=(1+z1)i=1,3,...,N1(12cosωiz1+z2)
Q(z)=(1z1)i=2,4,...,N(12cosωiz1+z2)

求出该式的根,便能计算线谱对ωi。更具体地,如下[7]</ref> [8][9]

(1) 由线性预测系数ai计算P(z), Q(z)各系数

P(z), Q(z)的定义,用下式计算。多项式系数pi,qi
p0=pN+1=1
pi=pNi+1=ai+aNi+1
q0=qN+1=1
qi=qNi+1=aiaNi+1

(2) P(z), Q(z)分别除以(1+z1)(1z1)

相当于从单位圆上的根上除去实根。
此多项式除法可通过系数加减来计算。将商式系数记作p,q
p'0=1
p'i=pip'i1
q'0=1
q'i=qi+q'i1

(3) 商式P(z), Q(z)x=(z+z1)/2置换变量

相当于剩余复共轭根在实轴上的投影。置换后的式子可用切比雪夫多项式表示[8]
P(z), Q(z)是关于xN/2次多项式,系数可从p, q机械计算。

(4) 用牛顿-拉弗森法x的两个方程

在区间<math(-1,\ 1)</math>内,根xi交替存在,则可交替求解两个方程。

(5) 由求得的根计算线谱ωi

由求得的N个根xi求下式中的ωi
ωi=arccos(xi)

将线谱对变换为线性预测系数时更简单,与上述相反,从线谱对ωiP(z), Q(z)各系数即可:

A(z)=12(P(z)+Q(z))

P(z), Q(z)各系数为(12cosωiz1+z2)形式的二次多项式的积,进而可作为乘以(1±z1)的式子的系数,可以机械计算。

P(z), Q(z)的系数有对称性,因此能从N/2次系数通过以下公式变换为线性预测系数[9]

ai=12(pi+qi)aNi+1=12(piqi)

性质

线谱对有几个有趣而有用的性质。P(z)、Q(z)的根交错排列时,只有根单调递减,滤波器的稳定性才有保证。另外,两个根越近,滤波器在相应频率上的谐振就越大。由于LSP对量化噪声不过分敏感,因此被广泛用于量化LPC滤波器。线谱频率可以内插。

另见

资料

Includes an overview in relation to LPC.

参考文献

Template:Reflist

Template:压缩方法

  1. Template:Cite journal
  2. Template:Cite journal
  3. 3.0 3.1 Template:Cite web
  4. Template:Cite web
  5. -{R|http://svr-www.eng.cam.ac.uk/~ajr/SpeechAnalysis/node51.html#SECTION000713000000000000000}- Template:Wayback Tony Robinson: Speech Analysis
  6. e.g. lsf.c in -{R|http://www.ietf.org/rfc/rfc3951.txt}- Template:Wayback
  7. 嵯峨山茂樹. 応用音響学: 音声分析(5) LSP分析.(pdf) 東京大学 応用音響学 講義資料.
  8. 8.0 8.1 Peter Kabal, Ravi P. Ramachandran. The Computation of Line Spectral Frequencies Using Chebyshev Polynomials Template:Wayback.(pdf) IEEE Trans. Acoustics, Speech, Signal Processing, vol.34, no. 6, pp.1419-1426, Dec. 1986.
  9. 9.0 9.1 Wai C. Chu. Speech Coding Algorithms: Foundation and Evolution of Standardized Coders. pp.239-250, 2003.