查看“︁线谱对”︁的源代码
←
线谱对
跳转到导航
跳转到搜索
因为以下原因,您没有权限编辑该页面:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
'''线谱对'''(LSP)或'''线谱频率'''(LSF)用于表示在信道上传输的[[线性预测编码|线性预测系数]](LPC)。<ref>{{cite journal|last=Sahidullah|first=Md.|author2=Chakroborty, Sandipan|author3=Saha, Goutam|title=On the use of perceptual Line Spectral pairs Frequencies and higher-order residual moments for Speaker Identification|journal=International Journal of Biometrics|date=2010-01|volume=2|issue=4|pages= 358–378|doi=10.1504/ijbm.2010.035450|url=http://www.inderscienceonline.com/doi/abs/10.1504/IJBM.2010.03545}}</ref>LSP具有一些特性,如对量化噪声的敏感度较小,优于LPC的直接量化。因此,LSP在[[语音编码]]中非常有用。 LSP表示法是[[日本电信电话]]的板倉文忠<ref>{{cite journal |last1=Zheng |first1=F. |last2=Song |first2=Z. |last3=Li |first3=L. |last4=Yu |first4=W. |title=The Distance Measure for Line Spectrum Pairs Applied to Speech Recognition |journal=Proceedings of the 5th International Conference on Spoken Language Processing (ICSLP'98) |date=1998 |issue=3 |pages=1123–6 |url=http://www.work.caltech.edu/~ling/pub/icslp98lsp.pdf |access-date=2023-10-21 |archive-date=2022-10-09 |archive-url=https://ghostarchive.org/archive/20221009/http://www.work.caltech.edu/~ling/pub/icslp98lsp.pdf |dead-url=no }}</ref>于1975年发明的。<ref name="ieee">{{cite web |title=List of IEEE Milestones |url=https://ethw.org/Milestones:List_of_IEEE_Milestones |publisher=[[IEEE]] |access-date=2019-07-15 |archive-date=2015-02-10 |archive-url=https://web.archive.org/web/20150210072247/https://ethw.org/Milestones:List_of_IEEE_Milestones |dead-url=no }}</ref>1975年到1981年,他研究了基于LSP的语音分析与合成问题。<ref name=ItakuraHistory>{{cite web|url=https://ethw.org/Oral-History:Fumitada_Itakura|title=Fumitada Itakura Oral History|publisher=IEEE Global History Network|date=2009-05-20|access-date=2009-07-21|archive-date=2015-04-03|archive-url=https://web.archive.org/web/20150403162021/https://ethw.org/Oral-History:Fumitada_Itakura|dead-url=no}}</ref>1980年,他的团队开发出了基于LSP的[[语音合成]]芯片。LSP是语音合成和编码的一项重要技术,20世纪90年代的几乎所有国际语音编码标准都将其作为重要组成,为提高全球移动信道和互联网上的数字语音通信水平做出了很大贡献。<ref name="ieee"/>1985年,Bishnu S. Atal、Manfred R. Schroeder基于LSP开发了[[CELP]]算法。 == 数学原理 == 线谱[[多项式]]<math>A(z) = 1- \sum_{k=1}^p a_k z^{-k}</math>可写作<math>A(z) = 0.5[P(z) + Q(z)]</math>,其中: * <math>P(z) = A(z) + z^{-(p+1)}A(z^{-1})</math> * <math>Q(z) = A(z) - z^{-(p+1)}A(z^{-1})</math> 根据构造,''P''是'''[[互易多项式#回文多项式|回文多项式]]''',''Q''是'''反回文多项式''';物理上,''P''(''z'')对应[[声门]]关闭时的声道,''Q''(''z'')则对应声门打开时的声道。<ref>http://svr-www.eng.cam.ac.uk/~ajr/SpeechAnalysis/node51.html#SECTION000713000000000000000 {{Wayback|url=http://svr-www.eng.cam.ac.uk/~ajr/SpeechAnalysis/node51.html#SECTION000713000000000000000 |date=20160303205841 }} Tony Robinson: Speech Analysis</ref>可证明: * ''P''、''Q''零点位于复平面中的[[单位圆]]。 * 绕圆运动时,''P''与''Q''的根交替出现。 * 由于''P''、''Q''系数都是实数,因此根以共轭对的形式出现。 LP多项式的线谱对表示简单地包含了P、Q根的位置(即使<math>z = e^{i\omega}, P(z) = 0</math>的<math>\omega</math>)。由于根成对出现,因此只需传输一半的根(一般<math>\in(0,\ \pi)</math>)。因此,''P''与''Q''的系数总数等于原LP系数数''p''(不计<math>a_0=1</math>)。 确定系数的常用算法<ref>e.g. lsf.c in http://www.ietf.org/rfc/rfc3951.txt {{Wayback|url=http://www.ietf.org/rfc/rfc3951.txt |date=20231210004309 }}</ref>是在单位圆上间隔较近的点串上求多项式值,观察结果何时变号;变号时,根必定位于测试点之间。由于''P''与''Q''的根穿插在一起,因此只要一次就能找到两个多项式的根。 == LSP分析 == 要转回LPC,就要计算<math>P(z),\ Q(z)</math>的根。下面只考虑[[线性预测]]多项式<math>A(z)</math>阶数为偶数<math>N</math>的情形,这时LSP多项式的<math>P(z),\ Q(z)</math>为<math>N+1</math>多项式。 LSP多项式的<math>P(z),\ Q(z)</math>可分别被<math>(1+ z^{-1} )</math>、<math>(1- z^{-1} )</math>整除,剩余多项式用<math>(z+ z^{-1} ) / 2</math>除,在单位圆上可表为<math>(z+ z^{-1} ) / 2= \cos \omega</math>。即,<math>P(z),\ Q(z)</math>可进行如下因式分解: :<math> P(z) = \left( 1+ z^{-1} \right) \prod_{i=1,3, ..., N-1} \left( 1-2 \cos \omega_i z^{-1} + z^{-2} \right) </math> :<math> Q(z) = \left( 1- z^{-1} \right) \prod_{i=2,4, ..., N} \left( 1- 2 \cos \omega_i z^{-1} + z^{-2} \right) </math> 求出该式的根,便能计算线谱对<math>\omega_i</math>。更具体地,如下<ref name=sagayama>嵯峨山茂樹. ''[https://web.archive.org/web/20111210021726/http://ocw.u-tokyo.ac.jp/wp-content/uploads/lecture-notes/Engin_01/C4-LSP.PDF 応用音響学: 音声分析(5) LSP分析]''.(pdf) 東京大学 応用音響学 講義資料.</ref></ref> <ref name=Kabal1986>Peter Kabal, Ravi P. Ramachandran. ''[http://www.ece.mcgill.ca/~pkabal/papers/1986/Kabal1986.pdf The Computation of Line Spectral Frequencies Using Chebyshev Polynomials] {{Wayback|url=http://www.ece.mcgill.ca/~pkabal/papers/1986/Kabal1986.pdf |date=20240128043717 }}''.(pdf) IEEE Trans. Acoustics, Speech, Signal Processing, vol.34, no. 6, pp.1419-1426, Dec. 1986.</ref><ref name=Chu2003>Wai C. Chu. ''Speech Coding Algorithms: Foundation and Evolution of Standardized Coders''. pp.239-250, 2003.</ref>: (1) 由线性预测系数<math>a_i</math>计算<math>P(z),\ Q(z)</math>各系数 :由<math>P(z),\ Q(z)</math>的定义,用下式计算。多项式系数<math>p_i , q_i</math>, ::<math>p_0 = p_{N+1} =1 \,</math> ::<math>p_i = p_{N-i+1} = a_i + a_{N-i+1} \,</math> ::<math>q_0 = - q_{N+1} = 1 \,</math> ::<math>q_i = - q_{N-i+1} = a_i - a_{N-i+1} \,</math> (2) <math>P(z),\ Q(z)</math>分别除以<math>(1+ z^{-1} )</math>、<math>(1- z^{-1} )</math> :相当于从单位圆上的根上除去实根。 :此多项式除法可通过系数加减来计算。将商式系数记作<math>p' , q'</math>, ::<math>p'_0 = 1 \,</math> ::<math>p'_i = p_i - p'_{i-1} \,</math> ::<math>q'_0 = 1 \,</math> ::<math>q'_i = q_i + q'_{i-1} \,</math> (3) 商式<math>P'(z),\ Q'(z)</math>用<math>x=(z+ z^{-1} ) / 2</math>置换变量 :相当于剩余[[共轭复数|复共轭根]]在实轴上的投影。置换后的式子可用[[切比雪夫多项式]]表示<ref name=Kabal1986></ref>。 :<math>P'(z),\ Q'(z)</math>是关于<math>x</math>的<math>N/2</math>次多项式,系数可从<math>p',\ q'</math>机械计算。 (4) 用[[牛顿法|牛顿-拉弗森法]]解<math>x</math>的两个方程 :在区间<math(-1,\ 1)</math>内,根<math>x_i</math>交替存在,则可交替求解两个方程。 (5) 由求得的根计算线谱<math>\omega_i</math> :由求得的N个根<math>x_i</math>求下式中的<math>\omega_i</math>: ::<math>\omega_i = \arccos( x_i ) \,</math> 将线谱对变换为线性预测系数时更简单,与上述相反,从线谱对<math>\omega_i</math>求<math>P(z),\ Q(z)</math>各系数即可: :<math>A(z)= \frac{1}{2} \left( P(z)+Q(z)\right)</math> <math>P(z),\ Q(z)</math>各系数为<math>( 1 - 2 \cos \omega_i z^{-1} + z^{-2} )</math>形式的二次多项式的积,进而可作为乘以<math>(1\pm z^{-1} )</math>的式子的系数,可以机械计算。 <math>P(z),\ Q(z)</math>的系数有对称性,因此能从<math>N/2</math>次系数通过以下公式变换为线性预测系数<ref name=Chu2003></ref>: :<math> \begin{array}{lcl} a_i & = & \frac{1}{2} \left( p_i + q_i \right)\\ a_{N-i+1} & = & \frac{1}{2} \left( p_i - q_i \right) \end{array} </math> == 性质 == 线谱对有几个有趣而有用的性质。''P''(''z'')、''Q''(''z'')的根交错排列时,只有根单调递减,滤波器的稳定性才有保证。另外,两个根越近,滤波器在相应频率上的谐振就越大。由于LSP对量化噪声不过分敏感,因此被广泛用于量化LPC滤波器。线谱频率可以内插。 ==另见== * [[对数面积比]] == 资料 == * [http://speex.org/docs/ Speex manual] {{Wayback|url=http://speex.org/docs/ |date=20240114221939 }} and source code (lsp.c) * [http://www.ece.mcgill.ca/~pkabal/papers/1986/Kabal1986.pdf "The Computation of Line Spectral Frequencies Using Chebyshev Polynomials"] {{Wayback|url=http://www.ece.mcgill.ca/~pkabal/papers/1986/Kabal1986.pdf |date=20240128043717 }}/ P. Kabal and R. P. Ramachandran. IEEE Trans. Acoustics, Speech, Signal Processing, vol. 34, no. 6, pp. 1419–1426, Dec. 1986. Includes an overview in relation to LPC. * [http://www.dspcsp.com/pdf/lsp.pdf "Line Spectral Pairs" chapter] {{Wayback|url=http://www.dspcsp.com/pdf/lsp.pdf |date=20240204164441 }} as an online excerpt (pdf) / "Digital Signal Processing - A Computer Science Perspective" ({{ISBN|0-471-29546-9}}) [[Jonathan Stein]]. == 参考文献 == {{Reflist}} {{压缩方法}} [[Category:有损压缩算法]] [[Category:数字信号处理]]
该页面使用的模板:
Template:Cite journal
(
查看源代码
)
Template:Cite web
(
查看源代码
)
Template:ISBN
(
查看源代码
)
Template:Reflist
(
查看源代码
)
Template:Wayback
(
查看源代码
)
Template:压缩方法
(
查看源代码
)
返回
线谱对
。
导航菜单
个人工具
登录
命名空间
页面
讨论
不转换
查看
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
特殊页面
工具
链入页面
相关更改
页面信息