匹配追蹤

来自testwiki
跳转到导航 跳转到搜索

Template:Noreferences 匹配追蹤(matching pursuit, MP)最早是時頻分析的分析工具,目的是要將一已知訊號拆解成由許多被稱作為原子訊號的加權總和,而且企圖找到與原來訊號最接近的解。其中原子訊號為一極大的原子庫中的元素。以數學式子表示可以得到:

f(t)=n=0+angγn(t)

其中,an是權重,gγn是由字典D中獲得的原子訊號。

如同傅立葉級數將一訊號拆解成一系列的正弦波的相加,其中每個成分擁有不同的係數作為權重,其數學式子如下:

f(x)=n=cneinx

而匹配追蹤也具有將訊號拆解成一系列原子相加的意涵,甚至可以使用匹配追蹤去描述傅立葉級數,也就是原子庫對應到的所有正弦函數的集合。

演算法

為了找到最符合原訊號的一組原子加權總合,如果對原子庫進行所有組合的嘗試過於耗費時間。在1993年由Mallat S和Zhang Z的論文[1]中,提出了一個貪婪演算法(Greedy Algorithm),並大幅降低找出近似解的時間。其作法首先在原子庫中尋找與原訊號內積結果最大的原子gγn,找到此訊號以及其內積結果an之後再將原訊號減掉angγn作為下一次重複運算的原始訊號,如此反覆做下去即可得到一系列的an以及原子gγn,直到達到停止條件為止,其詳細的演算法如下:

輸入:Signal: f(t), dictionary D.
輸出:List of coefficients: (an,gγn).
初始化:
R1f(t);
n1;
重複:
寻找 gγnD 具有最大内积 |Rn,gγn|;
anRn,gγn;
Rn+1Rnangγn;
nn+1;
直到達到停止條件(例如:Rn<threshold

時頻原子分解(time-frequency atom decomposition)

在信號處理的許多應用中,需要將信號分解為一群在時域頻域都具有良好局部性(集中在某一範圍)的函數,這些函數稱為時頻原子(time-frequency atom)。

選擇不同的時頻原子時,分解方式的特性會有很大的差異。窗函數傅立葉轉換(window Fourier transform)和小波轉換(wavelet transform)都是時頻信號分解的方法。

通常一個時頻原子群可以由單一的窗函數g(t)L2(R)經過scale、translation和modulation產生,令g(t)O(1t2+1)為一個實數的連續可微函數,且限制g=1g(t)的積分不為零、g(0)0

γ=(s,u,ξ)表示scale參數s(s>0)、translation參數u和modulation參數ξ,定義gγ(t)

gγ(t)=1sg(tus)eiξt

其中γ是集合Γ=R+×R2中的元素,1s使得g=1

事實上,函數群D=(gγ(t))γΓ含有許多冗餘的元素,對於任何函數f(t),更有效率的表示方法是,在原子(gγn(t))nN中,只選取適當數量的子集合,其中γn=(sn,un,ξn),則f(t)可以表示為

f(t)=n=+angγn(t)

在窗函數傅立葉轉換中,所有原子gγn具有相同的scale參數sn=s0,因此主要分布在一個大小為s0倍數的區間內,由於上述特性,窗函數傅立葉轉換無法準確地描述比s0大許多或小許多的函數結構。

小波轉換將信號分解為不同尺度的時頻原子,稱為小波(wavelet),小波群(gγn(t))nN的建構方法是令ξn=ξ0/sn ,其中ξ0是一個常數。小波轉換可以分析不同尺寸的信號成分,然而,受限於參數ξnsn必須成反比的條件,小波轉換的係數無法精準估計傅立葉轉換後具有良好局部性的頻率成分。

希爾伯特空間(Hilbert space)的匹配追蹤

自適應時頻分解(adaptive time-frequency decomposition)的目的是將信號展開到一組波形(waveform)上,這些波形選自一個數量龐大的冗餘字典,而匹配追蹤是能達到自適應分解的一種方法。

一個希爾伯特空間可表示為L2(R),其組成的複數函數f必須滿足

f=+|f(t)|2dt<+

H代表一個希爾伯特空間,則將「字典」定義為H中的一個向量群D=(gγ)γΓ,滿足gγ=1,其中γ是集合Γ=R+×R2中的元素。V代表字典向量的封閉線性生成空間(closed linear span),在空間V中,集合D之向量的有限線性展開(finite linear expansion)是稠密(dense)的,如果V=H,則稱此字典具有完備性(completeness)。對於「時頻原子分解」段落所描述的字典,H=L2(R),在空間L2(R)中,時頻分子的有限線性展開是稠密的,因此該字典具有完備性。

假設有一信號fH,欲將其線性展開到由集合D中選出的一組向量上,使得結果最匹配原來的信號結構。匹配追蹤的方法是連續地將f以其在集合D中元素的正交投影(orthogonal projection)近似。

gγ0D,向量f可以被分解為

f=f,gγ0gγ0+Rf

其中Rf是將fgγ0的方向近似後的剩餘向量(residual vector),由於gγ0Rf正交,可得下式

f2=|f,gγ0|2+Rf2

為了最小化Rf,必須選取gγ0D使得|f,gγ0|最大化。在某些情況下,只能找到近似最佳的向量gγ0,符合

|f,gγ0|α supγΓ|f,gγ|

其中0<α1,在選擇向量gγ0時,並非隨機選擇,而是由一個選擇函數C決定。

重複上述步驟,疊代地將剩餘向量Rf投影到集合D中最匹配Rf的向量,並將Rf分解。

匹配追蹤的步驟可以由數學歸納法來表示

  1. R0f=f
  2. 假設已經計算第n次的剩餘向量Rnfn0
  3. 根據選擇函數C,選取一個最匹配Rnf的元素gγnD
|Rnf,gγn|α supγΓ|Rnf,gγ|

剩餘向量

Rnf

被分解為

Rnf=Rnf,gγngγn+Rn+1f

由於

gγn

Rn+1f

正交,可得下式

Rnf2=|Rnf,gγn|2+Rn+1f2

當分解到第

m

次時,

f

被分解為

f=n=0m1(RnfRn+1f)+Rmf=n=0m1Rnf,gγngγn+Rmf
f2

被分解為

f2=n=0m1(Rnf2Rn+1f2)+Rmf2=n=0m1|Rnf,gγn|2+Rmf2

此公式具有能量守恆的意義,原來的向量

f

被分解為許多字典中元素的總和。

有限空間的匹配追蹤

當信號存在的空間H具有有限的維度N時,匹配追蹤方法會有特殊的特性。在字典D中,可能含有無限多的元素,假設此字典具有完備性,此時可以用一種有效率的匹配追蹤方法,剩餘向量的範數(norm)會以指數方式下降。

當字典含有非常多冗餘的元素時,要尋找和剩餘向量最匹配的向量,通常可以只限制在一個子字典Dα=(gγ)γΓαD中尋找,假設Γα是一個包含於Γ的有限索引集,使得對於所有信號fH,滿足

supγΓα|f,gγ|α supγΓ|f,gγ|

依據Γα的大小和字典D的冗餘程度,集合Γα可以比Γ小許多。

以數學歸納法表示此處的匹配追蹤方法

  1. 計算內積(f,gγ)γΓα
  2. 假設已經計算(Rnf,gγ)γΓαn0
  3. 從子字典Dα中找出一個元素gγn~,使得
|Rnf,gγn~|=supγΓα|Rnf,gγ|

為了從字典中找到一個比

gγn~

更匹配

f

的元素,可以利用牛頓法(Newton’s method),在

Γ

中尋找

γn~

的鄰近索引

γn

,使得內積達到局部最大值,在此情況下,可以得出下式

|Rnf,gγn||Rnf,gγn~|α supγΓ|Rnf,gγ|

在此處,選擇函數

C

與希爾伯特空間中的匹配追蹤不同,必須進行二次搜尋。

在選出一個

gγn~

後,必須計算新的剩餘向量

Rn+1f

和任何

gγDα

的內積,更新公式如下

Rn+1f,gγ=Rnf,gγRnf,gγngγn,gγ

由於先前的計算已經得到

Rnf,gγ

Rnf,gγn

,因此上式的更新只需要計算

gγn,gγ

對於一個給定的信號

f

,要對其剩餘向量分解多少次,決定於要求的精準度

ϵ

,重複的次數為能夠滿足下式的最小值

p
Rpf=fn=0p1Rnf,gγngγnϵf

根據能量守恆,此公式等價於

fn=0p1|Rnf,gγn|2ϵ2f

由於在此方法中,每一次重覆計算時,並沒有計算剩餘向量

Rnf

,因此只根據上式來判斷是否達到停止分解的條件。

重複次數p決定於Rnf的下降速率,依據信號的不同,p可以有很大的變化,但在一般情況下,p會比空間H的維度N小很多。

性質

  • 任何訊號f都會在由原子庫所張的空間中找到收斂的解。
  • 稀疏性:當原子庫很大的時候,MP演算法找出來的最佳吻合解,其中的大部分原子訊號的係數可能都是0,只有少部分的係數不為0,此性質稱為稀疏代表性,而此特性對於影像或視訊編碼和壓縮很有幫助。

應用

匹配追蹤演算法的靈活性和效率在訊號處理領域中越來越重要,尤其在以下幾種領域中更有其重要的應用:

在視訊編碼和影像壓縮上,對於運動的影像估計和補償,在提出新的原子庫或是擴展的演算法之後,有相當的改良。在影像辨識和形狀辨認上,匹配追蹤演算法的稀疏性對於同樣具有稀疏性的圖像提供新的研究方向。另外在音樂、語音方面,最早即在時頻分析上作為MP演算法研究對象。

參見

壓縮感知

參考文獻

[1] S. G. Mallat and Z. Zhang, "Matching pursuits with time-frequency dictionaries," in IEEE Transactions on Signal Processing, vol. 41, no. 12, pp. 3397-3415, Dec 1993.

[2] Jian-Jiun Ding, Time frequency analysis and wavelet transform class note,the Department of Electrical Engineering, National Taiwan University (NTU), Taipei, Taiwan, 2012.

[3] B. Torresani, "Wavelets associated with representations of the affine Weyl-Heisenberg group," 1. Math. Physics, vol. 32, pp. 1273-1279, May 1991.