最佳投影方程

来自testwiki
跳转到导航 跳转到搜索

最佳投影方程(optimal projection equations)[1][2][3]控制理论中,建構局部最佳降階LQG控制器的充分必要条件[4]

LQG控制(線性二次高斯控制)問題是最优控制領域中最基礎的問題之一,這問題包括了存在不確定性的線性系統,受到加性高斯白噪声的影響,沒有完整的狀態資訊(無法量測到所有的狀態變數,也無法透過回授得知),對應二次的成本泛函。不過存在唯一解,而且可以建構線性動態回授的控制律,易於計算以及實現。而LQG控制器也是非線性系統中最佳擾動控制的基礎[5]

LQG控制器的架構會類似要控制的系統,兩者會有相同的維度。因此若系統本身就是高維度,要實現(全階)LQG控制器會很困難。降階LQG問題(固定階LQG問題)事先固定LQG控制器的階數,因此克服了這個困難。不過在全階LQG控制器中適用的分離原理,在降階LQG問題中已無法適用,因此這方面會更困難,而且其解也不唯一。不過可以找到數值分析的演算法[4][6][7][8]來求解對應的最佳投影方程。

問題的數學表示以及其解

連續時間

降階的LQG控制問題幾乎和全階的LQG控制問題相同。令𝐱^r(t)表示降階LQG控制器的狀態,唯一的差異是LQG控制器的狀態維度nr=dim(𝐱^r(t))是事先定義好的值,比受控系統的狀態維度n=dim(𝐱(t))要少。

降階LQG控制器可以表示為下式:

𝐱^˙r(t)=Ar(t)𝐱^r(t)+Br(t)𝐮(t)+Kr(t)(𝐲(t)Cr(t)𝐱^r(t)),𝐱^r(0)=𝐱r(0),
𝐮(t)=Lr(t)𝐱^r(t).

上述公式刻意寫的類似傳統全階LQG控制器的形式,降階的LQG控制問題也可以改寫為下式:

𝐱^˙r(t)=Fr(t)𝐱^r(t)+Kr(t)𝐲(t),𝐱^r(0)=𝐱r(0),
𝐮(t)=Lr(t)𝐱^r(t),

其中

Fr(t)=Ar(t)Br(t)Lr(t)Kr(t)Cr(t).

降階LQG控制器的矩陣Fr(t),Kr(t),Lr(t)𝐱r(0)是由所謂的最佳投影方程(optimal projection equations、OPE)來決定[3]

n維的最佳投影方陣τ(t)OPE的核心。此矩陣的秩在所有狀態下幾乎都等於nr。相關投影為斜投影(oblique projection):τ2(t)=τ(t)。最佳投影方程包括四個矩陣微分方程。前二個是LQG控制器對應的矩陣Riccati微分方程的擴展。在方程式中τ(t)表示Inτ(t),而Inn維的單位矩陣

P˙(t)=A(t)P(t)+P(t)A(t)P(t)C(t)W1(t)C(t)P(t)+V(t)+τ(t)P(t)C(t)W1(t)C(t)P(t)τ'(t),P(0)=E(𝐱(0)𝐱(0)),S˙(t)=A(t)S(t)+S(t)A(t)S(t)B(t)R1(t)B(t)S(t)+Q(t)+τ'(t)S(t)B(t)R1(t)B(t)S(t)τ(t),
S(T)=F.

若LQG的維度沒有減少,也就是n=nr,則τ(t)=In,τ(t)=0,上述二個方程就是二個沒有耦合的矩陣Riccati微分方程,對應全階的LQG控制器。若nr<n,則兩個方程會有斜投影項τ(t).。這也是為何降階的LQG控制器無法分離的原因,斜投影τ(t)是由另外二個矩陣微分方程所決定,其中也和秩的條件(rank conditions)有關。這四個矩陣微分方程組成了最佳投影方程。為了要列出另外二個矩陣微分方程,先定義以下二個矩陣:

Ψ1(t)=(A(t)B(t)R1(t)B(t)S(t))P^(t)+P^(t)(A(t)B(t)R1(t)B(t)S(t))
+P(t)C(t)W1(t)C(t)P(t),
Ψ2(t)=(A(t)P(t)C(t)W1(t)C(t))S^(t)+S^(t)(A(t)P(t)C(t)W1(t)C(t))
+S(t)B(t)R1(t)B(t)S(t).

則最後二個矩陣微分方程如下:

P^˙(t)=1/2(τ(t)Ψ1(t)+Ψ1(t)τ(t)),P^(0)=E(𝐱(0))E(𝐱(0)),rank(P^(t))=nr almost everywhere,
S^˙(t)=1/2(τ(t)Ψ2(t)+Ψ2(t)τ(t)),S^(T)=0,rank(S^(t))=nr almost everywhere,

其中

τ(t)=P^(t)S^(t)(P^(t)S^(t))*.

此處的 * 表示群廣義逆矩陣(group generalized inverse)或Template:Link-en,是唯一的,定義如下

A*=A(A3)+A.

其中 + 是摩尔-彭若斯广义逆.

矩陣P(t),S(t),P^(t),S^(t)都需要是非負對稱矩陣。可以建構最佳投影方程的解,而此解可以決定降階LQG控制器矩陣Fr(t),Kr(t),Lr(t)𝐱r(0)

Fr(t)=H(t)(A(t)P(t)C(t)W1(t)C(t)B(t)R1(t)B(t)S(t))G(t)+H˙(t)G(t),
Kr(t)=H(t)P(t)C(t)W1(t),
Lr(t)=R1(t)B(t)S(t)G(t),
𝐱r(0)=H(0)E(𝐱(0)).

上式中的矩陣G(t),H(t)是符合以下性質的矩陣:

G(t)H(t)=τ(t),G(t)H(t)=Inr幾乎在所有狀態下。

可以由P^(t)S^(t)的投影分解中得到[4]

若降階LQG問題中的所有矩陣都是非時變的,且最終時間(horizon)T趨近無限大,則最佳降階LQG控制器和最佳投影方程也都會是非時變的[1]。此情形下,最佳投影方程左側的微分項會為零。

離散時間

離散時間的情形類似連續時間的例子,要處理的是將n階傳統離散時間全階LQG問題轉換為事先已知固定階數的nr<n階降階LQG控制器。為了要表示離散時間的OPE,先引入以下二個矩陣:

Ψi1=(AiBi(B'iSi+1Bi+Ri)1B'iSi+1Ai))P^i(AiBi(B'iSi+1Bi+Ri)1B'iSi+1Ai))
+AiPiC'i(CiPiC'i+Wi)1CiPiA'i
Ψi+12=(AiAiPiC'i(CiPiC'i+Wi)1Ci)S^i+1(AiAiPiC'i(CiPiC'i+Wi)1Ci)
+A'iSi+1Bi(B'iSi+1Bi+Ri)1B'iSi+1Ai

則離散時間OPE為

Pi+1=Ai(PiPiC'i(CiPiC'i+Wi)1CiPi)A'i+Vi+τi+1Ψi1τ'i+1,P0=E(𝐱0𝐱0).
Si=A'i(Si+1Si+1Bi(B'iSi+1Bi+Ri)1B'iSi+1)Ai+Qi+τ'iΨi+12τi,SN=F.
P^i+1=1/2(τi+1Ψi1+Ψi1τ'i+1),P^0=E(𝐱(0))E(𝐱(0)),rank(P^i)=nr almost everywhere,
S^i=1/2(τ'iΨi+12+Ψi+12τi),S^N=0,rank(S^i)=nr almost everywhere.

斜投影(oblique projection)矩陣為

τi=P^iS^i(P^iS^i)*.

非負對稱矩陣Pi,Si,P^i,S^i是離散時間OPE的解,也決定了降階LQG控制器的矩陣Fir,Kir,Lir and 𝐱0r

Fir=Hi+1(AiPiC'i(CiPiC'i+Wi)1CiBi(B'iSi+1Bi+Ri)1B'iSi+1)G'i,
Kir=Hi+1PiC'i(CiPiC'i+Wi)1,
Lir=(B'iSi+1Bi+Ri)1B'iSi+1G'i,
𝐱0r=H0E(𝐱0).

在上述的方程中,矩陣Gi,Hi是有以下性質的矩陣:

G'iHi=τi,GiH'i=Inr幾乎在所有狀態下。

這些矩陣可以從P^iS^i的投影因式分解中求得[4]

如同在連續時間中的例子一樣,若問題中所有的矩陣都是非時變,且且最終時間(horizon)T趨近無限大,降階LQG控制器就會是非時變的。因此離散時間OPE會收斂到穩態解,決定非時變的降階LOG控制器[2]

離散時間OPE也可以應用在狀態維度,輸入維度或是輸出維度可變的離散時間系統(具有時變維度的離散時間系統)[6]。若在數位控制器中的取樣是不同步的,就可能會出現這類的系統。

參考資料

Template:Reflist