查看“︁最佳投影方程”︁的源代码
←
最佳投影方程
跳转到导航
跳转到搜索
因为以下原因,您没有权限编辑该页面:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
'''最佳投影方程'''(optimal projection equations)<ref name="Bern1">{{cite journal |author1=Hyland D.C |author2=Bernstein D.S. |title=The optimal projection equations for fixed order dynamic compensation |journal=IEEE Transactions on Automatic Control |volume=AC-29 | pages=1034–1037 |year=1984 |doi=10.1109/TAC.1984.1103418 |issue=11|hdl=2027.42/57875 }}</ref><ref name="Bern2">{{cite journal |author1=Bernstein D.S. |author2=Davis L.D. |author3=Hyland D.C. |title=The optimal projection equations for reduced-order discrete-time modeling estimation and control |journal=Journal of Guidance Control and Dynamics |volume=9 |issue=3 |pages=288–293 |year=1986 |doi=10.2514/3.20105 |url=https://deepblue.lib.umich.edu/bitstream/2027.42/57880/1/DTReduced-OrderDiscrete-TimeModelingEstimationandControl.pdf |hdl=2027.42/57880 |bibcode=1986JGCD....9..288B |access-date=2020-02-04 |archive-date=2022-01-09 |archive-url=https://web.archive.org/web/20220109193357/https://deepblue.lib.umich.edu/bitstream/handle/2027.42/57880/DTReduced-OrderDiscrete-TimeModelingEstimationandControl.pdf;jsessionid=6E0D23118ADD364D9F40D1028EE431ED?sequence=1 }}</ref><ref name="Haddad1">{{cite journal |author1=Haddad W.M. |author2=Tadmor G. |title=Reduced-order LQG controllers for linear time-varying plants |url=https://archive.org/details/sim_systems-control-letters_1993-02_20_2/page/87 |journal=Systems & Control Letters| volume=20 |issue=2 |pages=87–97 |year=1993 |doi=10.1016/0167-6911(93)90020-7}}</ref>是[[控制理论]]中,建構局部最佳降階LQG控制器的[[充分必要条件]]<ref name="Wil1"/>。 [[LQG控制]](線性二次高斯控制)問題是[[最优控制]]領域中最基礎的問題之一,這問題包括了存在不確定性的[[線性系統]],受到[[加性高斯白噪声]]的影響,沒有完整的狀態資訊(無法量測到所有的狀態變數,也無法透過回授得知),對應二次的成本泛函。不過存在唯一解,而且可以建構線性動態回授的控制律,易於計算以及實現。而LQG控制器也是[[非線性系統]]中最佳擾動控制的基礎<ref name="Athans">{{cite journal |author=Athans M. |title=The role and use of the stochastic linear-quadratic-Gaussian problem in control system design |journal=IEEE Transactions on Automatic Control |volume=AC-16 |issue=6 |pages=529–552 |year=1971 |doi=10.1109/TAC.1971.1099818}}</ref>。 LQG控制器的架構會類似要控制的系統,兩者會有相同的維度。因此若系統本身就是高維度,要實現(全階)LQG控制器會很困難。降階LQG問題(固定階LQG問題)事先固定LQG控制器的階數,因此克服了這個困難。不過在全階LQG控制器中適用的[[分離原理]],在降階LQG問題中已無法適用,因此這方面會更困難,而且其解也不唯一。不過可以找到數值分析的演算法<ref name="Wil1">{{cite journal |author1=Van Willigenburg L.G. |author2=De Koning W.L. |title=Numerical algorithms and issues concerning the discrete-time optimal projection equations |journal=European Journal of Control |volume=6 |issue=1 |pages=93–100 |year=2000 |doi=10.1016/s0947-3580(00)70917-4}} [http://www.mathworks.com/matlabcentral/fileexchange/loadFile.do?objectId=19948&objectType=file Associated software download from Matlab Central] {{Wayback|url=http://www.mathworks.com/matlabcentral/fileexchange/loadFile.do?objectId=19948&objectType=file |date=20220109193404 }}.</ref><ref name="Wil2">{{cite journal |author1=Van Willigenburg L.G. |author2=De Koning W.L. |title=Optimal reduced-order compensators for time-varying discrete-time systems with deterministic and white parameters |url=https://archive.org/details/sim_automatica_1999-01_35_1/page/129 |journal=Automatica |volume=35 |pages=129–138 |year=1999 |doi=10.1016/S0005-1098(98)00138-1}} [http://www.mathworks.com/matlabcentral/fileexchange/loadFile.do?objectId=20014&objectType=FILE Associated software download from Matlab Central] {{Wayback|url=http://www.mathworks.com/matlabcentral/fileexchange/loadFile.do?objectId=20014&objectType=FILE |date=20191018030403 }}.</ref><ref name="Bern3">{{cite journal |author1=Zigic D. |author2=Watson L.T. |author3=Collins E.G. |author4=Haddad W.M. |author5=Ying S. |title=Homotopy methods for solving the optimal projection equations for the H2 reduced order model problem |journal=International Journal of Control |volume=56 | issue=1 | pages=173–191 |year=1996 |doi=10.1080/00207179208934308}}</ref><ref name="Had1">{{cite journal |author1=Collins Jr. E.G |author2=Haddad W.M. |author3=Ying S. |title=A homotopy algorithm for reduced-order dynamic compensation using the Hyland–Bernstein optimal projection equations |journal=Journal of Guidance Control & Dynamics |volume=19 |pages=407–417 |year=1996 |doi=10.2514/3.21633 |issue=2}}</ref>來求解對應的最佳投影方程。 ==問題的數學表示以及其解== ===連續時間=== 降階的LQG控制問題幾乎和全階的[[LQG控制]]問題相同。令<math> \hat{\mathbf{x}}_r(t) </math>表示降階LQG控制器的狀態,唯一的差異是LQG控制器的狀態維度<math> n_r=dim(\hat{\mathbf{x}}_r(t)) </math>是事先定義好的值,比受控系統的狀態維度<math> n=dim({\mathbf{x}}(t)) </math>要少。 降階LQG控制器可以表示為下式: : <math> \dot{\hat{\mathbf{x}}}_r(t) = A_r(t)\hat{\mathbf{x}}_r(t) + B_r(t){\mathbf{u}}(t)+K_r(t) \left( {\mathbf{y}}(t)-C_r(t)\hat{\mathbf{x}}_r(t) \right),\hat{\mathbf{x}}_r(0)={\mathbf{x}}_r(0),</math> : <math> {\mathbf{u}}(t)= -L_r(t) \hat{\mathbf{x}}_r(t).</math> 上述公式刻意寫的類似傳統全階LQG控制器的形式,降階的LQG控制問題也可以改寫為下式: : <math> \dot{\hat{\mathbf{x}}}_r(t) = F_r(t)\hat{\mathbf{x}}_r(t) + K_r(t) {\mathbf{y}}(t),\hat{\mathbf{x}}_r(0)={\mathbf{x}}_r(0),</math> : <math> {\mathbf{u}}(t)= -L_r(t) \hat{\mathbf{x}}_r(t),</math> 其中 : <math> F_r(t)=A_r(t)-B_r(t)L_r(t)-K_r(t)C_r(t).</math> 降階LQG控制器的矩陣<math>F_r(t), K_r(t), L_r(t) </math>和<math>{\mathbf{x}}_r(0)</math>是由所謂的'''最佳投影方程'''(optimal projection equations、OPE)來決定<ref name="Haddad1"/>。 <math>n</math>維的最佳投影方陣<math>\tau(t)</math>是'''OPE'''的核心。此矩陣的秩在所有狀態下幾乎都等於<math>n_r</math>。相關投影為斜投影(oblique projection):<math>\tau^2(t)=\tau(t)</math>。最佳投影方程包括四個矩陣微分方程。前二個是LQG控制器對應的矩陣Riccati微分方程的擴展。在方程式中<math>\tau_\perp(t)</math>表示<math>I_n-\tau(t)</math>,而<math>I_n</math>為<math> n</math>維的單位矩陣 : <math> \begin{align} \dot{P}(t) = {} & A(t)P(t)+P(t)A'(t)-P(t)C'(t)W^{-1}(t) C(t)P(t)+V(t) \\[6pt] & {} +\tau_\perp (t)P(t)C'(t)W^{-1}(t) C(t)P(t)\tau'_\perp (t), \\[6pt] P(0)= {} & E \left({\mathbf{x}}(0){\mathbf{x}}'(0) \right), \\[6pt] & {} -\dot{S}(t) = A'(t)S(t)+S(t)A(t)-S(t)B(t)R^{-1}(t)B'(t)S(t)+Q(t) \\[6pt] & {} + \tau'_\perp (t)S(t)B(t)R^{-1}(t)B'(t)S(t) \tau_\perp (t), \end{align} </math> : <math> S(T) = F.</math> 若LQG的維度沒有減少,也就是<math>n=n_r</math>,則<math>\tau(t)=I_n, \tau_\perp(t)=0</math>,上述二個方程就是二個沒有耦合的矩陣Riccati微分方程,對應全階的LQG控制器。若<math>n_r<n</math>,則兩個方程會有斜投影項<math>\tau(t).</math>。這也是為何降階的LQG控制器無法分離的原因,斜投影<math>\tau(t)</math>是由另外二個矩陣微分方程所決定,其中也和秩的條件(rank conditions)有關。這四個矩陣微分方程組成了最佳投影方程。為了要列出另外二個矩陣微分方程,先定義以下二個矩陣: : <math> \Psi_1(t)=(A(t)-B(t)R^{-1}(t)B'(t)S(t))\hat{P}(t)+\hat{P}(t) (A(t)-B(t)R^{-1}(t)B'(t)S(t))'</math> :::: <math>{}+P(t)C'(t)W^{-1}(t)C(t)P(t),</math> : <math> \Psi_2(t)=(A(t)-P(t)C'(t)W^{-1}(t) C(t))'\hat{S}(t)+\hat{S}(t)(A(t)-P(t)C'(t)W^{-1}(t)C(t))</math> :::: <math>{}+S(t)B(t)R^{-1}(t)B'(t)S(t).</math> 則最後二個矩陣微分方程如下: : <math> \dot{\hat{P}}(t)=1/2 \left(\tau(t)\Psi_1(t)+\Psi_1(t)\tau'(t) \right),\hat{P}(0)=E({\mathbf{x}}(0))E({\mathbf{x}}(0))', \operatorname{rank}(\hat{P}(t))=n_r</math> almost everywhere, : <math> -\dot{\hat{S}}(t)=1/2 \left(\tau'(t)\Psi_2(t)+\Psi_2(t)\tau(t) \right),\hat{S}(T)=0, \operatorname{rank}(\hat{S}(t))=n_r</math> almost everywhere, 其中 : <math> \tau(t)= \hat{P}(t) \hat{S}(t) \left( \hat{P}(t) \hat{S}(t) \right)^*.</math> 此處的 * 表示群廣義逆矩陣(group generalized inverse)或{{link-en|Drazin逆矩陣|Drazin inverse}},是唯一的,定義如下 : <math> A^*=A(A^3)^+A.</math> 其中 + 是[[摩尔-彭若斯广义逆]]. 矩陣<math>P(t),S(t),\hat{P}(t),\hat{S}(t)</math>都需要是非負對稱矩陣。可以建構最佳投影方程的解,而此解可以決定降階LQG控制器矩陣<math> F_r(t), K_r(t), L_r(t) </math>和<math>{\mathbf{x}}_r(0)</math>: : <math> F_r(t)=H(t)\left( A(t)-P(t)C'(t)W^{-1}(t) C(t)-B(t)R^{-1}(t)B'(t)S(t) \right)G(t)+\dot{H}(t)G'(t), </math> : <math> K_r(t)=H(t)P(t)C'(t)W^{-1}(t),</math> : <math> L_r(t)=R^{-1}(t)B'(t)S(t)G'(t),</math> : <math>{\mathbf{x}}_r(0)=H(0)E({\mathbf{x}}(0)).</math> 上式中的矩陣<math> G(t),H(t)</math>是符合以下性質的矩陣: : <math> G'(t)H(t)=\tau(t),G(t)H'(t)=I_{n_r}</math>幾乎在所有狀態下。 可以由<math> \hat{P}(t)\hat{S}(t)</math>的投影分解中得到<ref name="Wil1"/>: 若降階LQG問題中的所有矩陣都是非時變的,且最終時間(horizon)<math>T</math>趨近無限大,則最佳降階LQG控制器和最佳投影方程也都會是非時變的<ref name="Bern1"/>。此情形下,最佳投影方程左側的微分項會為零。 ===離散時間=== 離散時間的情形類似連續時間的例子,要處理的是將<math>n</math>階傳統離散時間全階LQG問題轉換為事先已知固定階數的<math> n_r<n</math>階降階LQG控制器。為了要表示離散時間的OPE,先引入以下二個矩陣: : <math> \Psi^1_i=\left(A_i-B_i(B'_iS_{i+1}B_i+R_i)^{-1}B'_iS_{i+1}A_i)\right)\hat{P}_i \left(A_i-B_i(B'_iS_{i+1}B_i+R_i)^{-1}B'_iS_{i+1}A_i)\right)'</math> :::: <math> {}+A_iP_iC'_i(C_iP_iC'_i+W_i)^{-1}C_iP_iA'_i</math> : <math> \Psi^2_{i+1}=\left(A_i-A_iP_iC'_i(C_iP_{i}C'_i+W_i)^{-1}C_i\right)'\hat{S}_{i+1} \left(A_i-A_iP_iC'_i(C_iP_{i}C'_i+W_i)^{-1}C_i\right)</math> :::: <math>{}+A'_iS_{i+1}B_i(B'_iS_{i+1}B_i+R_i)^{-1}B'_iS_{i+1}A_i</math> 則離散時間OPE為 : <math> P_{i+1} = A_i \left( P_i - P_i C'_i \left( C_i P_i C'_i+W_i \right)^{-1} C_i P_i \right) A'_i+V_i+\tau_{\perp i+1}\Psi^1_i \tau'_{\perp i+1}, P_0=E \left( {\mathbf{x}}_0{\mathbf{x'}}_0 \right)</math>. : <math> S_i = A'_i \left( S_{i+1} - S_{i+1}B_i \left( B'_iS_{i+1}B_i+R_i \right)^{-1} B'_i S_{i+1} \right) A_i+Q_i+\tau'_{\perp i}\Psi^2_{i+1} \tau_{\perp i}, S_N=F</math>. :<math> \hat{P}_{i+1}=1/2(\tau_{i+1}\Psi_i^1+\Psi_i^1\tau'_{i+1}),\hat{P}_0=E({\mathbf{x}}(0)) E({\mathbf{x}}(0))', \operatorname{rank}(\hat{P}_i)=n_r</math> almost everywhere, :<math> \hat{S}_{i}=1/2(\tau'_i \Psi_{i+1}^2+\Psi_{i+1}^2\tau_i),\hat{S}_N=0, \operatorname{rank}(\hat{S}_i)=n_r</math> almost everywhere. 斜投影(oblique projection)矩陣為 : <math> \tau_i=\hat{P}_i\hat{S}_i \left(\hat{P}_i\hat{S}_i \right)^*.</math> 非負對稱矩陣<math> P_i,S_i,\hat{P}_i,\hat{S}_i</math>是離散時間OPE的解,也決定了降階LQG控制器的矩陣<math> F_i^r, K_i^r, L_i^r </math> and <math>{\mathbf{x}}_0^r</math>: : <math> F_i^r=H_{i+1}\left( A_i-P_i C'_i \left( C_i P_i C'_i+W_i \right)^{-1}C_i-B_i\left( B'_iS_{i+1}B_i+R_i \right)^{-1} B'_i S_{i+1}\right)G'_i,</math> : <math> K_i^r=H_{i+1}P_i C'_i \left( C_i P_i C'_i+W_i \right)^{-1},</math> : <math> L_i^r=\left( B'_iS_{i+1}B_i+R_i \right)^{-1} B'_i S_{i+1}G'_i,</math> : <math>{\mathbf{x}}_0^r=H_0E({\mathbf{x}}_0).</math> 在上述的方程中,矩陣<math> G_i,H_i</math>是有以下性質的矩陣: : <math> G'_iH_i=\tau_i, G_iH'_i=I_{n_r}</math>幾乎在所有狀態下。 這些矩陣可以從<math> \hat{P}_i\hat{S}_i</math>的投影因式分解中求得<ref name="Wil1"/>。 如同在連續時間中的例子一樣,若問題中所有的矩陣都是非時變,且且最終時間(horizon)<math>T</math>趨近無限大,降階LQG控制器就會是非時變的。因此離散時間OPE會收斂到穩態解,決定非時變的降階LOG控制器<ref name="Bern2"/>。 離散時間OPE也可以應用在狀態維度,輸入維度或是輸出維度可變的離散時間系統(具有時變維度的離散時間系統)<ref name="Wil2"/>。若在數位控制器中的取樣是不同步的,就可能會出現這類的系統。 ==參考資料== {{reflist}} [[Category:最佳控制]] [[Category:控制理论]] [[Category:隨機控制]]
该页面使用的模板:
Template:Cite journal
(
查看源代码
)
Template:Link-en
(
查看源代码
)
Template:Reflist
(
查看源代码
)
Template:Wayback
(
查看源代码
)
返回
最佳投影方程
。
导航菜单
个人工具
登录
命名空间
页面
讨论
不转换
查看
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
特殊页面
工具
链入页面
相关更改
页面信息