查看“︁LQG控制”︁的源代码
←
LQG控制
跳转到导航
跳转到搜索
因为以下原因,您没有权限编辑该页面:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
{{noteTA |G1=IT |1=zh-hans:鲁棒; zh-hant:強健; }} '''LQG控制'''(linear–quadratic–Gaussian control)的全名是'''線性二次高斯控制''',是[[控制理论]]中的基礎[[最优控制]]問題之一。此問題和存在[[加性高斯白噪声]]的[[線性系統]]有關。此問題是要找到最佳的輸出回授律,可以讓二次[[最优化|費用]]函數的期望值最小化。其輸出量測假設受到高斯噪声的影響,其初值也是高斯隨機向量。 在「使用線性控制律」的最佳控制假設下,可以用completion-of-squares論述進行推導<ref name="astrom">{{cite book |author=Karl Johan Astrom |title=Introduction to Stochastic Control Theory |publisher=Academic Press |volume=58 |year=1970 |isbn=0-486-44531-3}}.</ref>。此控制律即為'''LQG控制器''',就是[[卡尔曼滤波]](線性二次狀態估測器,LQE)和[[LQR控制器]]的結合。[[分離原理]]指出狀態估測器和狀態回授可以獨立設計。LQG控制可以應用在[[线性时不变系统理论|线性时不变系统]]及线性[[時變系統]],產生容易計算以及實現的線性動態回授控制器。LQG控制器本身是一個類似其受控系統的動態系統,兩者有相同的維度。 根據分離原理,在一些範圍較寬可能是非線性的控制器中,LQG控制器仍然是最佳的。也就是說「使用非線性控制架構不一定可以改善費用泛函的期望值」。這個版本的分離原理是{{le|隨機控制的分離原理|Separation principle in stochastic control}}(separation principle of stochastic control)提到就算過程及輸出雜訊源可能是非高斯[[鞅 (概率论)|鞅]],只要其系統動態是線性的,其最佳控制仍可以分離為最佳狀態估測器(不再是卡尔曼滤波器)及LQR控制器<ref name="lindquist">{{cite journal |author=Anders Lindquist|title=On Feedback Control of Linear Stochastic Systems |journal=SIAM Journal on Control |volume=11 |pages=323--343 |year=1973}}.</ref><ref name="GL2013">{{cite journal |author=Tryphon T. Georgiou and Anders Lindquist |title=The Separation Principle in Stochastic Control, Redux |journal=IEEE Transactions on Automatic Control |volume=58 |issue=10 |pages=2481--2494 |year=2013 |doi=10.1109/TAC.2013.2259207}}.</ref>。LQR控制器也有用來控制擾動的非線性系統<ref name="Athans">{{cite journal |author=Athans M. |title=The role and use of the stochastic Linear-Quadratic-Gaussian problem in control system design |journal=IEEE Transaction on Automatic Control |volume=AC-16 |issue=6 |pages=529–552 |year=1971 |doi=10.1109/TAC.1971.1099818}}</ref>。 ==問題和解的數學描述== ===連續時間=== 考慮連續時間的線性動態系統 : <math>\dot{\mathbf{x}}(t) = A(t) \mathbf{x}(t) + B(t) \mathbf{u}(t) + \mathbf{v}(t),</math> : <math>\mathbf{y}(t) = C(t) \mathbf{x}(t) + \mathbf{w}(t),</math> 其中<math>{\mathbf{x}}</math>是系統狀態變數的向量,<math>{\mathbf{u}}</math>是控制輸入向量,<math>{\mathbf{y}}</math>是輸出量測值的向量,可用在回授上。系統受到加成性的高斯系統雜訊<math>\mathbf{v}(t)</math>及加成性的高斯量測雜訊<math>\mathbf{w}(t)</math>所影響。給定一系統,其目標是找到一控制輸入<math>{\mathbf{u}}(t)</math>,此控制輸入在每個時間<math>{\mathbf{}}t</math>下,和以往的量測量<math>{\mathbf{y}}(t'), 0 \leq t' < t</math>有線性關係,而且此控制輸入可以讓以下的費用函數有最小值: : <math> J = \mathbb{E}\left[{\mathbf{x}^\mathrm T}(T)F{\mathbf{x}}(T)+ \int_{0}^{T} {\mathbf{x}^\mathrm T}(t)Q(t){\mathbf{x}}(t) + {\mathbf{u}^\mathrm T}(t)R(t){\mathbf{u}}(t)\,dt \right],</math> : <math> F \ge 0,\quad Q(t) \ge 0,\quad R(t) > 0, </math> 其中<math>\mathbb{E}</math>為[[期望值]]。最終時間(horizon)<math>{\mathbf{}}T</math>可能是有限值或是無限值。若最終時間為無限,則費用函數的第一項<math>{\mathbf{x}}^\mathrm T(T)F{\mathbf{x}}(T)</math>可以忽略,和問題無關。而為了要讓費用函數為有限值,會定義費用函數為<math>{\mathbf{}}J/T</math>。 求解上述LQG問題的LQG控制器可以用以下方程表示: : <math> \dot{\hat{\mathbf{x}}}(t) = A(t)\hat{\mathbf{x}}(t) + B(t){\mathbf{u}}(t)+L(t) \left( {\mathbf{y}}(t)-C(t)\hat{\mathbf{x}}(t) \right), \quad \hat{\mathbf{x}}(0) = \mathbb{E} \left[ {\mathbf{x}}(0) \right], </math> : <math> {\mathbf{u}}(t)= -K(t) \hat{\mathbf{x}}(t).</math> 矩陣<math>{\mathbf{}}L(t)</math>稱為卡尔曼增益(Kalman gain),和第一個方程[[卡尔曼滤波]]有關。在時間<math>{\mathbf{}}t</math>,濾波器會根據過去量測及輸入來產生狀態<math>{\mathbf{x}}(t)</math>的估測值<math>\hat{\mathbf{x}}(t)</math>。卡尔曼增益<math>{\mathbf{}}L(t)</math>是根據<math>{\mathbf{}}A(t), C(t)</math>、二個和白色高斯雜訊有關密度矩陣<math>\mathbf{v}(t)</math>、<math>\mathbf{w}(t)</math>及最後的<math>\mathbb{E}\left[{\mathbf{x}}(0){\mathbf{x}}^\mathrm T(0) \right]</math>來計算。這五個矩陣會透過以下的矩陣Riccati微分方程來決定卡尔曼增益: : <math> \dot{P}(t) = A(t)P(t)+P(t)A^\mathrm T(t)-P(t)C^\mathrm T(t){\mathbf{}}W^{-1}(t) C(t)P(t)+V(t),</math> : <math> P(0)= \mathbb{E} \left[{\mathbf{x}}(0){\mathbf{x}}^\mathrm T(0) \right].</math> 假設其解<math>P(t), 0 \leq t \leq T</math>,則卡尔曼增益等於 : <math> {\mathbf{}}L(t) = P(t)C^\mathrm T(t)W^{-1}(t). </math> 矩陣<math>{\mathbf{}}K(t)</math>稱為回授增益(feedback gain)矩陣,是由<math>{\mathbf{}}A(t), B(t), Q(t), R(t)</math>及<math>{\mathbf{}}F</math>矩陣,透過以下的矩陣Riccati微分方程來決定 : <math> -\dot{S}(t) = A^\mathrm T(t)S(t)+S(t)A(t)-S(t)B(t)R^{-1}(t)B^\mathrm T(t)S(t)+Q(t),</math> : <math> {\mathbf{}}S(T) = F.</math> 假設其解<math>{\mathbf{}}S(t), 0 \leq t \leq T</math>,回授增益等於 : <math> {\mathbf{}}K(t) = R^{-1}(t)B^\mathrm T(t)S(t).</math> 觀察上述二個矩陣Riccati微分方程,第一個沿時間從前往後算,而第二個是沿時間從後往前算,這稱為「對偶性」。第一個矩陣Riccati微分方程解了線性平方估測問題(LQE),第二個矩陣Riccati微分方程解了[[LQR控制器]]問題。這二個問題是對偶的,合起來就解了線性平方高斯控制問題(LQG),因此LQG問題分成了LQE問題以及LQR問題,且可以獨立求解,因此LQG問題是「可分離的」。 當<math>{\mathbf{}}A(t), B(t), C(t), Q(t), R(t)</math>和雜訊密度矩陣<math>\mathbf{}V(t)</math>, <math>\mathbf{}W(t)</math>不隨時間變化<math>{\mathbf{}}t</math>,且<math>{\mathbf{}}T</math>趨於無限大時,LQG控制器會變成非時變動態系統。此時上述二個矩陣Riccati微分方程會變成[[代數Riccati方程]]。 ===離散時間=== 離散時間的LQG控制問題和連續時間下的問題相近,因此以下只關注其數學式。 離散時間的線性系統方程為 : <math>{\mathbf{x}}_{i+1} = A_i\mathbf{x}_i + B_i \mathbf{u}_i + \mathbf{v}_i,</math> : <math>\mathbf{y}_{i} = C_{i} \mathbf{x}_i + \mathbf{w}_i.</math> 其中<math>\mathbf{}i</math>是離散時間,<math>\mathbf{v}_{i}, \mathbf{w}_{i}</math>是離散時間高斯白雜訊過程,其共變異數矩陣為<math>\mathbf{}V_{i}, W_{i}</math>。 要最小化的二次費用函數為 : <math> J = \mathbb{E}\left[{\mathbf{x}}^\mathrm T_{N}F{\mathbf{x}}_{N}+ \sum_{i=0}^{N-1}( \mathbf{x}_i^\mathrm T Q_i \mathbf{x}_i + \mathbf{u}_i^\mathrm T R_i \mathbf{u}_i )\right],</math> : <math> F \ge 0, Q_i \ge 0, R_i > 0. \, </math> 離散時間的LQG控制器為 :<math>\hat{\mathbf{x}}_{i+1}=A_i\hat{\mathbf{x}}_i+B_i{\mathbf{u}}_i+L_{i+1} \left({\mathbf{y}}_{i+1}-C_{i+1} \left\{ A_i \hat{\mathbf{x}}_i + B_i u_i \right\} \right), \hat{\mathbf{x}}_0=\mathbb{E}[{\mathbf{x}}_0]</math>, :<math> \mathbf{u}_i=-K_i\hat{\mathbf{x}}_i. \, </math> 卡尔曼增益等於 : <math> {\mathbf{}}L_i = P_iC ^\mathrm T _i(C_iP_iC ^\mathrm T _i + W_i)^{-1}, </math> 其中<math>{\mathbf{}}P_i</math>是由以下依時間往前進的矩陣Riccati差分方程所決定: : <math> P_{i+1} = A_i \left( P_i - P_i C ^\mathrm T _i \left( C_i P_i C ^\mathrm T _i+W_i \right)^{-1} C_i P_i \right) A ^\mathrm T _i+V_i, P_0=\mathbb{E} \left( {\mathbf{x}}_0 - \hat{\mathbf{x}}_0\right)\left({\mathbf{x}}_0- \hat{\mathbf{x}}_0\right)^\mathrm T. </math> 回授增益矩陣為 : <math> {\mathbf{}}K_i = (B^\mathrm T_iS_{i+1}B_i + R_i)^{-1}B^\mathrm T_iS_{i+1}A_i </math> \ 其中<math>{\mathbf{}}S_i</math>是由以下時間從後往前算的矩陣Riccati差分方程所決定: : <math> S_i = A^\mathrm T_i \left( S_{i+1} - S_{i+1}B_i \left( B^\mathrm T_iS_{i+1}B_i+R_i \right)^{-1} B^\mathrm T_i S_{i+1} \right) A_i+Q_i, \quad S_N=F.</math> 若問題中所有的矩陣都是非時變的,且時間長度<math>{\mathbf{}}N</math>趨近無窮大,則離散時間的LQG控制器就是非時變的。此時矩陣Riccati差分方程可以用離散時間的[[代數Riccati方程]]取代。可以決定非時變的離散線性二次估測器,以及非時變的離散[[LQR控制器]]。為了讓費用是有限值,會用<math>{\mathbf{}}J/N</math>來代替<math>{\mathbf{}}J</math>。 ==降階LQG問題== 在傳統LQG設定中,當系統維度很大時,實現LQG控制器會有困難。'''降階LQG問題'''(reduced-order LQG problem)也稱為'''固定階數LQG問題'''(fixed-order LQG problem)先設定了LQG控制的狀態數。因為分離原理已不適用,此問題會更不容易求解,而且其解也不唯一。即使如此,降階LQG問題已有不少的數值演算法<ref name="Wil1">{{cite journal |author1=Van Willigenburg L.G. |author2=De Koning W.L. |title=Numerical algorithms and issues concerning the discrete-time optimal projection equations |journal=European Journal of Control |volume=6 |issue=1 |pages=93–100 |year=2000 |doi=10.1016/s0947-3580(00)70917-4}} [http://www.mathworks.com/matlabcentral/fileexchange/loadFile.do?objectId=19948&objectType=file Associated software download from Matlab Central] {{Wayback|url=http://www.mathworks.com/matlabcentral/fileexchange/loadFile.do?objectId=19948&objectType=file |date=20220109193404 }}.</ref><ref name="Wil2">{{cite journal |author1=Van Willigenburg L.G. |author2=De Koning W.L. |title=Optimal reduced-order compensators for time-varying discrete-time systems with deterministic and white parameters |url=https://archive.org/details/sim_automatica_1999-01_35_1/page/129 |journal=Automatica |volume=35 |pages=129–138 |year=1999 |doi=10.1016/S0005-1098(98)00138-1}} [http://www.mathworks.com/matlabcentral/fileexchange/loadFile.do?objectId=20014&objectType=FILE Associated software download from Matlab Central] {{Wayback|url=http://www.mathworks.com/matlabcentral/fileexchange/loadFile.do?objectId=20014&objectType=FILE |date=20191018030403 }}.</ref><ref name="Bern3">{{cite journal |author1=Zigic D. |author2=Watson L.T. |author3=Collins E.G. |author4=Haddad W.M. |author5=Ying S. |title=Homotopy methods for solving the optimal projection equations for the H2 reduced order model problem |journal=International Journal of Control |volume=56 | issue=1 | pages=173–191 |year=1996 |doi=10.1080/00207179208934308}}</ref><ref name="Had1">{{cite journal |author1=Collins Jr. E.G |author2=Haddad W.M. |author3=Ying S. |title=A homotopy algorithm for reduced-order dynamic compensation using the Hyland-Bernstein optimal projection equations |journal=Journal of Guidance Control & Dynamics |volume=19 |pages=407–417 |year=1996 |doi=10.2514/3.21633 |issue=2}}</ref>可以求解相關的[[最佳投影方程]](optimal projection equations)<ref name="Bern1">{{cite journal |author1=Hyland D.C |author2=Bernstein D.S. |title=The optimal projection equations for fixed order dynamic compensation |journal=IEEE Transaction on Automatic Control |volume=AC-29 | pages=1034–1037 |year=1984 |doi=10.1109/TAC.1984.1103418 |issue=11}}</ref><ref name="Bern2">{{cite journal |author1=Bernstein D.S. |author2=Davis L.D. |author3=Hyland D.C. |title=The optimal projection equations for reduced-order discrete-time modeling estimation and control |journal=Journal of Guidance Control and Dynamics| volume=9 |issue=3 |pages=288–293 |year=1986 |doi=10.2514/3.20105}}</ref>,其中建構了局部最佳化的降階LQG問題的充份及必要條件<ref name="Wil1"/>。 ==LQG控制的強健性== LQG最佳化本身不確保有良好的[[強健控制|強健性]]<ref>{{cite book |first=Michael |last=Green |first2=David J. N. |last2=Limebeer |title=Linear Robust Control |location=Englewood Cliffs |publisher=Prentice Hall |year=1995 |isbn=0-13-102278-4 |page=27 |url=https://books.google.com/books?id=8NdSAAAAMAAJ&pg=PA27 }}</ref>,需要在設計好LQG控制後,另外確認閉迴路系統的強健穩定性。為了提昇系統的強健性,可能會將一些系統參數由確定值改假設是隨機值。相關的控制問題會更加複雜,會得到一個類似的最佳控制器,只有控制器參數不同<ref name="Wil2"/>。 ==相關條目== *[[隨機控制]] *[[Witsenhausen反例]] ==參考資料== {{reflist|30em}} ==延伸閱讀== * {{cite book |first=Robert F. |last=Stengel |title=Optimal Control and Estimation |location=New York |publisher=Dover |year=1994 |isbn=0-486-68200-5 |url=https://books.google.com/books?id=jDjPxqm7Lw0C }} [[Category:最佳控制]] [[Category:控制理论]] [[Category:隨機控制]]
该页面使用的模板:
Template:Cite book
(
查看源代码
)
Template:Cite journal
(
查看源代码
)
Template:Le
(
查看源代码
)
Template:NoteTA
(
查看源代码
)
Template:Reflist
(
查看源代码
)
Template:Wayback
(
查看源代码
)
返回
LQG控制
。
导航菜单
个人工具
登录
命名空间
页面
讨论
不转换
查看
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
特殊页面
工具
链入页面
相关更改
页面信息