最佳投影方程(optimal projection equations)[1][2][3]是控制理論中,建構局部最佳降階LQG控制器的充分必要條件[4]。
LQG控制(線性二次高斯控制)問題是最優控制領域中最基礎的問題之一,這問題包括了存在不確定性的線性系統,受到加性高斯白噪聲的影響,沒有完整的狀態資訊(無法量測到所有的狀態變數,也無法透過回授得知),對應二次的成本泛函。不過存在唯一解,而且可以建構線性動態回授的控制律,易於計算以及實現。而LQG控制器也是非線性系統中最佳擾動控制的基礎[5]。
LQG控制器的架構會類似要控制的系統,兩者會有相同的維度。因此若系統本身就是高維度,要實現(全階)LQG控制器會很困難。降階LQG問題(固定階LQG問題)事先固定LQG控制器的階數,因此克服了這個困難。不過在全階LQG控制器中適用的分離原理,在降階LQG問題中已無法適用,因此這方面會更困難,而且其解也不唯一。不過可以找到數值分析的演算法[4][6][7][8]來求解對應的最佳投影方程。
問題的數學表示以及其解[編輯]
連續時間[編輯]
降階的LQG控制問題幾乎和全階的LQG控制問題相同。令
表示降階LQG控制器的狀態,唯一的差異是LQG控制器的狀態維度
是事先定義好的值,比受控系統的狀態維度
要少。
降階LQG控制器可以表示為下式:
![{\displaystyle {\dot {\hat {\mathbf {x} }}}_{r}(t)=A_{r}(t){\hat {\mathbf {x} }}_{r}(t)+B_{r}(t){\mathbf {u} }(t)+K_{r}(t)\left({\mathbf {y} }(t)-C_{r}(t){\hat {\mathbf {x} }}_{r}(t)\right),{\hat {\mathbf {x} }}_{r}(0)={\mathbf {x} }_{r}(0),}](https://wikimedia.org/api/rest_v1/media/math/render/svg/3456bc1211267c302e2ffa517935113e69563e28)
![{\displaystyle {\mathbf {u} }(t)=-L_{r}(t){\hat {\mathbf {x} }}_{r}(t).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/62ff11275458baa810d2846c3aa4d885da1960ce)
上述公式刻意寫的類似傳統全階LQG控制器的形式,降階的LQG控制問題也可以改寫為下式:
![{\displaystyle {\dot {\hat {\mathbf {x} }}}_{r}(t)=F_{r}(t){\hat {\mathbf {x} }}_{r}(t)+K_{r}(t){\mathbf {y} }(t),{\hat {\mathbf {x} }}_{r}(0)={\mathbf {x} }_{r}(0),}](https://wikimedia.org/api/rest_v1/media/math/render/svg/edea50c6e234c5f9e123086aa4cdc9486b00d547)
![{\displaystyle {\mathbf {u} }(t)=-L_{r}(t){\hat {\mathbf {x} }}_{r}(t),}](https://wikimedia.org/api/rest_v1/media/math/render/svg/7f770cb69f5b325302e5dca8c1f9d8285325203d)
其中
![{\displaystyle F_{r}(t)=A_{r}(t)-B_{r}(t)L_{r}(t)-K_{r}(t)C_{r}(t).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/dd020adb24adaf52927b6a4e0e8d7f57e52828b3)
降階LQG控制器的矩陣
和
是由所謂的最佳投影方程(optimal projection equations、OPE)來決定[3]。
維的最佳投影方陣
是OPE的核心。此矩陣的秩在所有狀態下幾乎都等於
。相關投影為斜投影(oblique projection):
。最佳投影方程包括四個矩陣微分方程。前二個是LQG控制器對應的矩陣Riccati微分方程的擴展。在方程式中
表示
,而
為
維的單位矩陣
![{\displaystyle {\begin{aligned}{\dot {P}}(t)={}&A(t)P(t)+P(t)A'(t)-P(t)C'(t)W^{-1}(t)C(t)P(t)+V(t)\\[6pt]&{}+\tau _{\perp }(t)P(t)C'(t)W^{-1}(t)C(t)P(t)\tau '_{\perp }(t),\\[6pt]P(0)={}&E\left({\mathbf {x} }(0){\mathbf {x} }'(0)\right),\\[6pt]&{}-{\dot {S}}(t)=A'(t)S(t)+S(t)A(t)-S(t)B(t)R^{-1}(t)B'(t)S(t)+Q(t)\\[6pt]&{}+\tau '_{\perp }(t)S(t)B(t)R^{-1}(t)B'(t)S(t)\tau _{\perp }(t),\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/78427fd12c675f686999ba90ae076cb79b5b33c9)
![{\displaystyle S(T)=F.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/7e4ae481a23e876122cdae97c484b24e4dc3ad77)
若LQG的維度沒有減少,也就是
,則
,上述二個方程就是二個沒有耦合的矩陣Riccati微分方程,對應全階的LQG控制器。若
,則兩個方程會有斜投影項
。這也是為何降階的LQG控制器無法分離的原因,斜投影
是由另外二個矩陣微分方程所決定,其中也和秩的條件(rank conditions)有關。這四個矩陣微分方程組成了最佳投影方程。為了要列出另外二個矩陣微分方程,先定義以下二個矩陣:
![{\displaystyle {}+P(t)C'(t)W^{-1}(t)C(t)P(t),}](https://wikimedia.org/api/rest_v1/media/math/render/svg/5424257e34626b4c453050935cd0eb155fab4c6d)
![{\displaystyle {}+S(t)B(t)R^{-1}(t)B'(t)S(t).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/28914aa81819257faf0f9a36f1fab3fb6aa0e0f8)
則最後二個矩陣微分方程如下:
almost everywhere,
almost everywhere,
其中
![{\displaystyle \tau (t)={\hat {P}}(t){\hat {S}}(t)\left({\hat {P}}(t){\hat {S}}(t)\right)^{*}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/21df963ed385186f1ccd953d5d758de7bce5f99a)
此處的 * 表示群廣義逆矩陣(group generalized inverse)或Drazin逆矩陣,是唯一的,定義如下
![{\displaystyle A^{*}=A(A^{3})^{+}A.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/385fe3e35f1faed047ac1578be42eb1b2de5fae5)
其中 + 是摩爾-彭若斯廣義逆.
矩陣
都需要是非負對稱矩陣。可以建構最佳投影方程的解,而此解可以決定降階LQG控制器矩陣
和
:
![{\displaystyle F_{r}(t)=H(t)\left(A(t)-P(t)C'(t)W^{-1}(t)C(t)-B(t)R^{-1}(t)B'(t)S(t)\right)G(t)+{\dot {H}}(t)G'(t),}](https://wikimedia.org/api/rest_v1/media/math/render/svg/5d299d017ed9b88216ae6bfbc44565ed2682fe3a)
![{\displaystyle K_{r}(t)=H(t)P(t)C'(t)W^{-1}(t),}](https://wikimedia.org/api/rest_v1/media/math/render/svg/40f678285202464c13e237369bc00f791451a320)
![{\displaystyle L_{r}(t)=R^{-1}(t)B'(t)S(t)G'(t),}](https://wikimedia.org/api/rest_v1/media/math/render/svg/39a326bf20bbb5b6552df666cc2c7498855dc82f)
![{\displaystyle {\mathbf {x} }_{r}(0)=H(0)E({\mathbf {x} }(0)).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/07cffd31025dd2b38b2c49119f6110af356d76bf)
上式中的矩陣
是符合以下性質的矩陣:
幾乎在所有狀態下。
可以由
的投影分解中得到[4]:
若降階LQG問題中的所有矩陣都是非時變的,且最終時間(horizon)
趨近無限大,則最佳降階LQG控制器和最佳投影方程也都會是非時變的[1]。此情形下,最佳投影方程左側的微分項會為零。
離散時間[編輯]
離散時間的情形類似連續時間的例子,要處理的是將
階傳統離散時間全階LQG問題轉換為事先已知固定階數的
階降階LQG控制器。為了要表示離散時間的OPE,先引入以下二個矩陣:
![{\displaystyle {}+A_{i}P_{i}C'_{i}(C_{i}P_{i}C'_{i}+W_{i})^{-1}C_{i}P_{i}A'_{i}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/0da41788a930d6537e68e501f13c0ddfe7284f83)
![{\displaystyle {}+A'_{i}S_{i+1}B_{i}(B'_{i}S_{i+1}B_{i}+R_{i})^{-1}B'_{i}S_{i+1}A_{i}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/8f5b86c410e9edca2c2a81c9ce7f814e5502d07b)
則離散時間OPE為
.
.
almost everywhere,
almost everywhere.
斜投影(oblique projection)矩陣為
![{\displaystyle \tau _{i}={\hat {P}}_{i}{\hat {S}}_{i}\left({\hat {P}}_{i}{\hat {S}}_{i}\right)^{*}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ec4e377b848f92bf0c391f336c94737160b58f72)
非負對稱矩陣
是離散時間OPE的解,也決定了降階LQG控制器的矩陣
and
:
![{\displaystyle F_{i}^{r}=H_{i+1}\left(A_{i}-P_{i}C'_{i}\left(C_{i}P_{i}C'_{i}+W_{i}\right)^{-1}C_{i}-B_{i}\left(B'_{i}S_{i+1}B_{i}+R_{i}\right)^{-1}B'_{i}S_{i+1}\right)G'_{i},}](https://wikimedia.org/api/rest_v1/media/math/render/svg/a8b2a83a805cc3e050aae5df4f0c6f5efa10ba8d)
![{\displaystyle K_{i}^{r}=H_{i+1}P_{i}C'_{i}\left(C_{i}P_{i}C'_{i}+W_{i}\right)^{-1},}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f8461fb2be21a8ed9b4d75444984634d84f33d66)
![{\displaystyle L_{i}^{r}=\left(B'_{i}S_{i+1}B_{i}+R_{i}\right)^{-1}B'_{i}S_{i+1}G'_{i},}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f1a306cc713d6b8671758729ffbb3ff464a1486a)
![{\displaystyle {\mathbf {x} }_{0}^{r}=H_{0}E({\mathbf {x} }_{0}).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/53dcddad84c34354f4a56c3ff8e5672b9b6eaf7b)
在上述的方程中,矩陣
是有以下性質的矩陣:
幾乎在所有狀態下。
這些矩陣可以從
的投影因式分解中求得[4]。
如同在連續時間中的例子一樣,若問題中所有的矩陣都是非時變,且且最終時間(horizon)
趨近無限大,降階LQG控制器就會是非時變的。因此離散時間OPE會收斂到穩態解,決定非時變的降階LOG控制器[2]。
離散時間OPE也可以應用在狀態維度,輸入維度或是輸出維度可變的離散時間系統(具有時變維度的離散時間系統)[6]。若在數位控制器中的取樣是不同步的,就可能會出現這類的系統。
參考資料[編輯]