最優控制理論
出自 MBA智库百科(https://wiki.mbalib.com/)
最優控制理論(optimal control theory)
目錄 |
最優控制理論是現代控制理論的一個主要分支,著重於研究使控制系統的性能指標實現最優化的基本條件和綜合方法。
最優控制理論是研究和解決從一切可能的控制方案中尋找最優解的一門學科。它是現代控制理論的重要組成部分。這方面的開創性工作主要是由貝爾曼(R.E.Bellman)提出的動態規劃和龐特裡亞金等人提出的最大值原理。這方面的先期工作應該追溯到維納(N.Wiener)等人奠基的控制論(Cybernetics)。1948年維納發表了題為《控制論—關於動物和機器中控制與通訊的科學》的論文,第一次科學的提出了信息、反饋和控制的概念,為最優控制理論的誕生和發展奠定了基礎。錢學森1954年所著的《工程式控制制論》(EngineeringCybernetics)直接促進了最優控制理論的發展和形成。
最優控制理論所研究的問題可以概括為:對一個受控的動力學系統或運動過程,從一類允許的控制方案中找出一個最優的控制方案,使系統的運動在由某個初始狀態轉移到指定的目標狀態的同時,其性能指標值為最優。這類問題廣泛存在於技術領域或社會問題中。
例如,確定一個最優控制方式使空間飛行器由一個軌道轉換到另一軌道過程中燃料消耗最少,選擇一個溫度的調節規律和相應的原料配比使化工反應過程的產量最多,制定一項最合理的人口政策使人口發展過程中老化指數、撫養指數和勞動力指數等為最優等,都是一些典型的最優控制問題。最優控制理論是50年代中期在空間技術的推動下開始形成和發展起來的。蘇聯學者Л.С.龐特裡亞金1958年提出的極大值原理和美國學者R.貝爾曼1956年提出的動態規劃,對最優控制理論的形成和發展起了重要的作用。線性系統在二次型性能指標下的最優控制問題則是R.E.卡爾曼在60年代初提出和解決的。
最優控制理論的基本思想與常用方法[1]
最優控制理論是現代控制理論中的核心內容之一,其主要實質是,在滿足一定約束條件下尋求最優控制規律或控制策略,使得系統在規定的性能指標(目標函數)下具有最優值。
動態規劃、最大值理論和變分法是最優控制理論的基本內容和常用方法。
動態規劃是貝爾曼於二十世紀五十年代中期為解決多階段決策過程而提出來的。這個方法的關鍵是建立在他所提出的“最優性原理”基礎之上的,這個原理歸結為用一組基本的遞推關係式使過程連續的最優轉移它可以求這樣的最優解,這些最優解是以計算每個決策的後果並對今後的決策制定最優決策為基礎的,但在求最優解時要按倒過來的順序進行,即從最終狀態開始到初始狀態為止。
龐特亞金於1956—1958年間創立的最大值原理是經典最優控制理論的重要組成部分和控制理論發展史上的一個裡程碑。它是解決最優控制問題的一種最普遍的有效方法。由於它放寬了求解問題的前提條件,使得許多古典變分法和動態規劃法無法解決的工程技術問題得到瞭解決。
為瞭解決最優控制問題,必須建立描述受控運動過程的運動方程,給出控制變數的允許取值範圍,指定運動過程的初始狀態和目標狀態,並且規定一個評價運動過程品質優劣的性能指標。通常,性能指標的好壞取決於所選擇的控制函數和相應的運動狀態。系統的運動狀態受到運動方程的約束,而控制函數只能在允許的範圍內選取。因此,從數學上看,確定最優控制問題可以表述為:在運動方程和允許控制範圍的約束下,對以控制函數和運動狀態為變數的性能指標函數(稱為泛函)求取極值(極大值或極小值)。解決最優控制問題的主要方法有古典變分法、極大值原理和動態規劃。
一、古典變分法
研究對泛函求極值的一種數學方法。古典變分法只能用在控制變數的取值範圍不受限制的情況。在許多實際控制問題中,控制函數的取值常常受到封閉性的邊界限制,如方向舵只能在兩個極限值範圍內轉動,電動機的力矩只能在正負的最大值範圍內產生等。因此,古典變分法對於解決許多重要的實際最優控制問題,是無能為力的。
二、極大值原理
極大值原理,是分析力學中哈密頓方法的推廣。極大值原理的突出優點是可用於控制變數受限制的情況,能給出問題中最優控制所必須滿足的條件。
三、動態規劃
動態規劃是數學規劃的一種,同樣可用於控制變數受限制的情況,是一種很適合於在電腦上進行計算的比較有效的方法。
最優控制理論已被應用於綜合和設計最速控制系統、最省燃料控制系統、最小能耗控制系統、線性調節器等。
最優控制的實現離不開最優化技術,最優化技術是研究和解決最優化問題的一門學科,它研究和解決如何從一切可能的方案中尋找最優的方案。也就是說,最優化技術是研究和解決如何將最優化問題表示為數學模型以及如何根據數學模型儘快求出其最優解這兩大問題。一般而言,用最優化方法解決實際工程問題可分為三步進行:
①根據所提出的最優化問題,建立最優化問題的數學模型,確定變數,列出約束條件和目標函數;
②對所建立的數學模型進行具體分析和研究,選擇合適的最優化方法;
③根據最優化方法的演算法列出程式框圖和編寫程式,用電腦求出最優解,並對演算法的收斂性、通用性、簡便性、計算效率及誤差等作出評價。
所謂最優化問題,就是尋找一個最優控制方案或最優控制規律,使系統能最優地達到預期的目標。在最優化問題的數學模型建立後,主要問題是如何通過不同的求解方法解決尋優問題。一般而言,最優化方式有離線靜態優化方式和線上動態優化方式,而最優化問題的求解方法大致可分為四類:
1.解析法
對於目標函數及約束條件具有簡單而明確的數學表達式的最優化問題,通常可採用解析法來解決。其求解方法是先按照函數極值的必要條件,用數學分析方法求出其解析解,然後按照充分條件或問題的實際物理意義間接地確定最優解。
2.數值解法(直接法)
對於目標函數較為複雜或無明確的數學表達式或無法用解析法求解的最優化問題,通常可採用直接法來解決。直接法的基本思想,就是用直接搜索方法經過一系列的迭代以產生點的序列,使之逐步接近到最優點。直接法常常是根據經驗或實驗而得到的。
3.解析與數值相結合的尋優方法
4.網路最優化方法
這種方法以網路圖作為數學模型,用圖論方法進行搜索的尋優方法。
1.線上優化方法
基於對象數學模型的離線優化方法是一種理想化方法。這是因為儘管工業過程(對象)被設計得按一定的正常工況連續運行,但是環境的變動、觸媒和設備的老化以及原料成分的變動等因素形成了對工業過程的擾動,因此原來設計的工況條件就不是最優的。
解決此類問題的常見方法。
(1)局部參數最優化和整體最優化設計方法
局部參數最優化方法的基本思想是:按照參考模型和被控過程輸出之差來調整控制器可調參數,使輸出誤差平方的積分達到最小。這樣可使被控過程和參考模型儘快地精確一致。
此外,靜態最優與動態最優相結合,可變局部最優為整體最優。整體最優由總體目標函數體現。整體最優由兩部分組成:一種是靜態最優(或離線最優),它的目標函數在一段時間或一定範圍內是不變的;另一種是動態最優(或線上最優),它是指整個工業過程的最優化。工業過程是一個動態過程,要讓一個系統始終處於最優化狀態,必須隨時排除各種干擾,協調好各局部優化參數或各現場控制器,從而達到整個系統最優。
預測控制,又稱基於模型的控制(Model-based Control),是70年代後期興起的一種新型優化控制演算法。但它與通常的離散最優控制演算法不同,不是採用一個不變的全局優化目標,而是採用滾動式的有限時域優化策略。這意味著優化過程不是一次離線進行,而是反覆線上進行的。這種有限化目標的局部性使其在理想情況下只能得到全局的次優解,但其滾動實施,卻能顧及由於模型失配、時變、干擾等引起的不確定性,及時進行彌補,始終把新的優化建立在實際的基礎之上,使控制保持實際上的最優。這種啟髮式的滾動優化策略,兼顧了對未來充分長時間內的理想優化和實際存在的不確定性的影響。在複雜的工業環境中,這比建立在理想條件下的最優控制更加實際有效。
預測控制的優化模式具有鮮明的特點:它的離散形式的有限優化目標及滾動推進的實施過程,使得在控制的全過程中實現動態優化,而在控制的每一步實現靜態參數優化。用這種思路,可以處理更複雜的情況,例如有約束、多目標、非線性乃至非參數等。吸取規劃中的分層思想,還可把目標按其重要性及類型分層,實施不同層次的優化。顯然,可把大系統控制中分層決策的思想和人工智慧方法引入預測控制,形成多層智能預測控制的模式。這種多層智能預測控制方法的,將剋服單一模型的預測控制演算法的不足,是當前研究的重要方向之一。
(3)穩態遞階控制
對複雜的大工業過程(對象)的控制常採用集散控制模式。這時電腦線上穩態優化常採用遞階控制結構。這種結構既有控制層又有優化層,而優化層是一個兩級結構,由局部決策單元級和協調器組成。其優化進程是:各決策單元並行響應子過程優化,由上一級決策單元(協調器)協調各優化進程,各決策單元和協調器通過相互迭代找到最優解。這裡必須提到波蘭學者Findeisen等所作出的重要貢獻。
由於工業過程較精確的數學模型不易求得,而且工業過程(對象)往往呈非線性及慢時變性,因此波蘭學者Findesien提出:優化演算法中採用模型求得的解是開環優化解。在大工業過程線上穩態控制的設計階段,開環解可以用來決定最優工作點。但在實際使用上,這個解未必能使工業過程處於最優工況,相反還會違反約束。他們提出的全新思想是:從實際過程提取關聯變數的穩態信息,並反饋至上一層協調器(全局反饋)或局部決策單元(局部反饋),並用它修正基於模型求出的的最優解,使之接近真實最優解。
(4)系統優化和參數估計的集成研究方法
穩態遞階控制的難點是,實際過程的輸入輸出特性是未知的。波蘭學者提出的反饋校正機制,得到的只能是一個次優解。但其主要缺點在於一般很難準確估計次優解偏離最優解的程度,而且次優解的次優程度往往依賴於初始點的選取。一個自然的想法是將優化和參數估計分開處理並交替進行,直到迭代收斂到一個解。這樣電腦的線上優化控制就包括兩部分任務:在粗模型(粗模型通常是能夠得到的)基礎上的優化和設定點下的修正模型。這種方法稱為系統優化和參數估計的集成研究方法。 (Integrated System Optimizationand Parameter Estimation)
2.智能優化方法
對於越來越多的複雜控制對象,一方面,人們所要求的控制性能不再單純的局限於一兩個指標;另一方面,上述各種優化方法,都是基於優化問題具有精確的數學模型基礎之上的。但是許多實際工程問題是很難或不可能得到其精確的數學模型的。這就限制了上述經典優化方法的實際應用。隨著模糊理論、神經網路等智能技術和電腦技術的發展。
近年來,智能式的優化方法得到了重視和發展。
(1)神經網路優化方法
人工神經網路的研究起源於1943年和Mc Culloch和Pitts的工作。在優化方面,1982年Hopfield首先引入Lyapuov能量函數用於判斷網路的穩定性,提出了Hopfield單層離散模型;Hopfield和Tank又發展了Hopfield單層連續模型。1986年,Hopfield和Tank將電子電路與Hopfield模型直接對應,實現了硬體模擬;Kennedy和Chua基於非線性電路理論提出了模擬電路模型,並使用系統微分方程的Lyapuov函數研究了電子電路的穩定性。這些工作都有力地促進了對神經網路優化方法的研究。
根據神經網路理論,神經網路能量函數的極小點對應於系統的穩定平衡點,這樣能量函數極小點的求解就轉換為求解系統的穩定平衡點。隨著時間的演化,網路的運動軌道在空間中總是朝著能量函數減小的方向運動,最終到達系統的平衡點——即能量函數的極小點。因此如果把神經網路動力系統的穩定吸引子考慮為適當的能量函數(或增廣能量函數)的極小點,優化計算就從一初始點隨著系統流到達某一極小點。如果將全局優化的概念用於控制系統,則控制系統的目標函數最終將達到希望的最小點。這就是神經優化計算的基本原理。
與一般的數學規劃一樣,神經網路方法也存在著重分析次數較多的弱點,如何與結構的近似重分析等結構優化技術結合,減少迭代次數是今後進一步研究的方向之一。
由於Hopfield模型能同時適用於離散問題和連續問題,因此可望有效地解決控制工程中普遍存在的混合離散變數非線性優化問題。
(2)遺傳演算法
遺傳演算法和遺傳規劃是一種新興的搜索尋優技術。它仿效生物的進化和遺傳,根據“優勝劣汰”原則,使所要求解決的問題從初始解逐步地逼近最優解。在許多情況下,遺傳演算法明顯優於傳統的優化方法。該演算法允許所求解的問題是非線性的和不連續的,並能從整個可行解空間尋找全局最優解和次優解,避免只得到局部最優解。這樣可以為我們提供更多有用的參考信息,以便更好地進行系統控制。同時其搜索最優解的過程是有指導性的,避免了一般優化演算法的維數災難問題。遺傳演算法的這些優點隨著電腦技術的發展,在控制領域中將發揮越來越大的作用。
目前的研究表明,遺傳演算法是一種具有很大潛力的結構優化方法。它用於解決非線性結構優化、動力結構優化、形狀優化、拓撲優化等複雜優化問題,具有較大的優勢。
(3)模糊優化方法
最優化問題一直是模糊理論應用最為廣泛的領域之一。
自從Bellman和L.A.zadeh在 70年代初期對這一研究作出開創性工作以來,其主要研究集中在一般意義下的理論研究、模糊線性規劃、多目標模糊規劃、以及模糊規劃理論在隨機規劃及許多實際問題中的應用。主要的研究方法是利用模糊集的a截集或確定模糊集的隸屬函數將模糊規劃問題轉化為經典的規劃問題來解決。
模糊優化方法與普通優化方法的要求相同,仍然是尋求一個控制方案(即一組設計變數),滿足給定的約束條件,並使目標函數為最優值,區別僅在於其中包含有模糊因素。普通優化可以歸結為求解一個普通數學規劃問題,模糊規劃則可歸結為求解一個模糊數學規劃(fuzzymathematicalprogramming)問題。包含控制變數、目標函數和約束條件,但其中控制變數、目標函數和約束條件可能都是模糊的,也可能某一方面是模糊的而其它方面是清晰的。例如模糊約束的優化設計問題中模糊因素是包含在約束條件(如幾何約束、性能約束和人文約束等)中的。求解模糊數學規劃問題的基本思想是把模糊優化轉化為非模糊優化即普通優化問題。方法可分為兩類:一類是給出模糊解(fuzzysolution);另一類是給出一個特定的清晰解(crispsolution)。必須指出,上述解法都是對於模糊線性規劃(fuzzylinearprogramming)提出的。然而大多數實際工程問題是由非線形模糊規劃(fuzzynonlinearprogramming)加以描述的。於是有人提出了水平截集法、限界搜索法和最大水平法等,並取得了一些可喜的成果。
在控制領域中,模糊控制與自學習演算法、模糊控制與遺傳演算法相融合,通過改進學習演算法、遺傳演算法,按給定優化性能指標,對被控對象進行逐步尋優學習,從而能夠有效地確定模糊控制器的結構和參數。
案例一:最優控制理論在電力系統勵磁控制中的應用[1]
近年來,隨著現代控制理論及其實際應用的不斷發展,運用現代控制理論進行電力系統運行性能的最優化控制的研究工作有了迅速的發展,對如何按最優化的方法設計多參量的勵磁調節器也取得了很大進展。
- 1.基於非線性最優和PID技術的綜合勵磁調節器
對於非線性系統的同步發電機而言,當它偏離系統工作點或系統發生較大擾動時,如果仍然採用基於PID技術的電力系統穩定器,就會出現誤差。為此,可以將其用基於非線性最優控制技術的勵磁調節器。但是,非線性最優控制調節器存在著對電壓控制能力較弱的缺點,所以用一種能夠將非線性最優勵磁調節器和PID技術的電力系統穩定器有機結合的新型勵磁調節器的設計原理。
此綜合勵磁調節器是利用非線性最優控制理論的研究成果,其在非線性的勵磁控制中採用了精確線性化的數學方法,不存在平衡點線性化後的舍入誤差,因此該控制的數學模型在理論上對發電機的所有運行點都是精確的;同時針對非線性的勵磁控制調壓能力較弱的特點,又增加了PID環節,使其具有較強的電壓調節特性此裝置在小機組試驗中取得非常好的實驗效果,在平衡點附近運行和偏離平衡點較多時都具有很好的調節特性。
- 2.自適應最優勵磁控制器
將自適應控制理論與最優控制理論相結合,通過多變數參數辨識、最優反饋繫數計算和控制演算法運算三個環節,可以實現同步發電機勵磁的自適應最優控制。
此發電機自適應最優勵磁方案,通過採用由帶可變遺忘因數的最小二乘演算法構成的多變數實時辨識器,使系統狀態方程的繫數矩陣A和B中的元素值隨系統運行工況的變化而變化,再經過最優反饋繫數計算,實現了同步電機的自適應最優勵磁控制。
雖然使用線性最優控制理論求取反饋繫數,但由於狀態方程的繫數矩陣中的元素值隨系統運行工況的變化而變化,因而控製作用體現了電力系統的非線性特性,本質上是一種非線性控制。
數字模擬試驗結果表明,該勵磁控制系統能夠自動跟蹤系統運行工作狀況,線上辨識不斷變化的系統參數,使控製作用始終處於最優狀態。從而改善了控制系統的動態品質,可以提高電力系統運行的穩定性。
- 3.基於神經網路逆系統方法的非線性勵磁控制
神經網路逆系統方法將神經網路對非線性函數逼近學習能力和逆系統方法的線性化能力相結合,構造出物理可實現的神經網路逆系統,從而實現了對被控系統的大範圍線性化,能夠在無需系統參數的情況下構造出偽線性複合系統,從而將非線性系統的控制問題轉化為線性系的控制問題。
在大幹擾情況下,神經網路逆系統方法的控制器暫態時間很短,超調量很小,有效地改善了系統的暫態響應品質,提高了電力系統的穩定性,此控制器還具有很好的魯棒性能。另外,神經網路逆系統方法無需知道原系統的數學模型以及參數,,也不需要測量被控系統的狀態量,僅需要知道被控系統可逆及輸入輸出微分方程的階數,且結構簡單,易於工程實現。
- 4.基於灰色預測控制演算法的最優勵磁控制
預測控制是一種電腦演算法,它採用多步預測的方式增加了反映過程未來變化趨勢的信息量,因而能剋服不確定性因素和複雜變化的影響。灰色預測控制是預測控制的一個分支,它需建立灰微分方程,能較好地對系統作全面的分析。應用GM(1,N)對發電機的功率偏差、轉速偏差、電壓偏差序列值進行建模,經全面分析後求出各狀態量的預測值,同時根據最優控制理論求出以預測值為狀態變數的被控勵磁控制系統的最優反饋增益,從而得出具有預測信息的最優勵磁控制量。
灰色預測控制理論中灰色建模和“超前控制”的思想較好地彌補了線性最優控制理論中精確線性化和“事後控制”對單機無窮大系統的模擬結果表明,此勵磁控制具有響應速度快、準確度高的特點,使電力系統在大小擾動下均能表現出較好的動態特性。