神經網路控制
出自 MBA智库百科(https://wiki.mbalib.com/)
目錄 |
神經網路控制是指在控制系統中,應用神經網路技術,對難以精確建模的複雜非線性對象進行神經網路模型辨識,或作為控制器,或進行優化計算,或進行推理,或進行故障診斷,或同時兼有上述多種功能。
神經網路是由大量人工神經元(處理單元)廣泛互聯而成的網路,它是在現代神經生物學和認識科學對人類信息處理研究的基礎上提出來的,具有很強的自適應性和學習能力、非線性映射能力、魯棒性和容錯能力。充分地將這些神經網路特性應用於控制領域,可使控制系統的智能化向前邁進一大步。
隨著被控系統越來越複雜,人們對控制系統的要求越來越高,特別是要求控制系統能適應不確定性、時變的對象與環境。傳統的基於精確模型的控制方法難以適應要求,現在關於控制的概念也已更加廣泛,它要求包括一些決策、規劃以及學習功能。神經網路由於具有上述優點而越來越受到人們的重視。
神經網路控制就是利用神經網路這種工具從機理上對人腦進行簡單結構模擬的新型控制和辨識方法。神經網路在控制系統中可充當對象的模型,還可充當控制器。常見的神經網路控制結構有:
1、參數估計自適應控制系統;
2、內模控制系統;
3、預測控制系統;
4、模型參考自適應系統;
5、變結構控制系統。
與傳統控制相比,神經網路控制具有以下重要特性:
1、非線性,神經元網路在理論上可以充分逼近任意非線性函數;
2、並行分佈處理,神經網路具有高度的並行結構和並行實現能力,使其具有更大程度的容錯能力和較強的數據處理能力;
4、多變數處理,神經網路可自然地處理多輸入信號,並具有多輸出,它非常適合用於多變數系統。
通常將人工神經網路技術與傳統的控制理論或智能技術綜合使用。神經網路在控制中的作用有以下幾種:
1、在傳統的控制系統中用以動態系統建模,充當對象模型;
2、在反饋控制系統中直接充當控制器的作用;
3、在傳統控制系統中起優化計算作用;
4、與其他智能控制方法如模糊邏輯、遺傳演算法、專家控制等相融合。
1、神經網路監督控制
神經網路監督控制是指通過對人工或傳統控制器(如PID控制器)進行學習,然後用神經網路控制器取代或逐漸取代原有控制器的方法(Werbos1990),圖1為兩種神經網路監督控制結構模型。
圖1中的神經網路監督控制是建立在人工控制器基礎上的正向模型,經過訓練後,神經網路 NNC記憶人工控制器的動態特性,並接受感測信息輸入,最後輸出與人工控制相似的控製作用。其不足是,人工控制器是靠視覺反饋進行控制的,這樣用神經網路進行控制時,缺乏信息反饋,從而使系統處於開環狀態,系統的穩定性和魯棒性得不到保證。
圖2中的神經網路控制器通過對傳統控制器的輸出進行學習,線上調整自身參數,直至反饋誤差e(t)趨近於零,使自己逐漸在控制中占據主導地位,以最終取代傳統控制器。當系統出現干擾時,傳統控制器重新起作用,神經網路重新進行學習。這種神經網路監督控制結構由於增加了反饋結構,其穩定性和魯棒性都可得到保證,且控制精度和自適應能力也大大提高。
2、神經網路直接逆控制神經網路直接逆控制就是將被控對象的神經網路逆模型直接與被控對象串聯連接,使系統期望輸出yd(t)與對象實際輸出之間的傳遞函數等於1,從而再將此網路置於前饋控制器後,使被控對象的輸出為期望輸出,如圖3所示。圖中神經網路NN1和NN2具有相同的網路結構(逆模型),採用相同的學習演算法。這種方法的可行性直接取決於逆模型辨識的準確程度,逆模型的連接權必須線上修正。其成功的應用是機器人手臂的跟蹤控制。
3、神經網路模型參考控制
神經網路模型參考控制是神經網路自適應控制中的一種,在這種控制結構中,閉環控制系統的期望性能由一個穩定的參考模型來描述,且定義成{r(t),ym(t)}輸入-輸出對,控制系統的目的就是使被控對象的輸出y(t)一致漸近地趨近於參考模型的輸出,即lim | | y(t) * ym(t) | | < e,其中,e為一個給定的小正數。
4、神經網路內模控制
在內模控制中,系統前向模型與被控對象並聯連接,二者輸出之差作為反饋信號。圖4為神經網路內模控制模型,被控對象的正向模型和控制器(逆模型)均由神經網路實現,濾波器為線性濾波器,以獲得期望的魯棒性和閉合迴路的跟蹤響應特性。應當註意,內模控制的應用僅限於開環穩定的系統。這一技術已廣泛地應用於過程式控制制中,其中,Hunt和Sharbam等人(1990)實現了非線性系統的神經網路內模控制。5、神經網路預測控制
預測控制是20世紀70年代後期發展起來的一種新型控制演算法,其特性是預測模型、滾動優化和反饋校正,已證明預測控制對非線性系統具有期望的穩定性能(Mayne and michalska 1990)。
神經網路預測控制模型如圖5所示,其中神經網路預測器建立了非線性被控對象的預測模型,利用該預測模型,可由當前的控制輸入u(t),預測出被控系統在將來一段時間內的輸出值y(t + j) = yd(t + j) − y(t + j | t).則非線性優化器將使下式所示的二次型性能指標極小,以得到合適的控製作用u(t):
其中,Δu(t + j − 1) = u(t + j − 1) − u(t + j − 2),且λj為控制加權影子。
6、神經網路自適應評判控制
在上述各種神經網路控制結構中,都要求提供被控對象的期望輸入,這種方法稱為監督學習,但在系統模型未知時,有時只能定性地提供一些評價信息,基於這些定性信息的學習演算法稱為再勵學習。神經網路自適應評判控制就是基於這種再勵學習演算法的控制。
神經網路自適應評判控制通常由兩個網路組成,如圖6所示。其中自適應評價網路相當於一個需要進行再勵學習的“教師”。其作用為,一是通過不斷的獎勵、懲罰等再勵學習方法,使其成為一個“合格”的教師;二是在學習完成後,根據被控系統當前的狀態及外部再勵反饋信號r(t),產生一再勵預測信號,進而給出內部再勵信號,以期對當前控製作用的效果進行評價。控制選擇網路的作用相當於一個在內部再勵信號指導下進行學習的多層前饋神經網路控制器,該網路在學習後,將根據編碼後的系統狀態,在允許控制集中選擇下一步的控製作用。
內模控制是神經網路控制!?