學習控制系統
出自 MBA智库百科(https://wiki.mbalib.com/)
目錄 |
學習控制系統靠自身的學習功能來認識控制對象和外界環境的特性,並相應地改變自身特性以改善控制性能的系統。這種系統具有一定的識別、判斷、記憶和自行調整的能力。實現學習功能可有多種方式。
根據是否需要從外界獲得訓練信息,學習控制系統的學習方式分為受監視學習和自主學習兩類。
(1)受監視學習
這種學習方式除一般的輸入信號外,還需要從外界的監視者或監視裝置獲得訓練信息。所謂訓練信息是用來對系統提出要求或者對系統性能作出評價的信息。如果發現不符合監視者或監視裝置提出的要求,或受到不好的評價,系統就能自行修正參數、結構或控製作用。不斷重覆這種過程直至達到監視者的要求為止。當對系統提出新的要求時,系統就會重新學習。
(2)自主學習
簡稱自學習。這是一種不需要外界監視者的學習方式。只要規定某種判據(準則),系統本身就能通過統計估計、自我檢測、自我評價和自我校正等方式不斷自行調整,直至達到準則要求為止。這種學習方式實質上是一個不斷進行隨機嘗試和不斷總結經驗的過程。因為沒有足夠的先驗信息,這種學習過程往往需要較長的時間。
在實際應用中,為了達到更好的效果常將兩種學習方式結合起來。學習控制系統按照所採用的數學方法而有不同的形式,其中最主要的有採用模式分類器的訓練系統和增量學習系統。在學習控制系統的理論研究中,貝葉斯估計、隨機逼近方法和隨機自動機理論,都是常用的理論工具。