学习控制系统
出自 MBA智库百科(https://wiki.mbalib.com/)
目录 |
学习控制系统靠自身的学习功能来认识控制对象和外界环境的特性,并相应地改变自身特性以改善控制性能的系统。这种系统具有一定的识别、判断、记忆和自行调整的能力。实现学习功能可有多种方式。
根据是否需要从外界获得训练信息,学习控制系统的学习方式分为受监视学习和自主学习两类。
(1)受监视学习
这种学习方式除一般的输入信号外,还需要从外界的监视者或监视装置获得训练信息。所谓训练信息是用来对系统提出要求或者对系统性能作出评价的信息。如果发现不符合监视者或监视装置提出的要求,或受到不好的评价,系统就能自行修正参数、结构或控制作用。不断重复这种过程直至达到监视者的要求为止。当对系统提出新的要求时,系统就会重新学习。
(2)自主学习
简称自学习。这是一种不需要外界监视者的学习方式。只要规定某种判据(准则),系统本身就能通过统计估计、自我检测、自我评价和自我校正等方式不断自行调整,直至达到准则要求为止。这种学习方式实质上是一个不断进行随机尝试和不断总结经验的过程。因为没有足够的先验信息,这种学习过程往往需要较长的时间。
在实际应用中,为了达到更好的效果常将两种学习方式结合起来。学习控制系统按照所采用的数学方法而有不同的形式,其中最主要的有采用模式分类器的训练系统和增量学习系统。在学习控制系统的理论研究中,贝叶斯估计、随机逼近方法和随机自动机理论,都是常用的理论工具。