全球专业中文经管百科,由121,994位网友共同编写而成,共计436,046个条目

状态、算子和结果

用手机看条目

出自 MBA智库百科(https://wiki.mbalib.com/)

状态、算子和结果(SOAR,State,Operator And Result)

目录

什么是状态、算子和结果[1]

  SOAR是由纽威尔等人于1986年开发的称之为“通用智能的一种框架”,SOAR的字母意思为状态、算子和结果,简单来说就是应用算子改变状态和产生结果。SOAR主要讨论知识、思考、智力和记忆等问题,是一个应用范围非常广的认知结构。SOAR模型是通用的问题求解程序,以知识块理论为基础,利用基于规则的记忆,获取搜索控制知识和操作符,即能从经验中学习,能记住自己是如何解决问题的,并把这种经验和知识用于以后的问题求解过程之中,实现通用问题求解。

状态、算子和结果的发展概况[2]

(一)最初模型

  SOAR模型目前已经走过34年的发展。2014年6月16日,密歇根大学安娜堡分校举办了第三十四届SAOR研习会,经过不断完善,目前的版本已经到了v9.3.2,并且可以自行下载。该模型目前最新的应用是iPhone的一款名为“Liar's Dice”的游戏。SOAR最初版本的模型结构如图1所示。

  SOAR仅由被编码为产生式规则的单一的长期记忆,以及编码为符号图结构的工作记忆组成。基于符号的工作记忆存储了智能体对当前环境及情况的评估,利用长期记忆里回忆相关知识,经过输入、状态描述、提议算子、比较算子、选择算子、算子应用、输出这样的决策循环选择下一步操作,直到达到目标状态。

(二)拓展模型

  经过三十多年的发展与改进,许多科研团体为SOAR加入新的功能模块,但还没有统一的系统包含所有的模块,使它们一起协调工作。后来的版本包含了语义记忆、情景记忆强化学习三部分。加入所有拓展模块的模型结构如图2所示

  现对各个模块进行简要说明:

1.工作记忆活跃度

  受ACT—R启发,我们给SOAR的工作记忆添加了“活跃度”参数。活跃度提供了一种元数据,描述了工作记忆元的最近相关程度,其数值是工作记忆元与被激活的规则匹配时计算出来的。这个信息不仅仅用来决定今后激活哪个规则,它还作为部分情景记忆的内容存储起来,以使提取的情景是与目前情况最相关的。将来,希望工作记忆活跃度会用在语义记忆和情感里。

2.强化学习

  一方面,强化学习调整动作的选择机制以使获得的反馈效益最大化。在早期的SOAR里,所有选择算子的优先权都是符号描述的,现在有了数字化的优先系数。在算子选择阶段,所有的优先系数都被绑定在一起,通过一个小整数贪婪算法选择下一个算子。算子应用后,所有为该算子产生优先系数的规则都将被更新。另一方面,强化学习与成块学习有所不同。强化学习应用在每个算子选择、决策循环里,甚至用在困境发生时;而成块学习机制只通过困境学习。此外,强化学习通过改变优先系数来对规则进行修改,而成块只是单纯地添加新规则。实际上强化学习和成块学习互为补充,因为当没有可选择的规则时,困境产生,且在子目标里的问题求解可以先为约束算子产生初始化优先系数,然后成块创建规则,为将来创建初始系数,最后强化学习将值转化为经验积累值。

3.情感

  情感在功能和计算上的作用正在被激烈讨论,在过去的二十年里展开了大量的有关情感的研究。有些理论表明智能体不断地评价情形并最终产生情感。这种评价可以影响到各个方面:目标相关性(当前情况对于目标来说是否重要);目标推断(这个情景对于达到目标有好的影响还是坏的影响),等等。在SOAR里,这种情感将产生一种数值,作为强化学习的反馈参数(奖励/惩罚),进而大大提高学习速度。将来的一个工作就是研究情感、情绪和感觉与其他模块协调工作。

4.语义记忆

  除了被编码为规则的过程性知识,还有陈述性知识。陈述性知识可以分为事实和情景经验。语义记忆提供了对世界陈述性事实的存储和提取。在SOAR里,语义记忆由工作记忆里的结构组成,语义记忆里的某部分结构通过在工作记忆产生的线索被提取。这个线索用于搜索语 义记忆里的最佳匹配,然后将匹配结果送回到工作记忆。研究发现,用成块机制从语义记忆里提取知识是可能的,但执行起来相当困难。

5.情景记忆

  语义记忆存储的知识与具体的时间地点无关,而情景记忆里存储的是有关经验的记忆,与时间息息相关。情景记忆存储在工作记忆里出现的结构实例,有提取过去经验的能力。情景通过一个线索提取,一旦线索创建,最佳匹配就会被发现。

  虽然相似的机制在基于案例的推理中被学习过,情景记忆有自己的特点—— 与任务无关,因此对每个问题都可用,这是其他机制不能达到的。情景学习很简单但是很值得研究,它的加入加强了认知能力,比如内部预测,推理和学习等。

6.可视化成像

  之前的扩展都是基于SOAR已有的符号工作记忆,表达智能体对目前情况的理解。但对于一些情况其它的表示方法会更有效。其中一种方法是可视化成像。在SOAR里添加了一些模块与进程支持可视化成像:构建和操作图像的工作记忆;存放可被工作记忆提取的图像的长期记忆;操作工作记忆里图像的进程和从可视化图像产生符号结构的进程。因为使用了更少的过程性知识,因此解决空间推理问题更快,或者一些过程只用符号是根本完成不了的。

7.聚团机制

  基于Richard Granger的研究添加了这个新模块。聚团机制能自动总结隐含在问题空间中的知识,并改善以后问题求解,使得学习与求解相辅相成。它能够自动产生新符号,使外界的感知可以由概念进行分类。其算法由丘脑皮层在大脑的循环启发而来。虽然还没有将其应用在SOAR的所有感知类型,但已经使用聚类产生新符号结构使状态描述更丰富,同时也提高强化学习的效率。

参考文献

  1. 基于符号主义范式统一认知模型的分析与研究·王新鹏·《计算机应用与软件》2008年第7期 60-62
  2. 人工智能工具SOAR认知模型构建·孙丽·产业与科技论坛 ·2014-07-30
本条目对我有帮助5
MBA智库APP

扫一扫,下载MBA智库APP

分享到:
  如果您认为本条目还有待完善,需要补充新内容或修改错误内容,请编辑条目投诉举报

本条目由以下用户参与贡献

nonameh.

评论(共0条)

提示:评论内容为网友针对条目"状态、算子和结果"展开的讨论,与本站观点立场无关。

发表评论请文明上网,理性发言并遵守有关规定。

打开APP

以上内容根据网友推荐自动排序生成

官方社群
下载APP

闽公网安备 35020302032707号