社会认知优化

来自testwiki
跳转到导航 跳转到搜索

Template:Copy edit Template:Unreferenced 社会认知优化(Social Cognitive Optimization, SCO),又称社会认识优化算法、社会认知算法。它是一种基于社会认知理论群体智能优化算法。

SCO算法已经被应用于非线性规划问题布尔可满足性问题,软件可靠性分配问题,自动机制设计等。

算法

SCO算法可用于求解全局最小化问题f(x),其中x为属于问题空间S的一个问题状态(State),或称为知识点,而f为质量衡量函数。

在SCO中,由Nc个主体(Agent)同时进行求解,而它们通过环境中的社会共享库(Library)的进行交互。其中每个主体i (i=1,,Nc)拥有一个私有知识点xi,而社会共享库中拥有一个知识集X={xj|j=1,,NL} (即一组知识点,其数量为Npop)。,SCO以马尔科夫过程方式(即当前周期的运行只依赖于上一周期的状态)重复运行T个周期。其算法流程如下:


  • [1.初始化]:在问题空间S中(随机)初始化每个主体i的私有知识点xi和社会共享库中的知识集X中的每个知识点。
  • [2.运行周期]:在每个周期t (t=1,,T)中:
    • [2.1.主体认知]对每个主体i (i=1,,Nc)
      • [2.1.1.榜样选择]:在X(t)中选择一个较高质量的知识点xM。通常通过锦标选择来实现,即随机选择TAUB个知识点,并返回其中质量最高(即f值最小)的知识点作为xM
      • [2.1.2.质量衡量]:比较xi(t)xM,将其中质量高的一个返回为基本知识点xBase,而质量低的一个返回为参考知识点xRef
      • [2.1.3.社会学习]:以xBasexRef为输入产生新知识点xi(t+1)。通常xi(t+1)应在以xBase的周围,而且离xBase的距离和与xRefxBase的距离相关,且应嵌入边界处理方式使得xi(t+1)属于S
      • [2.1.4.知识反馈]:将部分已有知识反馈给社会共享库。通常将xi(t+1)直接提交。
      • [2.1.5.知识更新]:更新主体i本身的私有知识点。通常将 xi(t+1)直接替换 xi(t),当然也可通过其它方式更新,比如蒙特卡洛方式。
    • [2.2.社会共享库维护]:社会共享库利用所有主体提交的知识点更新已有的知识集,即将X(t)更新为X(t+1)。一种简单的方式是一对一锦标选择方式,即对每一个主体提交的知识点,替换X(t)中随机选择TAUW个知识点后质量最差(即f值最大)的一个。
  • [3.结束]:返回历史上得到的质量最高的知识点作为准优解。

【注】在以上这些步骤中,只有2.1.3步尤其和问题空间S的形式相关。例如SD维连续空间时(每维值有给定的上下界),新知识点xi(t+1)可以以如下方式产生。首先得到xRefxBase为中心的对称点xImage,然后得到以xImagexRef为顶点的超矩形体SV(而xBase可视为在该超矩形体的中心),接着得到SSV的交集空间(边界处理方式),并在该交集空间中返回一个纯随机知识点作为xi(t+1)。如S为离散和组合空间(如对旅行商问题),则该步需要进行相应的设计。


SCO算法共有三个主要参数,即主体数目Nc,知识集大小Npop,以及执行周期数T。通常NpopNc的3~5倍。加上初始化过程,总知识点评估次数为Npop+Nc*(T+1),因此总知识点评估次数在T较大时基本与Npop无关。SCO算法还有两个次要参数,通常固定为默认值,即TAUB=2TAUW=4

最优化问题可以视为一个类似于Newell和Simon所定义的(可以度量的)问题空间,而问题求解则可看做在问题空间中进行搜索高质量的问题状态或知识点。对每个主体而言,其私有知识点可以看做一种私有记忆,而该知识点随执行周期的变化轨迹则可以视为是对认知过程的一种模拟,即由低质量知识点得到高质量知识点的过程。在每个周期中,每个主体使用他的私有记忆以及参考社会共享库中的部分信息或线索,通过搜索得到的新知识将会被主体用来更新它的私有记忆,并提交(部分)已有知识给环境用来最后更新社会共享库。因此SCO模拟一种简单的社会认知过程:每个主体的认知过程利用了社会共享库,而高质量的社会共享库的积累过程则来源于个体认知过程的贡献。主体间的交互和合作搜索实际上是隐式的通过对社会共享库的使用和影响其更新而实现。如果将在问题空间中迅速得到准优解的过程视为一种创造性思维过程,SCO也可以视为对Template:Link-en的一种简单模拟,这也意味着SCO有在研究群体创造性方面的扩展的可能性。

比较

以下比较一下SCO和几种主要的基于群体的优化算法的异同点。这些算法包括遗传算法(Genetic Algorithm, GA),蚁群算法(Ant Colony Optimization, ACO),粒子群优化(Particle Swarm Optimization,PSO)。

和GA所不同的是,每个主体长期存在于所有周期中,而不会被新个体替换。也就是,SCO模拟多个个体的学习和认知周期,而GA模拟群体的演化周期。

和ACO所不同的是,每个主体拥有私有记忆,这个记忆长期存在于所有周期中。在这点上,SCO和PSO类似。主体的私有记忆保证了个体学习能力,有助于群体中涌现新知识并维护群体知识的差异性。

和PSO所不同的是,社会共享库中的知识和主体中的知识相互独立。首先,拿走某个主体,不会影响社会共享库。在这点上,SCO和ACO类似。减少个体数目不会严重影响算法性能,SCO甚至能在只有一个个体时得到比较稳定的搜索结果,尽管使用多个个体会使得搜索过程更鲁棒。其次,改变库里面的部分信息,不会直接影响到主体本身,因此也可以通过调整社会共享库来调节算法性能。

外部链接

Template:Authority control