南京邮电大学《智能控制技术》期末抢救(下)
一、神经网络基础
1.神经网络的发展
启蒙期->低潮期->复兴期->新连接机制时期
神经网络的研究主要分为三个方面的内容,即神经元模型、神经网络结构和神经网络学习算法。
2.神经网络分类
(1)前向网络(单神经元、BP和RBF)
神经元分层排列,组成输入层、隐含层和输出层。每一层的神经元只接受前一层神经元的输入。在各神经元之间不存在反馈。感知器和误差反向传播网络采用前向网络形式。
(2)反馈网络
在输出层到输入层存在反馈,即每一个输入节点都有可能接受来自外部的输入和来自输出神经元的反馈。这种神经网络是一种反馈动力学系统,它需要工作一段时间才能达到稳定。
(3)自组织网络
当神经网络在接受外界输入时,网络将会分成不同的区域,不同区域具有不同的响应特征,即不同的神经元以最佳方式响应不同性质的信号激励,从而形成一种拓扑意义上的特征图,该图实际上是一种非线性映射。这种映射是通过无监督的自适应过程完成的,所以也称为自组织特征图。
神经网络学习算法按有无监督分类,可分为有监督学习(Supervised Learning)无监督学习(Unsupervised Learning)强化学习(Reinforcement Learning)
3.两个学习规则
智能Hebb学习规则
Delta(δ)学习规则
神经网络学习的目的是通过调整权值W,使误差准则函 数最小。可采用梯度下降法来实现权值的调整,其基本思想 是沿着E 的负梯度方向不断修正W 值,直到E达到最小,这种方法的数学表达式为:
4.BP神经网络
神经元激发函数为S函数;权值通过δ学习算法进行调节,学习算法由正向传播和反向传播组成,反向用梯度搜索技术,使网络的实际输出值与期望输出值的误差均方值为最小。
5.RBF神经网络
径向基函数(RBF-Radial Basis Function)神经网络是具有单隐层的三层前馈网络,由输入到输出的映射是非线性的,而隐含层空间到输出空间的映射是线性的。 由于RBF网络只调节输出层权值,因此,RBF网络较BP网络有算法简单、运行时间快的优点。但由于RBF网络中,输入空间到输出空间是非线性的,而隐含空间到输出空间是线性的,因而其非线性能力不如BP网络。
与BP的主要区别在于使用不同的激活函数:BP网络中隐层使用的是Sigmoid函数,而RBF网络中隐层的激活函数是高斯基函数。RBF网络的学习过程与BP网络的学习过程类似,然而RBF网络是局部逼近的神经网络,因而采用RBF网络可大大加快学习速度并避免局部极小问题,适合于实时控制的要求。
6.Hopfield神经网络
Hopfield神经网络模型是由一系列互联的神经单元组成的反馈型网络。 Vi 为神经元的输出,是神经元状态变量ui的非线性函数。
Hopfield工作时,各个神经元的连接权值是固定的,更新的只是神经元的输出状态。Hopfield神经网络的数值计算规则为:首先从网络中随机选取一个神经元 ui进行加权求和,再计算 ui 的第 t+1 时刻的输出值。除 ui 以外的所有神经元的输出值保持不变,直至网络进入稳定状态。Hopfield网络中的每一个神经元都将自己的输出通过连接权传送给所有其它神经元,同时又都接收所有其它神经元传递过来的信息。
Hopfield神经网络用能量函数表征网络状态的变化趋势。反馈型网络的一个重要特点就是它具有稳定状态,当网络达到稳定状态的时候,也就是它的能量函数达到最小的时候,即网络收敛。
二、神经网络控制
1.滑膜控制器设计
u为控制输入,b≠0为已知常数,C、k>0为设计参数,e为跟踪误差,xd为期望轨迹,|d(t)|≤ D,其中D为已知常数。
2.饱和函数
当逼近误差和干扰较大时,需要较大增益η,这可能会造成较大的抖振 sat(s)。为了防止抖振 控制器中可考虑采用饱和函数sat(s)来代替符号函数sgn( s):
其中∆>0为设计参数
三、遗传算法及其应用
1.遗传算法的应用
(1)函数优化(2)组合优化(3)生产调度问题(4)自动控制(5)机器人(6)图像处理(7)人工生命(8)遗传编程(9)机器学习
2.遗传算法的构成要素
(1)染色体编码
基本遗传算法使用固定长度的二进制符号来表示群体中的个体,其等位基因是由二值符号集{0,1}所组成。初始个体基因值可用均匀分布的随机值生成,如x =100111001000101101就可表示一个个体,该个体的染色体长度是18。
(2)个体适应度评价
评价是否适于遗传(依概率),个体的适应度必须为正数或零。基本遗传算法以个体适应度成正比的概率来决定当前群体中的哪些个体进行遗传操作。应用中,先要确定由目标函数值J到个体适应度f之间的转换规则。
(3)遗传算子/操作
选择运算/复制算子(Reproduction Operator):比例选择算子(个体被选中的概率与其适应度大小成正比)。复制操作能从旧种群中选择出优秀者,但不能创造新的染色体。
交叉运算:使用单点交叉算子。交叉模拟了生物进化过程中的繁殖现象,通过两个染色体的交换组合,来产生新的优良品种。交叉体现了自然界中信息交换的思想。
变异运算:使用基本位变异算子或均匀变异算子。在初始基因组合以外的空间进行搜索,防止陷入局部解而进入终止过程,从而影响解的质量,从而在尽可能大的空间中获得质量较高的优化解,
(4)基本运行参数
M:群体大小,即群体中所含个体的数量,一般取为20~100;
G:遗传算法的终止进化代数,一般取为100~500;
Pc:交叉概率,一般取为0.4~0.99;决定是否进行交叉
Pm:变异概率,一般取为0.0001~0.1。
(5)约束条件的处理方法
搜索空间限定法、可行解变换法
3.遗传算法实例
第一步:确定决策变量及各种约束条件(Rosenbrock函数)
第二步:建立优化模型,即确定目标函数的类型及数学描述形式或量化方法;
第三步:确定表示可行解的染色体编码方法,即确定出个体的基因型x及遗传算法的搜索空间;用长度为10位的二进制编码串来分别表示两个决策变量x1,x2。从离散点-2.048到离散点2.048,分别对应于从0000000000(0)到1111111111(1023)之间的二进制编码。
第四步:确定个体适应度的量化评价方法,即确定出由目标函数值J(x)到个体适应度函数F(x)的转换规则;解码时需要将20位长的二进制编码串切断为两个10位长的二进制编码串,然后分别将它们转换为对应的十进制整数代码,分别记为y1和y2。
第五步:设计遗传算子,即确定选择运算、交叉运算、变异运算等遗传算子的具体操作方法;
第六步:确定遗传算法的有关运行参数,即M,G,Pc,Pm等参数;选择运算使用比例选择算子(个体被选中并遗传到下一代群体中的概率与该个体的适应度大小成正比),交叉运算使用单点交叉算子,变异运算使用基本位变异算子。
第七步:确定解码方法(编码时已经可以确定),即确定出由个体表现型X到个体基因型x的对应关系或转换方法。群体大小M=80,终止进化代数G=100,交叉概率Pc=0.60,变异概率Pm=0.10。
4.遗传算法的特点
(1)遗传算法是对参数的编码进行操作,而非对参数本身;
(2)遗传算法同时使用多个搜索点的搜索信息,具有隐含并行性,搜索效率高且不易局限于局部最优解;
(3)遗传算法直接以目标函数(无需导数)作为搜索信息,无需目标函数的导数值等其他一些辅助信息。
(4)遗传算法使用概率搜索技术。
(5)遗传算法在解空间进行高效启发式搜索,而非盲目地穷举或完全随机搜索;
(6)遗传算法对于待寻优的函数基本无限制,因而应用范围较广;
(7)遗传算法具有并行计算的特点,因而可通过大规模并行计算来提高计算速度,适合大规模复杂问题的优化。
四、差分进化算法
1.差分进化算法的优点
待定参数少、不易陷入局部最优、收敛速度快。
2.基本流程
差分进化算法是基于实数编码的进化算法,由选择、交叉和变异三个基本操作构成。标准差分进化算法主要包括以下4个步骤:
(1)生成初始群体
在n维空间里随机产生满足约束条件的M个个体,每个个体n维,M∈[5n,10n],实施措施如下:
其中xijU 和xijL分别是第j 个染色体的上界和下界,randij(0,1)是[0,1]之间的随机小数,i∈[0,M-1]。
(2)变异操作
从群体中随机选择3个个体xp1, xp2和xp3,且i≠p1≠ p2 ≠ p3(不同于目标个体),则基本的变异操作为(待选变异向量)
xp2j(t)- xp3j(t) 为差异化向量,此差分操作是差分进化算法的关键,F为缩放因子,p1 , p2 , p3为随机整数,表示个体在种群中的序号。
如果无局部优化问题,变异操作可写为
xbj(t) 为当前代中种群中最好的个体。由于式(15.13)借鉴了当前种群中最好的个体信息,可加快收敛速度。
(3)交叉操作
交叉操作是为了增加群体的多样性,具体操作如下:
其中 为[0,1] 之间的随机小数,CR为交叉概率,CRϵ[0,1] 。
(4)选择操作
为了确定向量是否成为下一代的成员,试验向量和目标向量对评价函数进行比较。
反复执行步骤(2)至步骤(4)操作,直至达到最大的进化代数。
3.参数设置
(1)缩放因子F(变异因子)
变异因子F 是控制种群多样性和收敛性的重要参数。一般在[0,2]之间取值。变异因子F 值较小时,群体的差异度减小,进化过程不易跳出局部极值导致种群过早收敛。变异因子F 值较大时,虽然容易跳出局部极值,但是收敛速度会减慢。一般可选在F=0.3~0.6 。
(2)交叉因子CR
交叉因子CR 可控制个体参数的各维对交叉的参与程度,以及全局与局部搜索能力的平衡,一般在[0,1]之间。交叉因子CR越小,种群多样性减小,收敛速度越大。CR越大,则变异个体对试验个体的贡献多。但CR过大可能导致收敛变慢,因为扰动大于了群体差异度。根据文献一般应选在[0.6,0.9]之间。CR越大,F 越小,种群收敛逐渐加速,但随着交叉因子CR的增大,收敛对变异因子F 的敏感度逐渐提高。
(3)群体规模M
群体所含个体数量M 一般介于5D与10D之间( D为问题空间的维度),但不能少于4D,否则无法进行变异操作,M越大,种群多样性越强,获得最优解概率越大,但是计算时间更长,一般取20-50。
(4)最大迭代代数G
最大迭代代数G 一般作为进化过程的终止条件。迭代次数越大,最优解更精确,但同时计算的时间会更长,需要根据具体问题设定。
五、专家系统
1.专家系统概述
专家系统是一个智能程序系统:具有相关领域内大量的专家知识;能应用人工智能技术模拟人类专家求解问题的思维过程进行推理,解决相关领域内的困难问题,并且达到领域专家的水平。专家系统所要解决的问题一般没有算法解,并且经常要在不完全、不精确或不确定的信息基础上做出结论。
2.专家系统特点
⑴启发性。专家系统能运用专家的知识与经验进行推理、判断和决策。
⑵透明性。专家系统能够解释本身的推理过程和回答用户提出的问题,以便让用户能够了解推理过程。
⑶灵活性。专家系统能不断地增长知识,修改原有知识,不断更新。由于这一特点使得专家系统具有十分广泛的应用领域。
⑷能根据不确定(不精确)的知识进行推理,善于解决那些不确定性的、非结构化的、没有算法解或虽有算法解但在现有的机器上无法实施的困难问题。
⑸能高效率、准确、周到、迅速和不知疲倦地进行工作;解决实际问题时不受周围环境的影响,既不可能遗漏、忘记又便于推广珍贵和奇缺的专家知识与经验。
3.专家系统类型
(1)按用途分类
可分为:诊断型、解释型、预测型、决策型、设计型、规划型、控制型和调度型等几种。
(2)按输出结果分类
可分为:分析型、设计型、综合型专家系统。
(3)按知识表示分类
可分为:基于产生式规则的专家系统、基于一阶谓词的专家系统、基于框架的专家系统以及基于语义网络的专家系统。也存在相应的综合型专家系统。
(4)按知识分类
可分为:精确推理型和不精确推理型(如模糊专家系统)。
(5)按技术分类
可分为:符号推理专家系统、神经网络专家系统。
(6)按规模分类
可分为:大型协同式专家系统、微专家系统。
(7)按结构分类
可分为:集中式和分布式,单机型和网络型(即网上专家系统)。
4.专家系统的一般结构
从专家系统的概念可知,专家系统的主要组成部分是知识库和推理机。不同的专家系统其功能和结构有可能不同,但一般都应包括人机接口、推理机、知识库、动态数据库、知识获取机构和解释机构这六个部分。
5.专家系统的工作原理
专家系统的核心是知识库和推理机,其工作过程:根据知识库中的知识和用户提供的事实进行推理,不断地由已知的前提推出未知的结论即中间结果,并将中间结果放到数据库中,作为已知的新事实进行推理,从而把求解的问题由未知状态转换为已知状态。在专家系统的运行过程中,会不断地通过人机接口与用户进行交互,向用户提问,并向用户做出解释。
6.知识的获取
(1)非自动知识获取
非自动知识获取方式分两步进行:①由知识工程师从领域专家或有关的技术文献那里获取知识;②由知识工程师用某种知识编辑软件输入到知识库中,其工作方式如图所示。
(2)自动知识获取
自动知识获取就是让计算机自动从环境中获取知识。要实现完全自动的知识获取,涉及机器感知(如计算机视觉与听觉)、机器识别和机器学习等研究领域的问题。
(3)知识获取的步骤
整个知识获取由五个阶段(步骤)构成,即问题识别、概念化、形式化、实现和测试。
7.专家系统的工作原理
系统的控制器主要由知识基子系统和数值算法部分组成。根据专家系统方法和原理设计的控制器称之为基于知识的控制器。按照基于知识控制器在整个系统中的作用,专家控制系统分为:
直接专家控制--控制器向系统提供控制信号,并直接对受控过程产生作用;
间接专家控制--控制器间接地对受控过程产生作用
专家控制系统有知识基系统、数值算法库和人机接口三个并发运行的子过程。知识基系统、数值算法库和人机接口三个并发运行的子过程之间的通讯是通过下列5个“信箱”进行的。
①出口信箱。将控制配置命令、控制算法的参数变更值以及信息发送请求从知识基系统送往数值算法部分。
②入口信箱。将算法执行结果、检测预报信号、用户命令,以及定时、中断信号分别从数值算法、人机接口以及定时操作部分送往知识基系统。
③应答信箱。传送数值算法对知识基系统的信息发送请求的通讯应答信号。
④解释信箱。传送知识基系统发出的人机通讯结果,包括用户对知识库的编辑、查询、算法执行原因、推理根据以及推理过程跟踪等系统运行情况的解释。
⑤定时器信箱。用于发送知识基系统内部推理过程需要的定时等待信号,供定时操作部分使用。
8.数值算法部分
整个算法库主要由辨识和监控、控制算法构成。辨识算法和监控算法:知识基子系统(包含的是定性的启发式知识,进行符号推理)通过数值算法与受控过程间接相连。控制算法:如PID算法、极点配置算法、离散滤波器算法和最小方差算法等,每次运行一种控制算法。
9.知识基系统的内部组织和推理机制
①控制的知识表示专家控制系统是基于知识的系统,系统所包含的知识信息内容可表示如下:
按照专家系统知识库的构造,控制系统的知识可以分类组织,形成数据库和规则库。数据库包括:事实、证据、假设、目标。规则库是专家系统中判断性知识集合及其组织结构。对于控制问题中各种启发式控制逻辑,一般常用产生式规则表示:IF(控制局势)THEN(操作结论)
②控制的推理模型
专家控制系统中的问题求解机制可表示为如下的推理模型:
U=f(E,K,I)
U={u1,u2,…um}为控制器的输出作用集;E={e1,e2,…en}为控制器的输入集;K={k1,k2,…kp}为系统的数据项集;I={i1,i2,…iq}为具体推理机构的输出集.
f为一种智能算子,它一般可表示为:
IF E AND K THEN (IF I THEN U)
即根据输入信息E和系统中的知识K进行推理,然后根据推理结果I确定相应的控制行为U。就是利用前述知识库中知识,结合输入,判断后实现控制。
③知识基系统的组成
知识基系统主要由一组知识源、黑板机构和调度器三部分组成。
黑板模型是一种高度结构化的问题求解模型,用于“适时”问题求解,即在最适当时机运用知识进行推理。能够决定什么时候使用知识、怎样使用知识。
知识源是与控制问题子任务有关的一些知识模块,可以把它们看作是不同子任务问题领域的小专家。每个知识源都具有比较完整的知识库结构。
调度器的作用是根据黑板的变化激活适当的知识源,并形成有次序的调度队列。激活知识源可采用串行或并行激活方式。
原文地址:https://blog.csdn.net/qq_63129682/article/details/143838495
免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!