1 什么是自适应控制器

定义:具有“结构或参数整定机构”的控制器。例如:变参数 PID 控制器;
1.  形式上:自适应控制律是非线性或线性时变控制律;
2.  效果上:是一种可以根据环境(包括噪声、干扰)以及被控对象自身的变化(参数、结构的变化)而自动调整控制器结构或者参数以期减小甚至消除这些“变化”对“控制性能”影响的控制器。

2 为什么要改变控制器的参数结构

a “ 不改不行”:“被控对象自身”或“环境”发生了很大的改变,以前的控制律“可能”已经无法使系统“稳定”工作。例子:

 

 

 b 由于参数或结构不确定性的存在,初始设计的控制律参数不能够达到理想的控制性能,为了提高“控制性能”需要进一步修正控制律结构或参数;

3 和鲁棒控制的异同
 鲁棒控制:以不变应万变;
 自适应控制:以变制变;

4 发展历史

重点:模型参考自适应控制:1958年,首次由MIT提出,被称为“MIT”方案(稳定性难于保证)

5 自适应控制系统的分类

自整定调节器(Self-tuning Regulators(STR))

   a 不同设计方法 + 不同辨识方法 = 多种自适应方案;
   b. 设计时没有基于稳定性的考虑,缺乏“从顶至下”的整体设计方案。

双重控制(Dual Control )
a. STR中,估计环节只给出了模型参数的估计值,并没有给出估计值的准确程度;
b. DC方案给了模型参数估计值的准确程度,“认为精度很低时”,会重新产生信号激励系统,以便于获得准确的模型参数估计值

模型参考自适应系统(Model-Reference Adaptive Systems)

起源:飞行器控制,模型描述的是理想状态下飞行器对操纵杆的响应。
关键:调参机制
1. 参数最优化设计方法;(MIT方案)
2. 基于Lyapunov稳定性理论的设计方法;
3. 基于Popov超稳定性理论的设计方法。

增益调度系统(Gain Scheduling)

思想:利用辅助变量测出环境或者被控对象自身的变化,比如“增益”的变化,然后利用控制器补偿这种“增益”变化所引起的控制系统性能的降低。
实现:通过“函数设定”或“查表法”,又称为增益列表补偿法
应用:飞行器控制(X-15型战机),飞行马赫数飞行高度作为调度变量。

无模型自适应控制系统

“控制器的设计仅利用受控系统的输入输出数据,控制器中不包含受控过程数学模型的任何信息的控制理论与方法”。

强化学习自适应控制(Reinforcement learning adaptive control),智能体(agent)采取一定的行动 (action) 和环境进行交互作用,环境给智能的“行动”给以“回报”。目标是寻求“最优策略”来最大化“累计汇报”。不需要环境的精确模型信息。

迭代学习控制 (Iterative learning control) 和重复控制(repetitive control) 等。解决“可重复过程”的轨迹跟踪控制问题,比如进行重复操作的机械手”;要求系统能够精确的重复同样的动作;借用前一次动作执行的信息,在后一次任务的重复过程“更新”,控制器参数,依此类推,通过反复的修正,最终达到完美跟踪。

去伪控制(unfalsified control) 基本思想 :该方法首先构造一个满足性能指标的可行控制器参数集合,然后基于新数据迭代地别是否满足此性能规格。当新量测到的数据否定掉目前使用的控制器之后,控制器便会自动地切换到新的控制器。

6 什么是系统辨识

机理分析建模方法 (白箱法

问题:
(1) 效率低:随着系统复杂程度的增加,建模过程愈加复
杂;
(2) 某些物理参数需要进一步确定;
(3) 不方便“计算机”在线决策

系统辨识法(黑箱法

能否根据“输入、输出数据” 获取“被控对象”的“数学模型

 机理分析法+ 系统辨识法 

7 系统辨识方法的基本分类

1.  参数辨识方法
a.  经典辨识方法
阶跃响应法;
脉冲响应法;
频域响应法;
相关分析法;
谱分析法

b.  最小二乘类参数辨识方法 ※
最小二乘一次性算法;
最小二乘递推算法;
增广最小二乘算法;
广义最小二乘算法

c. 极大似然法和预报误差方法
d. Bayes 方法
e. 模型参考自适应方法
f. 状态子空间辨识方法

2.  结构辨识方法
a. 根据Hankel 矩阵的秩估计模型的阶次; ※
b. 利用行列式比估计模型的阶次;
c. 利用残差的方差估计模型的阶次;
d. 利用Akaike准则估计模型的阶次;
e. 利用最终预报误差准则估计模型的阶次。

8 辨识的基本要素

1. 输入输出数据(辨识的基础)
必须包含有关系统特性的足够信息
时域的角度:信号变化剧烈,且呈现非周期性;
频域的角度:频谱宽。
2. 模型类
3. 准则
评判“辨识得到的模型”是否满足“实际需要”的一个“准则”。
辨识就是按照一定的准则从某一类模型中找出一个与输入输出数据拟合得最好的模型。

热交换系统的例子:

8 模型简介: ARX 模型结构 ARMAX 模型结构 ARARX  模型结构  ARARMAX 模型结构  Output Error Model Structure (OE model structure)输入u与 与  未受测量噪声干扰的输出 之间的描述 Box –Jenkins Model Structure A General Family of Model Structures

 

9 最小二乘参数辨识标准算法

是以“偏差的平方和最小”为指标,在“线性函数”这一类函数中找到的最优解。如果函数类扩大到“非线性”方程,有可能找到一个使
“偏差的平方和”更小的方程

 

开环可辨识性条件对实践的指导:
辨识信号不能任意选择,否则会造成不可辨识。常用的信号有:
(1). 白噪声序列
(2). M 序列或逆M 序列
(3). n 种频率的正弦信号的组合成的信号,但是各个频率不能满足整数倍关系。
注:在推导最小二乘法的结果时,并不需要考虑噪声的统计特性。但是在评价最小二乘估计的性质时,需要用到噪声的统计特性。

仿真结论:
1 .最小二乘算法既可以应用到“稳定对象”也可以应用到“不稳定被控对象”;对于自身不稳定的对象进行辨识时,特别对于实际的不稳定对象,测试时要注意不能使系统太远离平衡位置,以免超出线性方程所能描述的范围,而实际情况,这一点很难保证;
2 .噪声的方差对辨识精度影响很大,其影响程度对不同的被控对象有所不同。

加权最小二乘:

10 最小二乘估计的递推算法

最小二乘标准算法的不足:
– 不方便用于“在线”辨识,不方便用于“慢时变”的被控对象;
计算量很大,占用大量硬件资源(内存);
– 许多计算都是重复的。

递推算法与卡尔曼滤波之间的联系

11 渐消记忆与限定记忆最小二乘法

数据饱和现象:
直观上,随着采集到的数据越来越多,递推最小二乘法应该给出更精确地参数估计值。但实际上,随着迭代次数增加,“估计值”与“真实值”的偏差往往会愈来愈远。

解决的方案
1. 增加“新数据”在计算中的权重,减小“老数据”在计算中的权重——渐消记忆法;
2. 去掉一部分老数据——限定记忆法;

仿真结论:
1. 渐消记忆法在一定程度上克服了“数据饱和问题”。该算法对于“慢时变系统的辨识问题”比一般递推算法更有效。
2. 遗忘因子对辨识精度有显著影响,需要适当选取。

仿真结论:

限定记忆法可以有效改善数据饱和现象,可在很大程度上改善递推最小二乘算法的性能。但是,如何有效的确定N是一个值得思考的问题。

进一步应用“求逆引理”展开可以推导得到相应渐消记忆递推最小二乘算法。渐消记忆最小二乘方法是一种加权最小二乘方法。

进一步应用“求逆引理”展开可以推导得到相应“限定记忆”递推最小二乘算法。

12  最小二乘解的几何意义及其统计特性

重要:

问题:什么情况下 和 是统计独立的?
a. 静态线性系统的回归分析中。
b. 动态系统的参数辨识中,最小二乘估计值是有偏估计。

13 最小二乘算法的缺陷以及广义最小二乘法

噪声序列一般是相关的,所以“一致性”中的假设“噪声项不相关”一般并不成立。

增广矩阵最小二乘方法

广义最小二乘:由于迭代过程中,很难做到完全白色化,辨识结果则往往也难以收敛到真实的参数。

14 模型阶次的确定方法

 

 

 

 

 

 15 随机自适应系统

 “分离原理”:对参数未知的控制对象,可用参数的“实时估计”代替最优控制中“参数的真值”,使估计和控制分开进行。

间接自适应算法 (Indirect adaptive algorithm):估计“被控对象参数”, 通过估计出来的被控对象的参数来更新控制器参数。

直接自适应算法  直接更新控制器参数。

自校正调节器补充说明
对于慢时变被控对象,对参数的估计需要采用带“遗忘”性质的辨识算法,如“渐消记忆”和“限定记忆”算法;不适用于非最小相位系统;为了达到输出方差最小,必须有极大的控制信号。“自校正调节器”的控制效果能否实现“最小方差控制器”的效果?

16 模型参考自适应控制器——MIT 方案

关键:调参机制。
1. 参数最优化设计方法;(MIT方案)
2. 基于Lyapunov稳定性理论的设计方法;
3. 基于Popov超稳定性理论的设计方法。

工程上的启示 :可以用一个控制律控制不同参数的被控对象,例如,负载变化的电机系统。

仿真总结:系统的响应特性和输入信号的幅值有关系。具体来说系统的稳定性问题变复杂,需要深入研究。

 结论:增大自适应系数的值,会加速收敛过程,但系统稳定性无法保证。

误差和参数收敛之间的关系:“误差e趋于零”并不意味着参数一定能收敛到所谓的“正确值”。要想使参数收敛到所谓的“正确值”,则要求输入信号具有一定的特性,即,输入信号不能是任意形式的。

MIT 方案思路简洁,依据梯度优化原理,选取自适应系数时有一定的理论依据,但缺乏系统的严格的稳定性分析方法

17 基于Lyapunov 稳定性理论设计模型参考自适应控制器

什么是Lyapunov 意义下的稳定性?
平衡点的概念:
物理概念(倒立摆、曲面上的球、平面上的球、用铰链
平分一个均质杆);数学概念;
稳定、渐进稳定的概念:物理上,数学上。
稳定、一致稳定、一致渐进稳定的概念。

 

 

 

 18 白噪声及伪随机序列的基本概念及性质

 

 

 

 

 

 

 

 

 

 谱密度:

 

 

 

 

 

 

 

 

 

 

 

 

 

M序列:

 

 

 

 

 

 

 


历年期末常见:

1 为什么采用负反馈控制技术?

闭环控制系统把被控制的量与设定值之间的偏差送回来参加控制器的运算,进一步调整输出去纠正偏差。没有反馈不知道调节的结果,没有反馈不是闭环系统。负反馈可以稳定系统输出性能,正反馈不能。

2 什么是自适应控制,为什么,以及应用场合?

见上文

3 系统辨识的基本要素,并予以解释

数据:由观测实体而得。不唯一,受观测时间、观测目的、观测手段等影响。

模型类:规定了模型的形式。不唯一,受辨识目的、辨识方法等影响。

准则:规定了模型与实体等价的评判标准。不唯一,受辨识目的、辨识方法等影响。

4 标准最小二乘参数辨识方法的准则函数,以及各项含义

见上文

5 无偏性与一致性的含义,什么条件下最小二乘参数一致收敛?

6 什么是白噪声,白噪声的时域频域特点。

功率谱密度为常数的随机信号。噪声的功率谱密度在所有频率上均为一常数,则称为白噪声。

7 谱密度的概念,以及为什么引入此概念

 

 

 

8 数据饱和现象以及如何解决?

见上文

9 M序列的概念,选用M序列原则

 

 

 

最长线性反馈移位寄存器序列的简称。

10 最小相位系统的幅频特性

11LPV系统

线性变参数系统(Linear parameter-varying systems)又称线性时变系统,即同时满足线性系统和时变系统特征的系统,它满足系统叠加性与均匀性的特点,同时,当系统中某个参数值随时间而变化时,整个特性也随时间而变化。线性时变系统的主要表示方式有状态方程和结构图,它的主要特征有能控性、能观性和稳定性分析。

12 气体与压力题

最小二乘法 

更新:考完,与往年题型类似(甚至就是原题),前面以概念题为主,计算题有线性化,一步预测,递推最小二乘,MIT框图