一、最优控制、最优控制系统(论文文献综述)
耿远卓[1](2021)在《敏捷航天器凝视观测任务规划及最优姿态控制》文中认为随着对地遥感任务越来越复杂,航天器在一个轨道周期需要对多个目标进行凝视观测。同时,航天器的机动能力不断提升,从非敏捷航天器发展为敏捷航天器,具备了三轴姿态快速机动能力。如何充分利用航天器的姿态机动能力,实现对更多目标的观测,对于提升对地观测效率至关重要,是未来遥感卫星发展的重要方向。另一方面,航天器携带燃料有限,提高航天器的姿态机动效率,以较低的能量消耗完成姿态转移,是延长航天器在轨运行寿命的重要途径。因此,本论文将以敏捷航天器为研究对象,针对多目标凝视观测任务,探索高效的任务规划技术,提出复杂度低、优化能力强的最优控制方法,旨在提升航天器的观测效率,增强遥感卫星在有限时间内的观测能力。针对凝视观测任务特点,提出一种新的姿态描述方式。与传统的推扫模式不同,凝视观测只需要光轴指向目标,而绕光轴的姿态任意,因此,其终端期望姿态是二维的。为了表征期望姿态,分别采用欧拉角、四元数等方式构建凝视观测的末端姿态约束集,并深入探讨各种描述方式的特点。考虑到以集合的方式表征末端期望姿态不利于控制器设计,本文提出一种新的凝视误差表征方式,直接以光轴和目标矢量夹角作为误差变量,并建立误差运动学方程。对于多目标观测任务,提出一种智能可靠的任务规划算法,旨在自主、可靠地决策目标观测序列及开始观测时刻,该序列将作为后续姿态控制的期望指令。第一步,通过团划分算法将密集点目标聚类,形成较少数量的团目标。进而提出一种启发式蚁群算法,通过在蚂蚁寻优策略中引入启发因子,综合考虑目标优先级和可见时间窗口的信息,从而增强蚂蚁的寻优能力,降低算法收敛时间。在蚁群算法中,由于需要预估航天器观测不同目标的姿态转移时间,本文提出一种新颖、精准、简便的最短姿态机动时间计算方法,在控制力矩约束下,显式给出最短姿态机动时间与姿态机动角度的函数关系,从而解决了传统时间最优解对数值解法的依赖,大幅提升算法效率。航天器在不同目标之间的敏捷姿态指向机动是实现高效观测的重要保障,面向该过程的最优性及抗干扰能力需求,以任务规划得到的目标观测序列作为期望指令,提出基于逆最优和滑模控制的复合控制策略,驱动航天器按照既定观测序列实现高精度、高稳定度的姿态指向。分别建立线性和终端滑模面,并构造合适的CLF(Control Lyapunov function)函数,使得传统CLF控制的切换条件与滑动模态形式相符。当系统状态距离滑模面较远时,采用传统的CLF控制,驱动系统状态朝向滑模面运动,以此来提升系统的最优性;一旦状态到达滑模面附近,则切换为滑模控制,使得状态沿滑模面收敛至原点,从而保证系统的抗干扰能力。由于航天器需要按照事先规划出的序列和时间对目标进行观测,而上述有限时间控制方法只能保证航天器在固定时间内完成姿态机动,而实际收敛时间与期望时间差异较大。针对该问题,本文提出两种指定时刻能量高效姿态机动方法,旨在实现航天器在特定时刻指向特定目标。第一种方法为滑模控制参数自整定策略。将传统的滑模趋近律替换为常值角加速度控制,使得航天器绕欧拉转轴定轴旋转,直到状态到达滑模面,之后切换为滑模控制。该方法显式建立了控制参数和姿态机动时间的函数关系,并能根据期望的收敛时间反解控制参数。第二种为基于SDRE(State-Dependent Riccati Equation)理论的最优控制方法。考虑到航天器与目标存在相对运动,航天器在指向目标后仍需要一定的角速度进行姿态跟踪,因此,本文基于SDRE方法,提出一种考虑非零末端角速度约束的指定时刻姿态跟踪方法,并且在传统SDRE方法基础上,引入路径点,有效提升算法的求解速度和准确度,最终实现航天器在指定时刻以特定角速度指向特定目标。
朱英俊[2](2021)在《时标随机最优控制问题》文中指出为了统一处理连续时间问题和离散时间问题,1988年,Hilger在他的博士论文中创建了 Time Scales(以下称为时标)理论。在此之后,时标理论凭借其优良的时间结构特性及广阔的应用前景,得到了人们的持续关注及深入研究。现实中有许多过程的时间变量既不是经典的连续时间,也不是均匀离散时间,例如,一个由电阻、电容及自感线圈所组成的简单串联电路,当电容以固定频率作周期闭合时,电路中电流的变化率正好可以用时标上的导数来描述。时标理论所定义的时间尺度适用范围更广,可行性更强,近年来受到了广泛关注。同时,实际控制系统都带有随机因素,在很多情况下,这些因素不可忽略。因此,研究时标框架下的随机最优控制问题具有重要意义,尤其是处理时间变量结构复杂的问题。本文首次较为深入和系统地在时标体系下研究随机Δ-微分系统的最优控制问题。相比于经典连续时间和离散时间情形,时标最优控制问题的研究,不仅有助于统一建立包含连续时间和离散时间情形在内的最优控制理论,从而避免连续时间和离散时间之间的重复性研究以及更好地了解这两类不同系统之间的区别及联系,而且对实际优化问题中遇到的时间尺度既包含连续时间区间又包含离散时间孤立点集的动力控制系统提供一定的理论指导。我们主要研究了两类随机最优控制问题,一类是时标随机线性系统的最优控制问题,分别研究了随机线性二次最优控制问题和平均场型随机线性二次最优控制问题。另一类是时标非线性随机系统的最优控制问题,建立了动态规划原理和最大值原理。关于本文的主要内容,概要如下:第一章,主要就本论文所涉及问题的研究背景及研究内容展开深入介绍。第二章,主要介绍时标理论体系的有关内容,为后面研究内容做数学准备。第三章,由时标随机线性控制系统出发,探讨二次型代价泛函的最优控制问题。为解决此问题,在时标体系下建立了关于随机过程的乘积法则,且通过完全平方方法引入Riccati Δ-微分方程(RΔE)及一个辅助的线性方程,在一定条件下,给出了最优控制的线性反馈形式。受此启发,进一步研究了时标平均场随机线性二次最优控制问题。相较于已有的时标最优控制问题所不同的是,控制系统及代价泛函中均包含状态和控制的期望项。针对状态方程,用迭代法证明了其解的存在唯一性。通过耦合RΔEs的解,给出了该问题最优控制的反馈表达形式。另外,我们对RΔEs解的存在唯一性问题进行了讨论,并给出了 RΔEs可解性的充要条件。第四章,我们研究了随机非线性Δ-微分系统最优控制问题的动态规划原理。为解决该问题,在时标体系下给出了复合函数链式导数的定义并建立了多元函数的链式法则。以此为基础,重建了关于时标随机过程的伊藤公式,进而借助伊藤公式得到随机最优控制问题的最优性原理和值函数满足的Hamilton-Jacobi-Bellman(HJB)方程。值得注意的是,本文得到的HJB方程比以往研究中出现的相关HJB方程,在形式上要更加复杂,其是一个带期望的二阶偏Δ-微分方程,原因是离散点出现的时间间断导致此方程包含期望。进一步,将所得时标动态规划原理的结果应用在时标随机线性二次最优控制问题的研究中。第五章,考虑了两类时标随机非线性控制系统,并分别给出了对应的最大值原理。一类是随机Δ-微分系统的最优控制问题。在假设控制域是凸集的情况下,通过乘积法则建立对偶关系,从而推导出伴随方程的合适形式,进一步利用变分法并给出时标最优控制问题的最大值原理。其结果退化到离散时间情形下,形式上与传统离散时间情形的结果并不一致,针对这种不一致现象,我们分析并证明了两种结果的等价性。此外,给出了所得时标随机最大值原理在时标随机线性二次最优控制问题中的应用。另一类是受控系统由一个带有条件期望的随机Δ-微分方程(SΔE)给出。我们先由迭代法给出了此类SΔE解的存在唯一性,相较于已有的此类方程的结果,我们研究的方程包含更复杂的条件期望项。用凸变分方法给出了控制系统的变分方程以及一些相关估计,这就使得我们可以推导出变分不等式。随后,利用对偶关系给出了变分不等式其等价形式的伴随方程,借助变分不等式的等价形式及其等价形式的伴随方程,本文就得到了最优控制满足的必要条件—最大值原理,其结果退化到离散时间情形下,也是一个新的结果。第六章,我们将得到的理论结果应用于金融数学问题和季节性种群模型。在金融数学中的一个基本问题是投资策略的构建,其中均值-方差投资组合模型是一类被广泛研究的投资策略。对经典连续时间和离散时间的均值-方差投资组合模型,重构在时标体系下的模型。季节性蚊虫数量的变化规律兼具连续和离散特征,因此在时标体系下建立蚊虫种群密度的控制模型。结果显示,在休眠期开始时施加脉冲控制能够减少来年蚊虫的种群密度。
李彩肖[3](2021)在《时滞离散控制最优性的必要条件》文中指出最优控制这一思想已经伴随人们的生活很多年了,一直在无形中影响并指导着人们的生产和生活,只是在很长的时间内最优控制没有形成理论,直到上世纪40年代,维纳在[42]中第一次提出了最优设计的概念,控制思想开始以理论的形式呈现在人们面前.60年代,人们首次明确提出了状态空间模型的标准形式,最优控制理论取得了前所未有的发展.在工程、生物和经济等领域的最优控制问题中数学模型往往是离散的,我们在用计算机解决连续控制问题时也需要将连续问题离散化.因此,离散控制问题日益得到国内外理论界的特别关注.目前,解决离散控制问题的方法主要有动态规划法和庞特里亚金最大值原理.贝尔曼[43]在1957年提出了动态规划方法,动态规划方法有着较为广泛的适用范围,但是在使用动态规划方法时需要考虑以下两个方面的问题:一个问题是当变量维数较大时,计算量和存储量将远超计算机的承受范围,从而造成“维数灾难”;另一个问题是动态规划是在贝尔曼最优化原理的基础上建立起来的,这一原理决定了多阶段决策过程的“无后效性”,即未来的决策只由现在的状态来决定,与过去的状态无关.1962年,庞特里亚金等人在[44]中基于凸性条件提出了最大值原理,并且给出了最优控制问题的标准化的数学描述,从而在很大程度上推动最优控制理论研究的全面发展.Misir J.Mardanov和Samin T.Malik在[1]中研究如下的时滞离散控制系统:S(u(·))=Φ(x(t1))→(?)#12其中t为离散时间,t0为给定初始时刻,t1为给定的终止时刻,h>0,t1-t0>h.定义了弱凸性条件,通过假设容许控制集在t+h时刻满足凸性条件,而在t时刻不满足,从而在弱凸性条件下得到庞特里亚金最大值原理的离散模拟,具有较为广泛的适用性.本文是在Misir J.Mardanov和Samin T.Malik所得结果的基础上进行进一步研究,本文考虑了一个具有控制时滞的离散优化问题,在输入数据满足一定凸性和平滑性假设的前提下,考虑离散系统的特殊性质,得到一个用哈密顿函数表示的必要最优性条件.并且在凸性假设和线性化假设的前提下,得到了欧拉型必要最优性条件和线性化离散最大值原理.本文是基于最大值原理进行研究的,但是本文对于凸性的要求较最大值原理要更弱一些,因此适用性更为广泛.本文共含有以下五章的内容:第一章主要给出了时滞离散最优控制问题的模型,并且介绍了该理论的研究现状.第二章主要介绍了哈密顿函数和辅助矩阵函数Ψ0(t),以及如下的时滞离散最优控制系统模型:S(w(·))=(?)f0(x(t),u(t),u(t-h),t)→(?)#12其中x0为初始状态.并对上述最优控制问题进行变形,将其转化为终端型时滞离散最优控制问题.第三章主要研究当容许控制u0(t),t∈Ih在点θ∈Ih处发生变化变为以下形式时所对应的目标泛函的增量公式:#12并且介绍了离散时滞系统的控制u0(t),t∈Ih是最优控制的必要条件.同时给出了当状态方程右端函数f(x(t),u(t),u(t-h),t)和函数f0(x(t),u(t),u(t-h),t)关于x(t)满足线性条件时,容许控制u0(t),t∈Ih是最优的必要性条件.第四章给出一些例题来说明上述必要性条件的广泛实用性.第五章主要对本文进行总结并且对未来发展给出了一些期望.
赵军[4](2021)在《基于自适应动态规划的机器人系统鲁棒控制研究》文中研究说明机器人是智能制造系统的重要组成单元之一,也是支撑我国制造产业转型升级的重要装备。由于机器人在运行过程中总是受到外界的干扰,在系统建模过程中也往往存在不确定性,因此对机器人系统开展鲁棒控制研究以确保存在建模误差和外界干扰情况下的高性能控制就显得尤为重要。目前,针对机器人的非线性系统鲁棒控制存在求解困难的理论难题。针对上述需求,本论文将以串联型工业机器人为例,探索其鲁棒控制器设计以及在线求解方法,从而降低控制系统设计对机器人精准建模的要求,提升机器人系统的综合性能,并针对典型的机器人系统开展仿真验证和实验研究。论文旨在为机器人控制系统设计提供新的思路,并解决鲁棒控制在线求解的科学难题。本课题的主要研究内容如下:(1)基于自适应动态规划的机器人鲁棒控制。首先以经典的PUMA560系列机器人为例,介绍串联机器人动力学模型构建方法,并介绍了实验室自主设计的一款SCARA机器人平台,分析了机器人系统模型中存在的不确定性以及模型转化方法。在此基础上,给出机器人鲁棒控制问题描述,研究将不确定机器人系统鲁棒控制问题等价为标称系统最优控制问题的途径,给出通过求解最优控制问题间接得到鲁棒控制问题解的新思路。最后,为实现最优控制问题的在线求解,引入自适应动态规划(Adaptive dynamic programming,ADP)方法使用神经网络在线逼近最优方程的解,并设计了一个新的基于参数估计误差驱动的自适应律在线更新神经网络权值,保证了最优控制解及神经网络权值的收敛性。该方法摒弃了传统ADP结构中执行神经网络(Actor NN)的使用,降低了计算量。(2)基于自适应动态规划的机器人鲁棒跟踪控制。由于机器人的轨迹跟踪精度是确保机器人工作性能的重要指标,故研究了基于最优控制的机器人鲁棒跟踪控制器设计和在线求解。首先,将不确定机器人系统的鲁棒跟踪控制问题等价为标称系统的最优跟踪控制问题。为实现跟踪控制,传统最优跟踪控制一般将原控制分为稳态控制与瞬态控制两部分分开设计。不同于该思路,本文融合跟踪误差动态与参考轨迹动态构造增广系统,实现可一步求解的最优跟踪控制问题,并引入折扣因子保证性能指标函数的有界性。为实现最优控制在线求解,基于ADP思想引入神经网络在线逼近最优性能指标函数,并设计了相应的自适应律完成神经网络权值和最优控制在线更新,进而得到鲁棒控制解。(3)基于输入/输出数据驱动的机器人输出反馈鲁棒控制。现有的鲁棒和最优控制算法大多需要完整的系统状态,但在机器人运行中部分状态(如:加速度)是不可测的,这限制一些先进控制算法的实际应用。为实现机器人输出反馈(仅需关节运动位置信息)鲁棒控制,提出将不确定系统输出反馈鲁棒控制问题等价为标称系统的输出反馈最优控制问题,进而避免了传统观测器的设计。使用输入/输出数据即可重构输出反馈的最优黎卡提方程(Modified algebraic Riccati equation,MARE),并使用克罗内克积和向量化操作将MARE写为线性参数化形式。为实现MARE的在线求解,设计一个基于输入/输出数据驱动自适应律来实现对MARE中未知参数的估计。考虑到求解过程中系统维数过高的问题,引入降维操作保证了在线学习的可行性。(4)基于输入/输出数据驱动的机器人输出反馈鲁棒跟踪控制。进一步研究输出反馈鲁棒跟踪控制问题,融合参考轨迹信号与系统状态构造增广系统,其输出为参考轨迹与实际输出轨迹的误差。进而将不确定增广系统输出反馈鲁棒跟踪控制问题等价为标称增广系统输出反馈最优跟踪控制问题,引入折扣因子构造有界最优性能指标函数,得到新的输出跟踪黎卡提方程(Modified tracking algebraic Riccati equation,MTARE)。为实现该MTARE的在线求解,引入基于参数估计误差设计自适应律,保证了未知估计参数的收敛性,最终实现输出反馈控制律的在线求解。在完成理论研究的同时,以经典的PUMA560工业机器人模型为对象开展对比仿真验证。同时,在实验室自主设计了一款SCARA机器人实验平台对上述理论研究成果进行了实验验证。仿真与实验结果均表明,所提出的控制算法在机器人控制过程中具有收敛速度快、能耗低,且能克服建模误差的优势。实验结果也验证了所提控制方法的优越性和潜在的工程实用性。所提出的鲁棒控制和在线学习算法可进一步应用于其它类型工业机器人甚至智能机器人控制器设计中。
吴冰[5](2021)在《自主泊车的最优轨迹规划与跟踪控制研究》文中研究说明近些年来,国民经济的快速发展使得汽车保有量急剧增加,引发了众多能源环境问题和交通问题。无人驾驶系统和智能交通系统是解决这些问题的可行方案,该领域的相关技术是当前的研究热点并已取得一定突破,但受到技术瓶颈和法律法规等因素的限制,仍难以在实际场景中得到全面应用,需要不断完善和提高。自主泊车技术是无人驾驶技术的重要构成部分,泊车环境的复杂化导致泊车难度增加,使得对泊车技术应用的诉求逐渐强烈。另外,泊车工况具有场景较为固定和行驶速度较低的特征,也使得该技术的研究成果较易落地应用。因此,针对自主泊车技术的研究有很高的实际意义和研究价值。本文以单车自主泊车场景和自主代客泊车场景为研究对象,对自主泊车轨迹规划和跟踪控制进行深入研究。具体研究内容如下:(1)针对单车在局部环境泊车场景中的轨迹规划问题,采用最优控制问题形式进行描述,建立包含加速度和转向盘转速限制的车辆运动学模型以及车辆自身运动特性约束,根据泊车场景建立泊车过程中的环境约束和车辆避撞约束,构建单目标或多目标的性能指标函数。采用伪谱法对最优控制问题的状态变量和控制变量在配点处进行离散化处理,将其转化为非线性规划问题并进行求解,从而获得最优泊车轨迹以及控制序列。(2)为了提高轨迹规划最优控制问题求解的精确性和收敛速率,在求解过程中不满足精度要求时,采用hp自适应伪谱法根据计算误差对时域内配点数和时域个数进行动态调整。为了进一步提高算法计算速率,根据人工泊车经验对泊车场景区域进行分割,提出了基于分段伪谱法的自主平行泊车轨迹规划策略,对不同区域分别构建轨迹规划最优控制问题以减少约束规模。针对垂直泊车场景中泊车位宽度较为狭窄导致泊车轨迹规划困难的问题,提出了同伦法与伪谱法相结合的轨迹规划算法,采用同伦法构建约束函数和包含简单约束最优控制问题,在迭代求解过程中逐渐逼近原问题以获得原问题的最优解,其中采用较简单问题的解作为初值来提高求解的收敛性。为了满足实际应用时的实时性要求,根据离线求解获得最优轨迹来构建在线求解的初值数据集以提高求解收敛速率,仿真结果表明,该策略下计算耗时仅需要1s左右,满足自主泊车轨迹规划实时性要求。在此基础上提出了基于自由采样频率下的泊车轨迹重规划策略,结合最优初值完成在线轨迹规划。(3)对自主代客泊车场景下车辆全局轨迹规划问题进行研究,在传统A*算法中引入动态启发式函数,根据车辆周围环境对启发式函数中的权值进行调整,通过减少搜索过程中扩展节点数目以加快计算速率并获得可行路径。在该路径的路点间构建轨迹规划最优控制问题并采用伪谱法进行离散化求解,考虑到存在因局部路点间路径曲率过大,不满足车辆运动学约束而导致轨迹规划失败,提出了分段回溯迭代策略以提高迭代求解的成功率。另外,对于该场景中多车运动轨迹的冲突问题,提出了基于启发式初值的最优控制问题计算框架,根据车辆之间的冲突时域,采用集中式控制方式构建多车协同运动轨迹规划问题,通过缩减协同控制区域范围以减小离散后的约束规模,从而降低运算复杂度。(4)根据求解获得的泊车最优轨迹作为参考轨迹,采用模型预测控制理论设计泊车轨迹跟踪控制器,建立车辆线性时变运动学模型对未来状态进行预测,以状态误差和控制增量最小为预测时域内的目标函数,并对该时域内局部最优控制问题进行求解,获得最优车速和转向盘转角以实现泊车轨迹的跟踪控制。针对泊车轨迹曲率较大以及参考轨迹长度有限,提出了基于轨迹参考速度的预测时域长度动态调整策略,以解决在跟踪过程中末端轨迹参数失配而导致无法跟踪的问题。(5)搭建自主泊车实车试验平台,基于嵌入式平台开发泊车控制器,对采用本文提出的轨迹规划算法获得的最优泊车轨迹有效性进行验证。基于Car Sim和A&D5436搭建驾驶模拟试验平台并构建虚拟仿真场景,通过硬件在环试验验证了多车协同运动轨迹规划和泊车轨迹跟踪控制算法有效性。
刘晓敏[6](2021)在《非线性双时间尺度系统自学习优化控制》文中进行了进一步梳理非线性双时间尺度(Two-Time-Scale,TTS)系统是一种包含快变、慢变动态的复杂系统,广泛存在于过程工业、航空航天、智能电网等领域。由于系统的高阶特性和快慢动态耦合,在性能分析和控制器设计过程中可能出现高维和病态数值问题。同时,实际系统普遍存在的时滞、扰动、未建模动态等问题,给非线性TTS系统的分析和设计带来重大挑战。已有鲁棒控制、最优控制方法对扰动信息或模型动态信息的依赖程度高,缺乏自学习能力。因此,研究非线性TTS系统的自学习优化控制方法具有重要意义。本文将奇异摄动理论与逆最优控制、滑模控制以及强化学习等方法结合,提出一系列自学习优化控制算法,可有效克服高维和病态数值问题。本文主要研究成果如下:(1)针对一类具有时滞的非线性TTS神经网络,提出稳定性判据和逆最优同步控制方法。首先,针对具有多时变时滞的非线性TTS神经网络,通过构造一个与时间尺度参数ε相关的时滞依赖Lyapunov-Krasovskii泛函,建立系统渐近稳定的充分条件,并且给出稳定界的估计方法。然后,针对具有常时滞的非线性TTS神经网络,通过构造一个依赖时间尺度参数ε的控制Lyapunov函数,并将Hamilton-Jacobi-Bellman(HJB)方程和逆最优技术相结合,提出状态反馈最优同步控制方法,有效避免了病态数值问题。最后,通过数值例子仿真说明所提出的稳定性判据保守性小,所设计的同步控制器能够使两个系统同步速率更快。(2)针对一类具有未知扰动的TTS系统,提出基于自适应滑模控制的扰动抑制方法。首先,引入块对角化方法对全阶系统进行分解,得到解耦的快、慢子系统模型。然后,构造等效输入扰动对未知扰动进行估计。基于降阶子系统模型,利用Lyapunov方程构造组合滑模面。结合等效输入扰动估计,设计自适应滑模控制器,并证明满足可达性条件。设计过程可避免高维和病态数值问题。最后,通过磁带系统仿真验证所提控制方法能够在不知任何先验扰动信息的前提下,自适应地补偿扰动所带来的不利影响。(3)针对一类慢动态未知的非线性TTS系统,提出基于强化学习和T-S模糊方法的组合优化控制方法。首先,运用奇异摄动理论,将原始最优控制问题转化为两个降阶子问题。然后,为解决慢子问题,引入非线性坐标转换处理未知非标准型慢效用函数,提出基于强化学习的慢控制器设计算法。考虑快子系统的慢时变特性,建立T-S模糊快模型,采用并行分布式补偿方法设计快控制器。在考虑多源近似误差的情况下,证明慢控制器设计算法的收敛性、组合控制器的次优性和闭环系统的稳定性。设计过程可有效避免高维和病态数值问题。最后,通过数值例子和电机系统仿真说明在慢动态未知的情况下所设计的组合控制器与最优控制器之间是O(ε)程度近似的,且能够使闭环TTS系统渐近稳定。(4)针对一类动态完全未知的非线性TTS系统,提出基于强化学习的降阶优化控制方法。首先,运用奇异摄动理论,将原系统降阶为一个低阶系统,给出求解相应HJB方程的策略迭代算法,并保证算法的收敛性。然后,运用原系统的慢状态测量重构不可测的降阶系统状态,采用执行-评价神经网络近似降阶控制器和性能指标,在强化学习框架下实现该策略迭代算法,神经网络权值由加权残差法更新。在考虑神经网络近似误差、状态重构误差的情况下,证明迭代算法收敛性、降阶控制器的次优性以及闭环TTS系统的稳定性。设计过程可有效避免高维和病态数值问题。最后,通过数值例子和倒立摆系统仿真说明在动态完全未知的情况下所设计的降阶控制器与最优控制器之间是O(ε)程度近似的,且能够使闭环TTS系统渐近稳定。该论文有图29幅,表8个,参考文献164篇。
戴宝林[7](2021)在《带遗忘因子迭代学习控制增益及性能优化问题研究》文中研究表明带遗忘因子迭代学习控制(Iterative Learning Control with Forgetting Factor,简称ILCFF)方法常用于抑制重复运行系统中出现的干扰并减小系统输出波动,在含干扰系统中获得了广泛的研究与应用。但ILCFF的研究中也存在一些问题,第一,传统观念认为引入遗忘因子将导致系统输出跟踪误差增大,但是缺乏深入研究,无法为ILCFF方法在不同系统中的应用提供理论指导。第二,目前三种常见ILCFF方法仅涉及算法收敛性研究,缺乏对系统输出特性的进一步分析,导致实际使用中无法判断并选择最适合当前系统的ILCFF方法,制约了ILCFF的推广与发展。第三,ILCFF的研究中通常假设系统初始状态误差不存在,该假设与实际情况不符,导致理论研究结果与实际运行效果之间存在差异。因此,本文将最优控制理论与迭代学习控制方法相结合,提出ILCFF方法的最优控制增益计算方法,研究最优控制增益时遗忘因子对系统输出特性的具体影响,并在此基础上得到不同ILCFF方法的最优控制策略。针对离散系统中初态学习方法的不足,利用最优控制增益改进初态学习方法,实现系统输出的稳定与快速收敛。针对固定遗忘因子的不足,结合最优控制增益提出基于系统输出误差变化率及基于系统期望输出两种时变遗忘因子设计方法,进一步减小系统输出误差及其波动。主要的研究内容与成果如下:1.针对一类含非重复性扰动的离散线性时不变(LTI)系统,提出ILCFF方法收敛的充分必要条件及系统单调收敛的充分条件,并基于最优控制理论提出ILCFF方法的最优控制增益计算方法。通过与传统ILC方法及其最优控制增益对比,研究遗忘因子对最优控制增益值的影响,并进一步分析得到遗忘因子与系统收敛速度的关系。2.针对遗忘因子对系统各种干扰的抑制机理尚不明确的问题,基于最优控制增益,研究遗忘因子对系统输出的影响,阐明遗忘因子对系统输出跟踪误差的影响机理,完善了ILCFF理论,填补了遗忘因子研究的空白。同时针对系统精确数学模型难以获取的现状,进一步分析非最优控制增益下ILCFF与ILC的收敛速度及输出跟踪误差,得到ILCFF实现系统输出特性优化的一般性结论。仿真结果验证了相关推论的正确性。3.针对常见ILCFF方法研究未涉及系统输出特性且控制向量效果不明等问题,分析含初态误差系统中不同ILCFF方法控制向量对系统收敛性、单调收敛性、最优控制增益等方面的影响。在此基础上分析得到最优控制增益时不同ILCFF方法的系统输出特性,并提出不同ILCFF方法优化策略,实现系统输出特性最优。仿真结果验证了不同ILCFF方法及其优化策略的正确性。4.针对已有初态学习方法收敛速度较慢且在离散系统中收敛误差先抑后扬等问题,结合最优控制增益计算方法,提出一种离散系统最优初态学习ILCFF方法,实现该方法的快速收敛。同时,研究初态学习方法对传统ILCFF方法最优控制增益和输出特性的影响,在保证收敛的基础上,通过改进算法参数得到该方法最优输出特性,实现离散系统中初态误差影响的快速有效抑制,保证系统输出误差稳定。仿真结果验证了所提方法的有效性。5.针对固定遗忘因子无法同时实现系统收敛速度与收敛误差最优的问题,在已有研究基础上总结出时变遗忘因子设计原则,并根据前期研究结果提出两种不同系统环境下的时变最优ILCFF算法:基于系统输出误差及其变化率的时变最优ILCFF和基于系统期望输出与误差变化率的时变最优ILCFF。在保证两种方法收敛的基础上,通过理论推导证明了一类期望输出较小系统中基于系统期望输出与输出误差变化率的时变最优ILCFF方法的可行性。仿真结果验证了以上两种方法的有效性。最终直流电机实验结果表明,本文基于最优控制增益提出的ILCFF的一般性结论成立,引入遗忘因子有助于加速系统收敛速度并减小期望输出较小系统的输出误差。综上所述,本文所提出的ILCFF最优控制增益有效提升了系统输出性能,在此基础上得到的初态学习ILCFF方法及时变ILCFF方法进一步优化了系统收敛速度并减小了系统输出误差。仿真及实验结果验证了本文提出的ILCFF优化方法及相关结论的有效性。
匡志[8](2021)在《全电飞机用十五相永磁同步电机驱动控制系统的研究》文中研究表明全电飞机能够实现零排放,无污染,有效解决对石油能源的依赖及传统飞机尾气排放的问题,已被《科学美国人》评选为2020年“十大潜力技术”。电驱动系统作为驱动执行机构提供飞行动力,系统对其运行效率,动态性能及可靠性提出更高要求。相比传统三相电机,多相电机在容错,实现大功率等方面更具潜力和优势。本文以全电飞机用十五相PMSM驱动控制系统为研究对象,针对全电飞机电驱动系统的高效率,抗扰动,容错控制等问题展开研究。在分析全电飞机对电驱动系统的需求基础上,基于全工况功耗最小思想,提出了一种三套绕组高效配合、各套绕组独立可控的3×5相PMSM电机结构:设计时根据螺旋桨的转矩特性和全电飞机的工况需求匹配三套五相绕组的基速与额定转矩,运行时按照工况的转矩需求分时复用,使得各套绕组尽量工作在高效区域,从而提高电驱动系统全工况的运行效率,达到延长巡航里程目的。针对所提出的不对称绕组十五相PMSM系统分套控制与谐波抑制问题,推导了十五相PMSM的谐波特性表达式,对比分析了对称与不对称结构十五相PMSM的合成磁动势谐波次数与电枢绕组谐波电流,结果表明:不对称结构的谐波磁动势次数与对称结构谐波次数不同,其幅值和相位也发生了变化,但是不对称绕组时的谐波最高幅值并没有明显增大。建立了不对称十五相PMSM基于三dq轴变换的数学模型与矢量控制仿真模型,研究了四矢量SVPWM与双坐标系矢量控制谐波抑制方法,仿真和实验结果表明,使用两种方法均可以有效抑制不对称绕组产生的谐波,而且双坐标系统控制优于四矢量SVPWM控制。为了提高全电飞机电驱动系统的抗扰动能力,分析了由环境气流变化引起的扰动转矩和电机参数变化对电驱动系统的影响;提出一种基于线性自抗扰控制的负载转矩前馈控制方法,设计了负载转矩观测器与线性自抗扰控制器(LADRC),并进行了稳定性分析。通过对该线性自抗扰控制的负载转矩前馈十五相PMSM转速闭环系统的抗扰动性仿真与实验研究表明提出的方法能有效抑制负载扰动和电机参数变化对电机转速的影响。为了提升全电飞机的巡航里程,研究了十五相PMSM系统驱动螺旋桨负载的变工况下高效控制策略。根据飞行工况下螺旋桨的转矩需求提出一种不对称十五相PMSM效率最优的转矩分配策略,仿真结果表明,效率最优控制的转矩分配策略能够有效拓宽十五相PMSM的高效区域,说明了这种不对称设计的有效性。为了有效抑制效率最优控制时各套绕组转矩分配的突变问题,进一步提出了基于模糊控制原理的转矩分配策略,并针对飞行工况给出了基于工况的规则控制,从而形成一种3×5相PMSM电驱动系统的绕组分套控制方法,即根据飞行工况阶段选择转矩分配方法,在爬升和下降阶段采用规则控制,同时对绕组切换时转矩波动进行抑制,在巡航阶段采用模糊控制的转矩分配方法,达到了既提高系统运行效率又减小了转矩波动的目的。为了提高电驱动系统的可靠性,分析了不同容错方法的热特性。以一相开路故障为例,研究了基于五相六桥臂SVPWM的容错控制,电流滞环等幅与铜耗最小容错控制下电枢绕组相电流幅值与相位变化,电机各部分损耗,电枢绕组的稳态温度与极端工况下的暂态温升等情况;仿真和实验研究结果表明,在额定负载下五相六桥臂SVPWM容错控制时电枢绕组极值点温度远远高于电流滞环等幅控制与铜耗最小容错控制情况;并且绕组不对称时,温度分布会更不均衡,因此提出设计和使用建议:对于高功率密度多相电机,尤其是本文研究的不对称绕组多相电机,绕组故障容错时,从热应力可靠性角度,不建议采用五相六桥臂控制方式,并且容错运行时,需要根据设计绝缘等级,温度限制降功率运行或者短时等功率运行。
徐丹[9](2020)在《基于作物状态在线反馈的温室双闭环最优控制研究》文中研究表明本文在分析基于“软传感”的温室双闭环最优控制仿真研究理论分析基础上,发现了实现基于作物状态在线反馈的温室双闭环最优控制算面临的问题,并进行了如下方面的研究:(1)将“暗期”引入LED光强的最优控制,避免温室LED补光最优控制会产生的连续光照;(2)研究利用计算机视觉技术实现作物状态反馈,解决“软传感”无法处理作物模型误差的情况(3)搭建远程连续量控制输入的温室最优控制物联网系统,为温室最优控制提供试验验证平台。本文的主要结论是:1.基于“软传感”的温室双闭环最优控制通过抵消长期天气预测、价格预测的误差,当预测误差在50%时对经济效益的提高不超过2.98%。若引入LED补光,不但可以将生产周期缩短为20天,还可将经济效益提高24.50%。2.在植物工厂环境下通过试验数据校正了生菜在LED光影响下的模型参数,通过切换函数实现LED光强最优控中的“暗期”,进行了在不同电费以及生菜售价下最优控制的经济效益,为将LED补光引入温室最优控制做了铺垫。3.建立了 CNN、SVR、RF及LR等深度学习和浅层机器学习的温室生菜长势参数估算模型,并对结果进行对比,发现基于深度学习的CNN模型的估算结果好于浅层机器学习的估算结果,未来进行群体估算研究可将估算精度提高至90%以上。4.搭建了温室最优控制试验物联网系统并对系统控制性能进行了相应的测试,并保留了 LED补光控制的接口,测试发现夏季降至需求温度上限需要同时开启湿帘和内遮阴,若在夏季实施最优控制需要将湿帘和内遮阴考虑进温室环境模型。
王佳英[10](2020)在《自适应光学系统扰动模型辨识及最优控制技术研究》文中提出自适应光学(Adaptive Optics,AO)是一种通过克服动态波前畸变对光学系统成像质量的影响,从而获得接近衍射极限的高分辨率成像的技术,广泛的应用于天文观测、激光传输、人眼视网膜成像等领域。地基天文望远镜进行科学观测时,由随机变化的大气湍流造成的波前畸变是系统成像质量下降的主要原因。此外,工作环境的变化以及系统平台本身也会带来一些非湍流像差扰动,主要包括由风或其他激发源(冷却器,百叶窗等)引起的窄带扰动。除大气湍流扰动外,这些窄带扰动很大程度上限制了系统性能的提高。目前,大多数AO系统都采用经典的比例积分(Proportional integral,PI)控制器,然而由于控制算法本身的限制,其无法对这些窄带扰动进行有效抑制,并且忽略了这些扰动包括大气湍流扰动随时间演变的特性,无法满足大口径天文望远镜高分辨成像的需求。基于此,本文针对AO系统中随时间变化的光束扰动(Disturbance)(包括湍流扰动和非湍流扰动)的校正问题开展了以下内容的研究并取得了一系列成果:1.对AO系统中光束扰动的存在问题进行了详细阐述,建立了具有实际物理意义的光束扰动动态模型。首先,通过对AO系统中光束扰动信号特性的分析,建立了可表征实际物理过程的独立扰动分量模型,即自回归二阶模型(second-order Auto-Regressive,AR2);然后,根据系统中不同频率扰动分量所对应的来源不同且彼此相互独立的关系,建立了AO系统中复杂频率光束扰动的时域动态模型和频域动态模型。通过对随时间变化的光束扰动信号模型的构建,实现了AO系统中光束扰动信号的准确描述并为扰动控制器的设计提供模型依据。2.针对AO系统中存在的复杂频率的动态光束扰动信号,提出了一种自动扰动模型辨识方法,包含了扰动频谱分离过程和基于粒子群优化(Particle swarm optimization,PSO)算法的模型参数辨识过程两个部分。整个辨识过程无需额外辅助系统及人为调试,可以在线周期运行。首先,通过对复杂频率的光束扰动信号的功率谱曲线进行有效分割,从而实现了对独立扰动分量的准确提取,同时确定了有效扰动分量的数目;其次,利用PSO算法初值随机、所需调整参数少和收敛速度快等特性,可以快速有效地辨识出扰动的频域模型参数。此外,我们将辨识结果与其他辨识方法进行了性能对比并通过人为合成扰动数据进行了仿真验证,结果表明本文提出的辨识算法使得辨识计算时间大大减少,并且由于对惯性权重系数的调节使得辨识算法减少了陷入局部极小值的可能性,从而得到的模型参数辨识精度更高,为扰动控制器的设计提供支撑。3.针对AO系统中高阶模式中窄带扰动难以校正的问题,提出了控制结构可调整的线性二次高斯(Linear quadratic Gaussian,LQG)多模式扰动控制器。首先,根据辨识获得的单阶模式光束扰动模型参数及其所包含的独立扰动分量的个数,以光束扰动校正残差最小为优化指标设计了控制结构可调整的LQG单模式扰动控制器;然后,根据多阶扰动模式中各模式中分别获得的独立扰动分量的个数以及相应的模型参数,确定多模式扰动抑制器的控制矩阵维度并计算得出其相应的控制参数矩阵,获得了控制结构可调整的LQG多模式扰动控制器;最后,将设计的控制器与重演仿真得到的最优模式增益积分(Optimized Model Gain Integrator,OMGI)控制器进行了性能对比。仿真结果表明,本文提出的多模式扰动控制器对高阶模式中存在的光束扰动表现出良好的抑制性能,同时相较于OMGI控制器,本文提出的控制方法对高阶模式中的窄带扰动表现出更好地控制性能。此外,进一步地验证了光束扰动模型的有效性及辨识方法的可靠性。4.通过对1-m新真空太阳望远镜实际测量连续扰动数据进行重演仿真,进一步分析评估了基于频谱分离和粒子群优化算法的自动扰动辨识方法和基于辨识模型的LQG控制器在实际望远镜系统中的可行性。然后,搭建了自适应光学系统室内实验平台,对系统中存在的多项高阶模式扰动的抑制进行了实验验证。最后,对1.8m中国大型太阳望远镜(Chinese Large Solar Telescope,CLST)系统中由制冷机造成的窄带扰动进行了抑制实验。5.考虑到实际系统中计算资源有限,提出了一种适用于自适应光学系统高阶扰动校正的混合控制方法,在无需专门配置高性能计算机的情况下,既能减少实时计算机的计算量又能够保证对高阶扰动尤其是窄带扰动的有效抑制。通过本文的研究,获得了AO系统中随时间变化的复杂频率光束扰动信号的时域动态模型和频域动态模型,并通过结合频谱分离和粒子群优化算法的自动扰动辨识方法实现了对光束扰动模型的精确描述,解决了目前AO系统中光束扰动模型难以准确获得的问题。其次,根据辨识得到的不同模式分别对应的扰动模型参数和相应的扰动分量个数,以光束扰动校正残差最小为优化指标设计了控制结构可调整的多模式LQG扰动控制器,解决了目前AO系统中高阶模式上光束扰动尤其是窄带扰动难以有效抑制的问题,提高了自适应光学系统对光束扰动的控制性能。此外,本文还提出了一种适用于AO系统中高阶扰动校正的混合控制策略,一定程度上减小了系统进行高阶扰动校正时面临的计算压力,为LQG控制在实际系统中的应用提供解决方案,对AO系统应用性能的提升具有十分重要的意义。
二、最优控制、最优控制系统(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、最优控制、最优控制系统(论文提纲范文)
(1)敏捷航天器凝视观测任务规划及最优姿态控制(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 课题背景及研究的目的和意义 |
1.1.1 课题背景 |
1.1.2 研究的目的和意义 |
1.2 航天器凝视观测概述及发展现状 |
1.3 航天器多目标观测任务规划研究现状 |
1.3.1 多目标观测任务聚类方法 |
1.3.2 多目标观测任务规划 |
1.3.3 任务规划研究中存在的问题与挑战 |
1.4 航天器最优姿态控制 |
1.4.1 无穷时域逆最优控制 |
1.4.2 无穷时域高鲁棒性最优控制 |
1.4.3 有限时域最优控制 |
1.4.4 敏捷航天器最优姿态控制存在的问题分析 |
1.5 本文的主要研究内容及章节安排 |
第2章 敏捷航天器凝视观测姿态动力学建模 |
2.1 引言 |
2.2 相关变量符号的定义及引理 |
2.3 航天器凝视观测姿态运动建模 |
2.3.1 坐标系定义 |
2.3.2 不同姿态描述方式及运动学建模 |
2.3.3 航天器凝视观测姿态动力学模型 |
2.3.4 凝视观测地面目标的姿态跟踪误差动力学模型 |
2.4 本章小结 |
第3章 敏捷航天器多目标凝视观测任务规划 |
3.1 引言 |
3.2 任务规划问题描述 |
3.3 基于团划分算法的密集点目标聚类 |
3.3.1 任务聚类模型建立 |
3.3.2 团划分算法 |
3.3.3 观测团目标的期望姿态计算 |
3.4 力矩约束下敏捷航天器凝视观测姿态转移最小时间计算 |
3.4.1 目标位于XY平面内情况下的近似时间最优解析解 |
3.4.2 目标位于XY平面外情况下的近似时间最优数值解 |
3.4.3 仿真分析 |
3.5 基于启发式蚁群算法的多目标观测序列规划 |
3.5.1 启发式蚂蚁转移策略 |
3.5.2 信息素更新策略 |
3.5.3 仿真分析 |
3.6 本章小结 |
第4章 敏捷航天器高精度逆最优姿态控制 |
4.1 引言 |
4.2 最优控制器设计方法 |
4.3 逆最优控制律设计及最优性能指标构建 |
4.3.1 PD控制律设计 |
4.3.2 最优性能指标构建 |
4.3.3 仿真分析 |
4.4 敏捷航天器高精度防抖振CLF姿态控制 |
4.4.1 CLF控制方法介绍 |
4.4.2 次最优CLF控制律设计 |
4.4.3 变结构CLF多模控制律设计 |
4.4.4 仿真分析 |
4.5 有限时间CLF高精度姿态跟踪控制 |
4.5.1 控制器设计 |
4.5.2 控制系统稳定性分析 |
4.5.3 仿真分析 |
4.6 本章小结 |
第5章 指定时刻凝视观测最优姿态控制 |
5.1 引言 |
5.2 控制参数自整定的指定时刻姿态重定向控制 |
5.2.1 问题描述 |
5.2.2 基于线性滑模的两阶段指定时刻控制 |
5.2.3 基于终端滑模的两阶段指定时刻控制 |
5.2.4 数值仿真 |
5.3 基于SDRE方法的指定时刻最优姿态跟踪控制 |
5.3.1 问题描述 |
5.3.2 SDRE最优控制器设计 |
5.3.3 闭环系统稳定性分析 |
5.3.4 引入路径点的改进SDRE控制 |
5.3.5 仿真分析 |
5.4 本章小结 |
结论 |
参考文献 |
攻读博士学位期间发表的论文及其他成果 |
致谢 |
个人简历 |
(2)时标随机最优控制问题(论文提纲范文)
摘要 |
英文摘要 |
符号说明 |
第一章 绪论 |
1.1 研究背景 |
1.2 研究综述 |
1.3 研究内容 |
第二章 时标理论体系 |
2.1 时标理论的基础知识 |
2.2 时标上的随机分析 |
第三章 时标随机线性控制系统优化问题 |
3.1 引言 |
3.2 时标随机线性二次最优控制问题 |
3.2.1 问题描述 |
3.2.2 乘积法则 |
3.2.3 RΔE与最优控制 |
3.3 时标平均场随机线性二次最优控制问题 |
3.3.1 问题描述 |
3.3.2 状态方程解的存在唯一性 |
3.3.3 RΔEs与最优控制 |
3.4 RΔEs解的存在唯一性 |
第四章 时标随机控制动态规划原理 |
4.1 引言 |
4.2 问题描述 |
4.3 链式法则和伊藤公式 |
4.4 动态规划原理与HJB方程 |
4.5 从HJB方程推导RΔE |
第五章 时标随机控制最大值原理 |
5.1 引言 |
5.2 随机最大值原理Ⅰ |
5.2.1 问题描述 |
5.2.2 变分不等式 |
5.2.3 伴随方程与最大值原理Ⅰ |
5.3 最大值原理Ⅰ与离散时间最大值原理 |
5.4 最大值原理Ⅰ推导RΔE |
5.5 随机最大值原理Ⅱ |
5.5.1 预备知识和问题描述 |
5.5.2 变分不等式 |
5.5.3 伴随方程与最大值原理Ⅱ |
第六章 时标随机最优控制理论的应用 |
6.1 均值-方差投资组合 |
6.2 季节性蚊虫种群模型 |
参考文献 |
攻读博士学位期间完成论文情况 |
致谢 |
学位论文评阅及答辩情况表 |
(3)时滞离散控制最优性的必要条件(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 问题简介 |
1.2 研究现状 |
1.3 我们的工作 |
第二章 预备知识 |
2.1 最大值原理 |
2.2 时滞离散最优系统模型 |
第三章 必要最优性条件 |
3.1 必要最优性条件 |
3.1.1 目标函数的增量公式 |
3.1.2 最优解所满足的必要条件 |
3.2 线性化条件下的必要最优性条件 |
3.2.1 线性化条件下目标函数的增量公式 |
3.2.2 线性化条件下最优解所满足的必要条件 |
第四章 应用举例 |
第五章 总结 |
参考文献 |
致谢 |
(4)基于自适应动态规划的机器人系统鲁棒控制研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 课题来源 |
1.2 研究背景及意义 |
1.3 工业机器人研究现状 |
1.3.1 工业机器人发展现状 |
1.3.2 工业机器人控制研究现状 |
1.4 自适应动态规划研究现状 |
1.4.1 自适应动态规划 |
1.4.2 基于自适应动态规划的最优控制 |
1.4.3 基于自适应动态规划的鲁棒控制 |
1.5 现有研究存在的问题 |
1.6 论文主要研究内容 |
第二章 基于自适应动态规划的机器人鲁棒控制 |
2.1 引言 |
2.2 PUMA560工业机器人建模 |
2.2.1 PUMA560工业机器人结构及参数 |
2.2.2 PUMA560工业机器人动力学模型 |
2.3 SCARA机器人系统及建模 |
2.3.1 SCARA机器人结构及参数 |
2.3.2 SCARA机器人动力学建模 |
2.3.3 SCARA机器人系统集成 |
2.3.4 SCARA机器人运动控制系统 |
2.4 机器人鲁棒控制问题描述 |
2.5 鲁棒控制与最优控制等价性 |
2.6 机器人鲁棒控制设计 |
2.6.1 自适应动态规划推导 |
2.6.2 自适应学习算法设计 |
2.6.3 稳定性分析 |
2.7 仿真验证 |
2.8 实验验证 |
2.8.1 不确定性上界 |
2.8.2 实验设置 |
2.8.3 实验结果 |
2.9 本章小结 |
第三章 基于自适应动态规划的机器人鲁棒跟踪控制 |
3.1 引言 |
3.2 机器人鲁棒跟踪控制问题描述 |
3.3 鲁棒跟踪控制与最优跟踪控制等价性 |
3.4 机器人鲁棒跟踪控制设计 |
3.4.1 自适应学习算法设计 |
3.4.2 稳定性分析 |
3.5 仿真与实验研究 |
3.5.1 仿真验证 |
3.5.2 实验验证 |
3.6 本章小结 |
第四章 基于输入/输出数据驱动的机器人输出反馈鲁棒控制 |
4.1 引言 |
4.2 机器人输出反馈鲁棒控制问题描述 |
4.3 输出反馈鲁棒控制与输出反馈最优控制等价性 |
4.4 数据驱动机器人输出反馈鲁棒控制设计 |
4.5 输出反馈最优控制方程数据驱动求解 |
4.5.1 输出黎卡提方程的构建 |
4.5.2 数据驱动自适应律设计 |
4.5.3 稳定性分析 |
4.6 仿真与实验研究 |
4.6.1 仿真验证 |
4.6.2 实验验证 |
4.7 本章小结 |
第五章 基于输入/输出数据驱动的机器人输出反馈鲁棒跟踪控制 |
5.1 引言 |
5.2 机器人输出反馈鲁棒跟踪控制问题描述 |
5.3 数据驱动输出反馈鲁棒跟踪控制设计 |
5.4 输出反馈最优跟踪控制方程数据驱动求解 |
5.4.1 输出跟踪黎卡提方程的构建 |
5.4.2 数据驱动自适应律设计 |
5.4.3 稳定性分析 |
5.5 仿真与实验研究 |
5.5.1 仿真验证 |
5.5.2 实验验证 |
5.6 本章小结 |
第六章 结论与展望 |
6.1 工作成果 |
6.2 创新点总结 |
6.3 工作展望 |
致谢 |
参考文献 |
附录A: 攻读博士期间发表与录用论文情况 |
附录B: 攻读博士期间授权专利情况 |
附录C: 攻读博士期间参与项目情况 |
(5)自主泊车的最优轨迹规划与跟踪控制研究(论文提纲范文)
致谢 |
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景和意义 |
1.2 泊车系统应用发展现状 |
1.2.1 辅助泊车系统发展现状 |
1.2.2 代客泊车系统发展现状 |
1.3 泊车系统关键技术国内外研究现状 |
1.3.1 泊车位探测方法 |
1.3.2 泊车运动规划方法 |
1.3.3 泊车运动跟踪控制方法 |
1.4 本文主要研究内容与组织结构 |
1.4.1 研究内容 |
1.4.2 组织结构 |
第二章 泊车运动轨迹规划问题模型 |
2.1 引言 |
2.2 车辆运动学模型 |
2.3 车辆避障约束 |
2.3.1 车辆轮廓的膨胀描述 |
2.3.2 车辆避障约束 |
2.4 物理条件约束 |
2.5 初始/终止状态约束 |
2.6 本章小结 |
第三章 基于改进伪谱法的自主泊车轨迹规划 |
3.1 引言 |
3.2 最优控制问题描述和求解方法 |
3.3 基于高斯伪谱法的车辆运动轨迹规划 |
3.3.1 时域转换 |
3.3.2 状态变量和控制变量离散化 |
3.3.3 约束条件及性能指标函数转换 |
3.3.4 协态映射 |
3.3.5 车辆运动轨迹规划问题描述及仿真分析 |
3.4 自主泊车轨迹规划及仿真分析 |
3.4.1 基于hp自适应伪谱法的自主泊车轨迹规划 |
3.4.2 基于分段伪谱法的自主平行泊车轨迹规划 |
3.4.3 基于同伦法的自主垂直泊车轨迹规划 |
3.5 自主泊车轨迹规划在线计算方法 |
3.5.1 最优初值下的泊车轨迹规划在线计算 |
3.5.2 基于自由采样频率的泊车轨迹重规划 |
3.6 本章小结 |
第四章 自主代客泊车及多车协同运动轨迹规划 |
4.1 引言 |
4.2 自主代客泊车的全局轨迹规划 |
4.2.1 基于A*算法的全局路径搜索 |
4.2.2 基于动态启发式函数改进的A*算法 |
4.2.3 分段回溯迭代的自主代客泊车全局轨迹规划 |
4.3 多车协同运动轨迹规划 |
4.3.1 多车协同运动轨迹规划的最优控制问题描述 |
4.3.2 基于全局轨迹信息的协同运动控制区域分割策略 |
4.3.3 局部环境下的多车协同轨迹规划 |
4.3.4 基于启发式初值策略的多车协同轨迹规划计算框架 |
4.5 本章小结 |
第五章 基于模型预测的泊车轨迹跟踪控制 |
5.1 引言 |
5.2 模型预测控制原理 |
5.3 基于参考轨迹的位姿跟随PID控制器 |
5.4 基于模型预测控制的泊车轨迹跟踪控制器 |
5.4.1 线性时变预测模型 |
5.4.2 预测方程 |
5.4.3 目标函数及约束条件 |
5.4.4 局部最优问题及求解 |
5.4.5 预测时域动态调整策略 |
5.5 泊车轨迹跟踪仿真分析 |
5.5.1 仿真模型建立 |
5.5.2 控制器参数选取 |
5.5.3 平行泊车轨迹跟踪仿真 |
5.5.4 垂直泊车轨迹跟踪仿真 |
5.6 本章小结 |
第六章 泊车系统控制器实车试验及硬件在环试验 |
6.1 引言 |
6.2 实车试验 |
6.2.1 实车试验平台 |
6.2.2 泊车位探测 |
6.2.3 泊车实车试验 |
6.3 硬件在环仿真试验 |
6.3.1 HIL试验平台 |
6.3.2 多车协同运动控制的HIL试验 |
6.4 本章小结 |
第七章 总结与展望 |
7.1 总结 |
7.2 创新点 |
7.3 展望 |
参考文献 |
攻读博士学位期间的学术活动及成果情况 |
(6)非线性双时间尺度系统自学习优化控制(论文提纲范文)
致谢 |
摘要 |
abstract |
变量注释表 |
1 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状及问题分析 |
1.3 论文主要工作及章节安排 |
2 时滞非线性双时间尺度神经网络稳定性分析与逆最优同步控制 |
2.1 引言 |
2.2 具有时变时滞的双时间尺度神经网络稳定性分析 |
2.3 具有常时滞的双时间尺度神经网络逆最优同步控制 |
2.4 本章小结 |
3 具有未知扰动的双时间尺度系统自适应滑模控制 |
3.1 引言 |
3.2 问题描述和预备知识 |
3.3 基于等效输入扰动的自适应滑模控制器设计与性能分析 |
3.4 仿真研究 |
3.5 本章小结 |
4 慢动态未知的非线性双时间尺度系统强化学习组合优化控制 |
4.1 引言 |
4.2 问题描述和预备知识 |
4.3 基于RL和T-S模糊的组合次优控制器设计与性能分析 |
4.4 仿真研究 |
4.5 本章小结 |
5 动态完全未知的非线性双时间尺度系统强化学习降阶优化控制 |
5.1 引言 |
5.2 问题描述和预备知识 |
5.3 基于RL的次优降阶控制器设计及性能分析 |
5.4 仿真研究 |
5.5 本章小结 |
6 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
作者简历 |
学位论文数据集 |
(7)带遗忘因子迭代学习控制增益及性能优化问题研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景和意义 |
1.2 国内外研究现状与分析 |
1.2.1 迭代学习控制及其关键技术 |
1.2.2 带遗忘因子的迭代学习控制研究现状 |
1.2.3 基于最优控制策略的迭代学习控制研究 |
1.3 本文主要研究内容 |
第2章 含遗忘因子迭代学习控制最优控制增益 |
2.1 引言 |
2.2 问题的提出与描述 |
2.3 收敛性分析 |
2.4 单调收敛条件 |
2.5 最优控制增益计算 |
2.6 仿真验证 |
2.7 本章小结 |
第3章 基于不同控制增益时ILCFF输出跟踪误差 |
3.1 引言 |
3.2 预备知识 |
3.2.1 诱导矩阵范数 |
3.2.2 和积法 |
3.3 最优控制增益时ILCFF与 ILC输出跟踪误差分析 |
3.4 非最优控制增益时ILCFF与 ILC输出特性分析 |
3.5 仿真验证 |
3.5.1 期望输出轨迹对系统输出特性的影响 |
3.5.2 干扰类型对系统输出特性的影响 |
3.5.3 非最优控制增益时系统输出特性对比 |
3.6 本章小结 |
第4章 不同控制参数时ILCFF最优控制增益及其输出特性 |
4.1 引言 |
4.2 ILCFFT最优控制增益及其输出特性研究 |
4.2.1 收敛性及单调收敛性分析 |
4.2.2 最优控制增益及系统输出收敛速度 |
4.2.3 系统输出误差 |
4.3 ILCFFI最优控制增益及其输出特性研究 |
4.3.1 收敛性分析 |
4.3.2 单调收敛条件 |
4.3.3 最优控制增益 |
4.3.4 收敛速度及输出误差 |
4.4 ILCFFL最优控制增益及其输出特性研究 |
4.4.1 收敛性分析 |
4.4.2 单调收敛条件 |
4.4.3 最优控制增益 |
4.4.4 收敛速度及输出误差 |
4.5 最优控制增益时不同ILCFF对比分析 |
4.6 仿真验证 |
4.7 本章小结 |
第5章 基于最优控制增益的含初态学习ILCFF |
5.1 引言 |
5.2 问题的提出与算法设计 |
5.3 收敛性分析 |
5.4 仿真验证 |
5.5 本章小结 |
第6章 基于最优控制增益的时变ILCFF |
6.1 引言 |
6.2 时变遗忘因子设计原则 |
6.3 时变最优ILCFF方法及其改进 |
6.3.1 常见时变ILCFF |
6.3.2 基于系统输出误差及其变化率的时变最优ILCFF |
6.3.3 基于系统期望输出与输出误差变化率的时变最优ILCFF |
6.4 实验验证 |
6.5 本章小结 |
结论与展望 |
全文总结 |
研究展望 |
参考文献 |
致谢 |
附录 A 攻读博士学位期间所发表的学术论文目录 |
(8)全电飞机用十五相永磁同步电机驱动控制系统的研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 课题背景及研究目的和意义 |
1.2 全电飞机国内外研究现状 |
1.3 多相电机及驱动控制系统研究现状 |
1.3.1 多相电机定义及发展现状 |
1.3.2 多相电机驱动系统的控制方法 |
1.3.3 多相电机驱动系统的容错策略 |
1.4 电机驱动控制系统关键问题的研究现状 |
1.4.1 转矩扰动抑制方法 |
1.4.2 效率最优控制方法 |
1.5 本文的主要研究内容 |
第2章 十五相PMSM系统建模与不对称绕组特性分析 |
2.1 引言 |
2.2 飞行工况下总体效率最优绕组匹配方案 |
2.2.1 螺旋桨负载转矩的建模 |
2.2.2 飞行工况的电驱动系统特性要求 |
2.2.3 3×5 相PMSM不对称绕组匹配 |
2.3 3×5 相PMSM的数学模型 |
2.3.1 自然坐标系下基本方程 |
2.3.2 不对称绕组定子电感分析 |
2.3.3 不对称绕组合成磁动势谐波分析 |
2.4 基于三dq轴变换的3×5 相电机系统矢量控制模型 |
2.4.1 基于三dq轴变换的数学模型 |
2.4.2 3×5 相PMSM系统仿真模型 |
2.4.3 不对称绕组三次谐波抑制控制模型 |
2.5 仿真与实验研究 |
2.5.1 实验平台搭建 |
2.5.2 三次谐波抑制的仿真与实验 |
2.5.3 3×5 相PMSM绕组分套矢量控制仿真与实验 |
2.6 本章小结 |
第3章 飞行工况下十五相PMSM调速系统抗扰动控制 |
3.1 引言 |
3.2 全电飞机电驱动系统扰动问题 |
3.2.1 螺旋桨的扰动转矩 |
3.2.2 扰动转矩对电驱动系统的影响 |
3.2.3 电机参数变化对电驱动系统的影响 |
3.3 基于LADRC负载转矩前馈补偿的抗扰动设计 |
3.3.1 系统构建及仿真模型的建立 |
3.3.2 负载转矩观测器的设计 |
3.3.3 线性自抗扰控制器的设计 |
3.4 转速波动抑制效果的仿真验证与分析 |
3.4.1 仿真说明及系统参数设定 |
3.4.2 转矩扰动时的转速波动抑制 |
3.4.3 电机参数变化时的转速波动抑制 |
3.4.4 不对称运行下转速波动抑制 |
3.5 实验研究 |
3.5.1 转矩扰动时的转速波动抑制实验 |
3.5.2 飞行工况下电驱动系统转速与转矩响应 |
3.6 本章小结 |
第4章 基于飞行工况的3×5 相PMSM系统最优效率运行控制 |
4.1 引言 |
4.2 效率最优的绕组转矩分配 |
4.2.1 3×5相PMSM各套绕组的效率map图 |
4.2.2 效率最优的绕组转矩分配方法 |
4.2.3 转矩分配与各套绕组工作点分布 |
4.3 基于模糊控制原理的转矩分配策略 |
4.3.1 模糊控制器的设计 |
4.3.2 基于模糊控制的系统仿真模型建立 |
4.3.3 转矩分配与各套绕组工作点分布 |
4.4 基于飞行工况的规则控制转矩分配 |
4.4.1 绕组切换规则的制定 |
4.4.2 不同转矩分配方法的工作点效率对比分析 |
4.5 绕组切换时的转矩波动抑制分析 |
4.5.1 绕组切换时的转矩波动抑制方法 |
4.5.2 不同切换策略下转矩波动对比分析 |
4.6 3×5 相PMSM系统的绕组分套控制方法 |
4.6.1 绕组分套的控制方法 |
4.6.2 不同转矩分配策略的比较 |
4.7 本章小结 |
第5章 3×5 相PMSM系统不同容错控制的热分析 |
5.1 引言 |
5.2 多相电机的不同容错控制方法分析 |
5.2.1 基于合成磁动势不变的容错方法 |
5.2.2 基于合成电压矢量不变的容错方法 |
5.2.3 不同容错控制方法的相电流特性 |
5.3 3×5 相PMSM系统容错运行时损耗特性 |
5.3.1 3×5 相PMSM热分析模型的建立 |
5.3.2 不同容错控制方法下的损耗分析 |
5.4 3×5 相PMSM不同容错运行的温度场特征 |
5.4.1 对称3×5 相PMSM的稳态温度场 |
5.4.2 不对称3×5 相PMSM的稳态温度场 |
5.4.3 飞行工况下3×5 相PMSM的暂态温度场 |
5.5 实验研究 |
5.5.1 样机及测试平台的搭建 |
5.5.2 不同容错控制方法下温度测试 |
5.6 本章小结 |
结论 |
参考文献 |
附录 A 3×5 相PMSM数学模型参数计算 |
攻读博士学位期间发表的论文及其它成果 |
致谢 |
个人简历 |
(9)基于作物状态在线反馈的温室双闭环最优控制研究(论文提纲范文)
内容摘要 |
Abstract |
1 绪论 |
1.1 研究意义 |
1.2 国内外研究现状及发展动态 |
1.3 科学意义及应用前景 |
2 基于“软传感”的温室双闭环最优控制研究 |
2.1 引言 |
2.2 理论基础 |
2.3 模型介绍 |
2.4 仿真分析 |
2.5 本章小结 |
3 植物工厂光强最优控制研究 |
3.1 引言 |
3.2 作物模型校正 |
3.3 优化 |
3.4 本章小结 |
4 基于卷积神经网络的温室生菜长势参数估算方法研究 |
4.1 引言 |
4.2 基于传统机器学习的温室生菜长势参数估算模型构建 |
4.3 基于卷积神经网络的温室生菜长势参数估算模型构建 |
4.4 结果分析 |
4.5 本章小结 |
5 温室最优控制物联网系统研究 |
5.1 引言 |
5.2 控制系统原理与构成 |
5.3 控制系统性能试验 |
5.4 本章小结 |
6 结论和展望 |
致谢 |
参考文献 |
博士后个人简历 |
博士生、博士后期间发表的科研成果 |
(10)自适应光学系统扰动模型辨识及最优控制技术研究(论文提纲范文)
摘要 |
abstract |
第1章 绪论 |
1.1 引言 |
1.2 自适应光学技术概述 |
1.2.1 自适应光学原理及系统组成 |
1.2.2 自适应光学技术进展 |
1.2.3 国内自适应光学技术发展 |
1.3 自适应光学系统扰动校正问题 |
1.3.1 自适应光学系统扰动存在问题 |
1.3.2 自适应光学系统扰动控制问题 |
1.3.3 自适应光学系统扰动控制技术进展 |
1.4 自适应光学系统扰动抑制难点 |
1.5 本文的研究内容及结构 |
第2章 自适应光学系统扰动模型 |
2.1 扰动像差表示 |
2.2 扰动特性 |
2.2.1 大气湍流特性 |
2.2.2 非湍流扰动特性 |
2.3 不同扰动模型描述 |
2.4 动态扰动模型构建 |
2.5 本章小结 |
第3章 扰动模型辨识 |
3.1 常用的辨识方法及其特点 |
3.2 粒子群优化算法简述 |
3.3 扰动模型辨识 |
3.3.1 扰动功率谱密度估计 |
3.3.2 扰动源分离 |
3.3.3 基于粒子群优化算法的扰动模型辨识 |
3.4 模型辨识验证 |
3.5 本章小结 |
第4章 最优扰动控制器 |
4.1 扰动控制系统及最优性能指标 |
4.2 最优模式增益积分控制 |
4.3 线性二次高斯控制 |
4.4 控制结构可调整的多模式LQG控制器 |
4.5 LQG扰动控制器性能验证 |
4.6 本章小结 |
第5章 基于1-m NVST实测数据的LQG扰动控制验证 |
5.1 望远镜平台及其自适应光学系统简介 |
5.2 光束扰动抑制方法验证 |
5.2.1 测量数据 |
5.2.2 辨识方法的性能 |
5.2.3 基于模型的LQG控制的有效性 |
5.3 扰动抑制的可行性评估 |
5.4 本章小结 |
第6章 基于LQG控制的自适应光学系统扰动控制实验 |
6.1 基于室内实验平台的扰动控制 |
6.1.1 实验平台介绍 |
6.1.2 系统扰动模型辨识 |
6.1.3 扰动控制性能分析 |
6.2 1.8 mCLST系统扰动控制 |
6.2.1 1.8 m太阳望远镜平台简介 |
6.2.2 倾斜扰动模型辨识 |
6.2.3 倾斜扰动抑制 |
6.3 本章小结 |
第7章 自适应光学系统的混合控制策略 |
7.1 自适应光学系统混合控制策略 |
7.2 实验数据分析 |
7.2.1 数据分析 |
7.2.2 混合控制仿真 |
7.3 本章小结 |
第8章 总结与展望 |
8.1 本论文的主要研究内容 |
8.2 本论文的主要创新点 |
8.3 后续工作展望 |
参考文献 |
致谢 |
作者简历及攻读学位期间发表的学术论文与研究成果 |
四、最优控制、最优控制系统(论文参考文献)
- [1]敏捷航天器凝视观测任务规划及最优姿态控制[D]. 耿远卓. 哈尔滨工业大学, 2021(02)
- [2]时标随机最优控制问题[D]. 朱英俊. 山东大学, 2021(11)
- [3]时滞离散控制最优性的必要条件[D]. 李彩肖. 吉林大学, 2021(01)
- [4]基于自适应动态规划的机器人系统鲁棒控制研究[D]. 赵军. 昆明理工大学, 2021
- [5]自主泊车的最优轨迹规划与跟踪控制研究[D]. 吴冰. 合肥工业大学, 2021(02)
- [6]非线性双时间尺度系统自学习优化控制[D]. 刘晓敏. 中国矿业大学, 2021(02)
- [7]带遗忘因子迭代学习控制增益及性能优化问题研究[D]. 戴宝林. 兰州理工大学, 2021(01)
- [8]全电飞机用十五相永磁同步电机驱动控制系统的研究[D]. 匡志. 哈尔滨工业大学, 2021(02)
- [9]基于作物状态在线反馈的温室双闭环最优控制研究[D]. 徐丹. 中国农业科学院, 2020(06)
- [10]自适应光学系统扰动模型辨识及最优控制技术研究[D]. 王佳英. 中国科学院大学(中国科学院光电技术研究所), 2020(02)