如何用动态规划解决极大值和极小值之间的最大宽度

如题所述

动态规划算法 概念及意义  动态规划(dynamic programming)是运筹学的一个分支,是求解决策过程(decision process)最优化的数学方法。20世纪50年代初美国数学家R.E.Bellman等人在研究多阶段决策过程(multistep decision process)的优化问题时,提出了著名的最优化原理(principle of optimality),把多阶段过程转化为一系列单阶段问题,利用各阶段之间的关系,逐个求解,创立了解决这类过程优化问题的新方法——动态规划。1957年出版了他的名著Dynamic Programming,这是该领域的第一本著作。
  动态规划问世以来,在经济管理、生产调度、工程技术和最优控制等方面得到了广泛的应用。例如最短路线、库存管理、资源分配、设备更新、排序、装载等问题,用动态规划方法比用其它方法求解更为方便。
  虽然动态规划主要用于求解以时间划分阶段的动态过程的优化问题,但是一些与时间无关的静态规划(如线性规划、非线性规划),只要人为地引进时间因素,把它视为多阶段决策过程,也可以用动态规划方法方便地求解。
  动态规划程序设计是对解最优化问题的一种途径、一种方法,而不是一种特殊算法。不象前面所述的那些搜索或数值计算那样,具有一个标准的数学表达式和明确清晰的解题方法。动态规划程序设计往往是针对一种最优化问题,由于各种问题的性质不同,确定最优解的条件也互不相同,因而动态规划的设计方法对不同的问题,有各具特色的解题方法,而不存在一种万能的动态规划算法,可以解决各类最优化问题。因此读者在学习时,除了要对基本概念和方法正确理解外,必须具体问题具体分析处理,以丰富的想象力去建立模型,用创造性的技巧去求解。我们也可以通过对若干有代表性的问题的动态规划算法进行分析、讨论,逐渐学会并掌握这一设计方法。 基本模型   
  多阶段决策过程的最优化问题。
  在现实生活中,有一类活动的过程,由于它的特殊性,可将过程分成若干个互相联系的阶段,在它的每一阶段都需要作出决策,从而使整个过程达到最好的活动效果。当然,各个阶段决策的选取不是任意确定的,它依赖于当前面临的状态,又影响以后的发展,当各个阶段决策确定后,就组成一个决策序列,因而也就确定了整个过程的一条活动路线,如图所示:(看词条图)
  这种把一个问题看作是一个前后关联具有链状结构的多阶段过程就称为多阶段决策过程,这种问题就称为多阶段决策问题。 记忆化搜索   给你一个数字三角形, 形式如下:
  1
  2 3
  4 5 6
  7 8 9 10
  找出从第一层到最后一层的一条路,使得所经过的权值之和最小或者最大.
  无论对与新手还是老手,这都是再熟悉不过的题了,很容易地,我们写出状态转移方程:f(i, j)=a[i, j] + min{f(i+1, j),f(i+1, j + 1)}
  对于动态规划算法解决这个问题,我们根据状态转移方程和状态转移方向,比较容易地写出动态规划的循环表示方法。但是,当状态和转移非常复杂的时候,也许写出循环式的动态规划就不是那么简单了。
  解决方法:
  我们尝试从正面的思路去分析问题,如上例,不难得出一个非常简单的递归过程 :
  f1:=f(i-1,j+1); f2:=f(i-1,j);
  if f1>f2 then f:=f1+a[i,j] else f:=f2+a[i,j];
  显而易见,这个算法就是最简单的搜索算法。时间复杂度为2^n,明显是会超时的。分析一下搜索的过程,实际上,很多调用都是不必要的,也就是把产生过的最优状态,又产生了一次。为了避免浪费,很显然,我们存放一个opt数组:Opt[i, j] - 每产生一个f(i, j),将f(i, j)的值放入opt中,以后再次调用到f(i, j)的时候,直接从opt[i, j]来取就可以了。于是动态规划的状态转移方程被直观地表示出来了,这样节省了思维的难度,减少了编程的技巧,而运行时间只是相差常数的复杂度,避免了动态规划状态转移先后的问题,而且在相当多的情况下,递归算法能更好地避免浪费,在比赛中是非常实用的. 状态 决策   
  决策:
  当前状态通过决策,回到了以前状态.可见决策其实就是状态之间的桥梁。而以前状态也就决定了当前状态的情况。数字三角形的决策就是选择相邻的两个以前状态的最优值。
  状态:
  我们一般在动规的时候所用到的一些数组,也就是用来存储每个状态的最优值的。我们就从动态规划的要诀,也就是核心部分“状态”开始,来逐步了解动态规划。有时候当前状态确定后,以前状态就已经确定,则无需枚举.
   动态规划算法的应用   一、动态规划的概念
  近年来,涉及动态规划的各种竞赛题越来越多,每一年的noi几乎都至少有一道题目需要用动态规划的方法来解决;而竞赛对选手运用动态规划知识的要求也越来越高,已经不再停留于简单的递推和建模上了。
  要了解动态规划的概念,首先要知道什么是多阶段决策问题。
  1. 多阶段决策问题
  如果一类活动过程可以分为若干个互相联系的阶段,在每一个阶段都需作出决策(采取措施),一个阶段的决策确定以后,常常影响到下一个阶段的决策,从而就完全确定了一个过程的活动路线,则称它为多阶段决策问题。
  各个阶段的决策构成一个决策序列,称为一个策略。每一个阶段都有若干个决策可供选择,因而就有许多策略供我们选取,对应于一个策略可以确定活动的效果,这个效果可以用数量来确定。策略不同,效果也不同,多阶段决策问题,就是要在可以选择的那些策略中间,选取一个最优策略,使在预定的标准下达到最好的效果.
  2.动态规划问题中的术语
  阶段:把所给求解问题的过程恰当地分成若干个相互联系的阶段,以便于求解,过程不同,阶段数就可能不同.描述阶段的变量称为阶段变量。在多数情况下,阶段变量是离散的,用k表示。此外,也有阶段变量是连续的情形。如果过程可以在任何时刻作出决策,且在任意两个不同的时刻之间允许有无穷多个决策时,阶段变量就是连续的。
  在前面的例子中,第一个阶段就是点A,而第二个阶段就是点A到点B,第三个阶段是点B到点C,而第四个阶段是点C到点D。
  状态:状态表示每个阶段开始面临的自然状况或客观条件,它不以人们的主观意志为转移,也称为不可控因素。在上面的例子中状态就是某阶段的出发位置,它既是该阶段某路的起点,同时又是前一阶段某支路的终点。
  在前面的例子中,第一个阶段有一个状态即A,而第二个阶段有两个状态B1和B2,第三个阶段是三个状态C1,C2和C3,而第四个阶段又是一个状态D。
  过程的状态通常可以用一个或一组数来描述,称为状态变量。一般,状态是离散的,但有时为了方便也将状态取成连续的。当然,在现实生活中,由于变量形式的限制,所有的状态都是离散的,但从分析的观点,有时将状态作为连续的处理将会有很大的好处。此外,状态可以有多个分量(多维情形),因而用向量来代表;而且在每个阶段的状态维数可以不同。
  当过程按所有可能不同的方式发展时,过程各段的状态变量将在某一确定的范围内取值。状态变量取值的集合称为状态集合。
  无后效性:我们要求状态具有下面的性质:如果给定某一阶段的状态,则在这一阶段以后过程的发展不受这阶段以前各段状态的影响,所有各阶段都确定时,整个过程也就确定了。换句话说,过程的每一次实现可以用一个状态序列表示,在前面的例子中每阶段的状态是该线路的始点,确定了这些点的序列,整个线路也就完全确定。从某一阶段以后的线路开始,当这段的始点给定时,不受以前线路(所通过的点)的影响。状态的这个性质意味着过程的历史只能通过当前的状态去影响它的未来的发展,这个性质称为无后效性。
  决策:一个阶段的状态给定以后,从该状态演变到下一阶段某个状态的一种选择(行动)称为决策。在最优控制中,也称为控制。在许多间题中,决策可以自然而然地表示为一个数或一组数。不同的决策对应着不同的数值。描述决策的变量称决策变量,因状态满足无后效性,故在每个阶段选择决策时只需考虑当前的状态而无须考虑过程的历史。
  决策变量的范围称为允许决策集合。
  策略:由每个阶段的决策组成的序列称为策略。对于每一个实际的多阶段决策过程,可供选取的策略有一定的范围限制,这个范围称为允许策略集合。允许策略集合中达到最优效果的策略称为最优策略。
  给定k阶段状态变量x(k)的值后,如果这一阶段的决策变量一经确定,第k+1阶段的状态变量x(k+1)也就完全确定,即x(k+1)的值随x(k)和第k阶段的决策u(k)的值变化而变化,那么可以把这一关系看成(x(k),u(k))与x(k+1)确定的对应关系,用x(k+1)=Tk(x(k),u(k))表示。这是从k阶段到k+1阶段的状态转移规律,称为状态转移方程。
  最优性原理:作为整个过程的最优策略,它满足:相对前面决策所形成的状态而言,余下的子策略必然构成“最优子策略”。
  最优性原理实际上是要求问题的最优策略的子策略也是最优。让我们通过对前面的例子再分析来具体说明这一点:从A到D,我们知道,最短路径是A??B1??C2??D,这些点的选择构成了这个例子的最优策略,根据最优性原理,这个策略的每个子策略应是最优:A??B1??C2是A到C2的最短路径,B1??C2??D也是B1到D的最短路径……──事实正是如此,因此我们认为这个例子满足最优性原理的要求。
温馨提示:内容为网友见解,仅供参考
无其他回答

如何用动态规划解决极大值和极小值之间的最大宽度
我们一般在动规的时候所用到的一些数组,也就是用来存储每个状态的最优值的。我们就从动态规划的要诀,也就是核心部分“状态”开始,来逐步了解动态规划。有时候当前状态确定后,以前状态就已经确定,则无需枚举.动态规划算法的应用 一、动态规划的概念 近年来,涉及动态规划的各种竞赛题越来越多,每一年的...

运筹学可以解决哪些实际问题?
--3-- 条件下目标函数的极值(极大值或极小值)问题。具体来讲,线性规划可以解决生产过程的优化、物流方面的运输以及资源的配置问题等;整数线性规划可以 求解企业的投资决策问题、旅行售货员问题等;而动态规划所研究的对象是多阶段决策问题,主要用来解决最短路线问 题、多阶段资源分配问题、生产和存储...

钱学森的工程控制论。的免费下载地址。
研究如何以最小的代价达到控制的目的的原理和方法称为最优控制理论。寻求以最短时间达到控制目的的理论称为最速控制理论。线性规划、动态规划、极大值原理、最优化理论等都是经过实践证明具有严密结构的最优控制理论。为了解决最优控制的工程实现问题,科学家们又创造了很多适用于计算机程序的算法,称为最优化技术。最优...

最优控制简介
最优控制,作为现代控制理论的核心,关注的核心问题在于如何在满足特定限制条件的前提下,探寻最佳的控制策略,以便使性能指标达到最大化或最小化。其核心目标是寻找一个允许的控制方案,使得动力学系统或运动过程从初始状态到目标状态的迁移过程中,性能指标表现出最优状态。这种理论的应用广泛,例如在技术领...

极小值原理总结-1
因此,极小值原理由庞特里亚金及其学生提出,用以适应控制输入有界的现实情况。极小值原理与变分法不同的是,后者在极小值原理的基础上考虑了控制输入的边界约束,因此也被称为现代变分法。现代最优控制理论中,极小值原理和动态规划方法是两大基石。极小值原理处理对象分为离散系统和连续系统,处理...

最优控制研究方法
动态规划法和极小值原理本质上共享着解析法的特性,它们通过数学解析手段,精确地求解最优控制问题。除此之外,变分法和线性二次型控制法同样作为解析法的一部分,为解决最优控制问题提供了有力的数学工具。然而,解析法并非最优控制问题研究的唯一途径。数值计算法作为一种非解析方法,通过数值逼近和迭代...

暑期随笔 | 非线性 PDE 中的极大值原理
对于一阶问题,尽管线性方程有明确的Sobolev理论支持,但非线性情况下的极大值原理成为解决难题的关键。Crandall-Lions在粘性解定义上做出了重要贡献,他们利用乘法求导法则,将解的导数转换,从而给出了粘性解的直观理解。二阶非线性PDEs则涉及动态规划和双曲守恒律,这些领域的联系揭示了弱解为何采用粘性解...

确定型决策的方法主要有
3. 微分极值决策法:这种方法是根据决策变量的经济关系建立数学模型,通过求导得到极大值和极小值来做出决策。4. 线性规划决策法:该方法旨在找到能使目标达到最大或最小值,并且能满足一组约束条件的一组决策变量值。在运用这些方法时,决策者只需从所有可选方案中选择一个策略方案,因为每个方案只能...

物流专业对你来说有什么用途
1.通过对线性规划的学习,在资源分配方面提供了很大的帮助。在目前的条件下,通过对极大值货极小值的测算,帮助我按照某一衡量指标来寻找最优方案。线性规划帮助我在解决物资调运、配送和人员分派等问题;整数规划可以求解完成工作所需的人数、机器设备台数和厂、库的选址等;动态规划可用来解决诸如最优...

最优控制数学角度
解决此类问题的主要策略有几种:首先,古典变分法是一种基础的数学方法,它通过对泛函求极值来处理这类问题;其次,极大值原理也是一大工具,它提供了解决优化问题的重要指导;最后,动态规划则在处理具有时间序列决策问题时发挥关键作用。最优控制的应用广泛,例如在控制系统设计中,它被用来构建最速、最...

相似回答