动态规划（Dynamic Programming，DP）是运筹学的一个分支，是求解决策过程最优化的过程。20世纪50年代初，美国数学家贝尔曼（R.Bellman）等人在研究多阶段决策过程的优化问题时，提出了著名的最优化原理，从而创立了动态规划。动态规划的应用极其广泛，包括工程技术、经济、工业生产、军事以及自动化控制等领域，并在背包问题、生产经营问题、资金管理问题、资源分配问题、最短路径问题和复杂系统可靠性问题等中取得了显著的效果 [1] 。

动态规划思想：把解决一个问题分为n个阶段，从当前阶段到最终实现目标所采取的策略，是最优策略。

1~n步，当前在第k步，到第n步结束，1~k步不要求了，k~n步必须满足最优策略。

问题举例一：最短路问题

基本思想（倒着推）：

从f1到g的路程是最短的（不管a到f1）；从f2到g的路程是最短的（不管a到f2）；

从e1到g的路程是最短的（3+4=7）；从e2到g的路程是最短的（2+3=5）；从e3到g的路程是最短的（6+3=9）；

从d1到g的路程是最短的【d1 -> e1(7+2=9)，d1 -> e2(5+2=7)】；从d2到g的路程是最短的【1+5，2+9】；

依次倒着推... 算到a的时候，就得到了问题答案。

如何求解？（后向优化）

多阶段决策问题

递推关系式

l(u, v)：u到v的距离。

逆向求解递推方程（标号法）

a -> b1 -> c2 -> d1 -> e2 -> f2 -> g.

动态规划表格

递归如何？循环如何？

问题举例二：资源分配问题

再描述一遍

注意回收资源 ♻

第1阶段 x1 = x

第2阶段 x2 = ay1 + b(x1 - y1)

...

如何求解？（后向优化）

例 5.1.2 离散变量的资源分配问题

如何求解？

计算一个单元格

说明

计算结果

递归的方法

多阶段决策问题

动态规划的最优子结构性质

动态规划的子问题重叠性质

前向优化

后向优化

例 5.1.2 连续变量的资源分配问题

加入只有一个部门生产 = max{g(x), h(x)} = max{, 2} = 2.

：生产的第2阶段

利润（生产效益）：g(x)； ax：回收得到的剩余资源；：利用剩余资源得到的利润

如果生产只有两个阶段的话，资源全部给B部门。

第3阶段：生产结束后，剩余ax资源；f2(ax)：资源总数为ax的时候，经过2个阶段生产的最大收益是f2(ax)。

f3(ax)：资源总数为ax，经过3个阶段生产的最大收益是f3(ax)。

g(x)+f4(ax)：开始阶段的收益 + 后面4个阶段的最大收益。

例 5.3.2 多阶段有限资源分配问题

递推方程

U\{vj}：从U中把vj去掉。

例 5.3.1 解TSP问题

旅行商问题，即TSP问题（Traveling Salesman Problem）又译为旅行推销员问题、货郎担问题，是数学领域中著名问题之一。假设有一个旅行商人要拜访n个城市，他必须选择所要走的路径，路径的限制是每个城市只能拜访一次，而且最后要回到原来出发的城市。路径的选择目标是要求得的路径路程为所有路径之中的最小值。

数学建模【动态规划研究的问题、动态规划思想、最短路问题、资源分配问题、多阶段决策问题 动态规划的最优子结构性质、动态规划的子问题重叠性质、前向优化、后向优化、解TSP问题】

动态规划研究的问题

内容

动态规划思想

问题举例一：最短路问题

如何求解？（后向优化）

逆向求解递推方程（标号法）

动态规划表格

递归如何？循环如何？

问题举例二：资源分配问题

再描述一遍

如何求解？（后向优化）

例 5.1.2 离散变量的资源分配问题

如何求解？

计算一个单元格

说明

计算结果

递归的方法

多阶段决策问题

动态规划的最优子结构性质

动态规划的子问题重叠性质

前向优化

后向优化

例 5.1.2 连续变量的资源分配问题

例 5.3.2 多阶段有限资源分配问题

递推方程

例 5.3.1 解TSP问题

计算一个单元格

计算过程

相关推荐

数学建模【动态规划研究的问题、动态规划思想、最短路问题、资源分配问题、多阶段决策问题动态规划的最优子结构性质、动态规划的子问题重叠性质、前向优化、后向优化、解TSP问题】