数学建模【动态规划研究的问题、动态规划思想、最短路问题、资源分配问题、多阶段决策问题 动态规划的最优子结构性质、动态规划的子问题重叠性质、前向优化、后向优化、解TSP问题】
数学规划:线性规划、非线性规划
动态规划 内容、处理方法、最优化理论
目 录
动态规划研究的问题
动态规划:整体最优解,由各段的决策变量构成。各段的决策变量的确定,与整体最优解密切相关。
当整体最优解确定后,每一段的决策变量才会确定下来。--> 动态过程 --> 动态规划
旅行售后问题、背包问题
内容
- 多阶段决策问题和最优化原理
- 定期多阶段决策问题
- 不定期多阶段决策问题
动态规划思想
动态规划(Dynamic Programming,DP)是运筹学的一个分支,是求解决策过程最优化的过程。20世纪50年代初,美国数学家贝尔曼(R.Bellman)等人在研究多阶段决策过程的优化问题时,提出了著名的最优化原理,从而创立了动态规划。动态规划的应用极其广泛,包括工程技术、经济、工业生产、军事以及自动化控制等领域,并在背包问题、生产经营问题、资金管理问题、资源分配问题、最短路径问题和复杂系统可靠性问题等中取得了显著的效果 [1] 。
动态规划思想:把解决一个问题分为n个阶段,从 当前阶段 到 最终实现目标 所采取的策略,是 最优策略。
1~n步,当前在第k步,到第n步结束,1~k步 不要求了,k~n步 必须满足最优策略。
问题举例一:最短路问题
基本思想(倒着推):
从f1到g的路程是最短的(不管a到f1);从f2到g的路程是最短的(不管a到f2);
从e1到g的路程是最短的(3+4=7);从e2到g的路程是最短的(2+3=5);从e3到g的路程是最短的(6+3=9);
从d1到g的路程是最短的【d1 -> e1(7+2=9),d1 -> e2(5+2=7)】;从d2到g的路程是最短的【1+5,2+9】;
依次倒着推... 算到a的时候,就得到了问题答案。
如何求解?(后向优化)
多阶段决策问题
递推关系式
l(u, v):u到v的距离。
逆向求解递推方程(标号法)
a -> b1 -> c2 -> d1 -> e2 -> f2 -> g.
动态规划表格
递归如何?循环如何?
问题举例二:资源分配问题
再描述一遍
注意回收资源 ♻
第1阶段 x1 = x
第2阶段 x2 = ay1 + b(x1 - y1)
...
如何求解?(后向优化)
例 5.1.2 离散变量的资源分配问题
如何求解?
计算一个单元格
说明
计算结果
递归的方法
多阶段决策问题
动态规划的最优子结构性质
动态规划的子问题重叠性质
前向优化
后向优化
例 5.1.2 连续变量的资源分配问题
加入只有一个部门生产
= max{g(x), h(x)} = max{
, 2
} = 2
.
:生产的第2阶段
利润(生产效益):g(x); ax:回收得到的剩余资源;
:利用 剩余资源 得到的利润
如果生产只有两个阶段的话,资源全部给B部门。
第3阶段:生产结束后,剩余ax资源;f2(ax):资源总数为ax的时候,经过2个阶段生产的最大收益是f2(ax)。
f3(ax):资源总数为ax,经过3个阶段生产的最大收益是f3(ax)。
g(x)+f4(ax):开始阶段的收益 + 后面4个阶段的最大收益。
例 5.3.2 多阶段有限资源分配问题
递推方程
U\{vj}:从U中把vj去掉。
例 5.3.1 解TSP问题
旅行商问题,即TSP问题(Traveling Salesman Problem)又译为旅行推销员问题、货郎担问题,是数学领域中著名问题之一。假设有一个旅行商人要拜访n个城市,他必须选择所要走的路径,路径的限制是每个城市只能拜访一次,而且最后要回到原来出发的城市。路径的选择目标是要求得的路径路程为所有路径之中的最小值。