11智能在线
新记
个阶段的状态确定后,可以作出各种选择从而演变到下一阶段的某个状态,这 种选择手段称为决策(decis
如题所述
举报该文章
其他看法
第1个回答 推荐于2016-08-31
) k k U x 表示 k x 的允许决策集合。在例1中 ( ) 2 1 u B 可取 1 2 C ,C 或 3 C ,
可记作 (1) 1,2,3 2 u = ,而 (1) {1,2,3} 2 U = 。
决策变量简称决策。
2.1.4 策略
决策组成的序列称为策略(policy)。由初始状态1 x 开始的全过本回答被提问者采纳
相似回答
大家正在搜
相关问题
列称为策略(policy)。由初始状态1 x 开始的全过程的...
policystrategy都是策略,有什么区别
变量(state variable)。变量允许取值的范围称允...
动态规划技术与贪婪技术各有什么特点
动态规划是研究什么问题最优化的一种方法
如何用动态规划解决极大值和极小值之间的最大宽度
语文高手进,请教各种答题模式
在输掉对局后,双方哪一种行为是正确的