2020-05-14发表2020-05-14更新运筹学17 分钟读完 (大约2499个字)

决策论笔记

决策论概述

决策的内涵

决策是在人们的政治、经济、技术和日常生活中，为了达到预期目的，从所有可供选择的多个方案中，找出最满意方案的一种活动。

狭义决策认为决策就是做决定，单纯强调最终结果。
广义决策认为将管理过程的行为都纳入决策范畴，决策贯穿于整个管理过程中。

决策目标：决策者希望达到的状态，工作努力的目的。一般而言，在管理决策中决策者追求的当然是利益最大化。

决策准则：决策判断的标准，备选方案的有效性度量。

决策属性：决策方案的性能、质量参数、特征和约束，如技术指标、重量、年龄、声誉等，用于评价它达到目标的程度和水平。

科学决策过程：任何科学决策的形成都必须执行科学的决策程序。

决策的基本要素

决策者：决策的主体，一个人或团体。
两个以上可供选择的行动方案，记为 $d_j$ 。
状态（事件）：决策实施后可能遇到的自然状况，记为 $\theta_i$ 。
状态概率：对各状态发生可能性大小进行主观估计，记为 $P(\theta_i)$ 。
结局（损益）：当决策 $d_j$ 实施后遇到的状态 $\theta_i$ 所产生的的效益（利润）或损失（成本），记为 $\mu_{ij}$ ，用损益表表示。
损益表

决策的分类

按决策影响范围分类：

战略决策
战术决策

按决策的状态空间分类：

确定型决策：状态只有一种；
不确定型决策：状态不止一种，且决策者对状态发生的概率未知；
风险型决策：状态不止一种，但决策者对状态发生的概率已知。

按决策的时间分类：

程序决策
非程序决策
半程序决策

按描述方法分类：

定性决策
定量决策
定性与定量相结合

按目标数量分类：

单目标决策
多目标决策

按决策过程的连续性分类：

单级决策
序贯决策

按决策者数量分类：

个人决策
群决策

按问题大小分类：

宏观决策
微观决策

决策的过程

确定目标
收集信息
提出方案
预决策过程
方案优选
决策

决策的模型

决策者
决策方案（属性、目的、目标）
状态
准则
收益
价值观

不确定型决策

不确定型决策：决策者对状态发生的概率一无所知。

$A=(a_{ij})$ 表示 $i$ 策略在 $j$ 状态下的收益值，不确定决策方法就是在给定决策矩阵 $A$ ，决策者对状态发生的情况一无所知的情况下如何确定最优决策？

由于在不确定决策中，各种决策环境是不确定的，所以对于同一个决策问题，用不同的方法求值，将会得到不同的结论，在现实生活中，同一决策问题，决策者偏好不同，也会使得处理相同问题的原则方法不同。

不确定型决策方法

悲观主义准则（maxmin准则）

$S^*_i = \displaystyle\max_i(\min_j(a_{ij}))$ ，先每行求最小，后各列求最大得最优策略。
乐观主义准则(maxmax准则)

$S^*_i = \displaystyle\max_i(\max_j(a*{ij}))$ ，先每行求最大，后各列求最大得最优策略。
等可能准则

$S_i^* = \displaystyle\max_i(\sum_{j=1}^n\frac{a_{ij}}{n})$

先每行求平均值，后各列求最大得最优决策。
最小机会损失准则

先用每列的最大值减去各列元素得到损失矩阵 $A'$ ，

$S_i^*=\displaystyle\min_i(\max_ja_{ij}^{'})$
折衷主义准则

先每行分别求最小值、最大值，然后乘上一个乐观系数，以此为标准进行选择。

$s_i^*=\displaystyle\max_i(\alpha\max_j(a_{ij})+(1-\alpha)\min_j(a_{ij}))$

风险型决策

风险型决策：决策者对状态发生概率是已知的。

数学期望方法

$S_i^*=\displaystyle\max_i(\sum_{j=1}^n p_j a_{ij})$

决策树的组成：

决策节点
状态节点
结果节点（收益）

决策树

□ 表示决策节点。节点中的数字为决策后最优方案的益损期望值。从它引出的分支是方案分支。
⬭ 表示方案节点。节点中数字为节点号，节点上的数据是该方案的损益期望值。从它引出的分支叫状态分支。在分支上表明状态和出现的概率。
△ 表示结果节点。节点中数字为每一个方案在相应状态下的益损值。

利用决策树进行决策时的两个步骤：

画决策树——从根部到枝部。问题的益损矩阵就是决策树的框图。
决策过程——从枝部到根部。先计算每个行动的益损期望值，再比较各行动方案的值，将最大的期望值保留，同时截去其他方案的分枝。

修正概率方法

贝叶斯决策：开始人们对原来的参数提出了某一个概率分布。后来通过调查又获得许多信息，只要原来的信息不是错误的，则应该用后来的补充信息修正原来的认识。用补充情报改进原来的概率分布。

主观概率：将依据过去的信息或经验由决策者估计的概率称之为主观概率。

先验概率：未收到新信息时根据已有的信息和经验，估计出概率分布称为先验概率。

客观概率：用随机试验确定出的概率称为客观概率。

后验概率：收到新信息，修正后的概率分布称为后验概率。

条件概率：事件B已经发生的条件下，事件A发生的概率，称为事件A在给定B下的条件概率。

$P(B|A)=\frac{P(AB)}{P(A)}, P(A|B)=\frac{P(AB)}{P(B)}$

贝叶斯公式：若 $A_1,A_2,\dots,A_n$ 构成一个完备事件， $P(A_m)>0$ ，则对任何概率不为零的时间B，有

$P(A_m|B)=\frac{P(A_m)P(B|A_m)}{\displaystyle\sum_iP(A_i)P(B|A_i)}, \quad m=1,2,\dots,n$

此公式为后验概率。

效用理论

贝努利（D. Berneulli）首次提出效用概念，他用下图表示出人们对钱财的真实价值的考虑与其钱财拥有量之间的关系，这就是贝努利货币效用函数。

效用是一种相对的指标值，它的大小表示决策者对于风险的态度，对某事物的倾向、偏差等主观因素的强弱程度。

如果每个方案的期望值相等，即用最大期望值决策不合适，可以用最大效用值期望准则。

确定效用曲线的基本方法有两种：

直接提问法，需要决策者回答提问，主观衡量，应用较少；
对比提问法，此方法使用较多。

对比提问法：

设现有 $A_0,A_1$ 两种方案供选择。 $A_0$ 表示决策者不需要花费任何风险可获收益 $x_0$ ；而 $A_1$ 有两种自然状态，可以概率 $P$ 获得收益 $x_1$ ，以概率 $(1-P)$ 获得收益 $x_2$ ；且 $x_1>x_0>x_2$ ；

令 $y_i$ 表示效益 $x_i$ 的效用值，则 $x_0,x_1,x_2$ 的效用值分别用 $y_0,y_1,y_2$ 。若在某条件下，决策者认为 $A_0,A_1$ 两方案等价，则有：

Py_1+(1-P)y_2=y_0

4个数 $p,x_0,x_1,x_2$ 中给定3个，提问第4个变量有决策者决定，求出效用值。

一般采用改进V-M（Von Neumann-Morgenstern）方法，固定 $P=0.5,x_1,x_2$ 改变 $x_0$ 三次，得出相应的 $y$ 值，确定三点，作出效用曲线。

0.5y(x_1)+0.5y(x_2)=y(x_0)

不同决策者对待风险态度不同，因而会得到不同形状的效用曲线。一般可分为保守型I、中间型II、风险型III，如下图

图中I为保守型，其特点为：当收益指较小时，效用值增加较快；随收益值增大时，效用值增加速度变慢，表明决策者不求大利，谨慎小心、保守。

图中II为中间型，其特点为：收益指与效用值成正比，表明决策者完全按机遇办事，心平气和。

图中III为风险型，其特点与I保守型恰好相反，当收益较小时，效用值增加较慢；随收益值增大时，效用值增加速度变快，表明决策者对增加收益反应敏感，愿冒较大风险，谋求大利，不怕冒险。

决策论笔记

https://hoooo.org/2020/05/14/decision_theory/

作者

Hu

发布于

2020-05-14

更新于

2020-05-14

许可协议

#决策论运筹学

决策论笔记

决策论概述

决策的内涵

决策的分类

决策的过程

决策的模型

不确定型决策

风险型决策

修正概率方法

作者

发布于

更新于

许可协议

评论

分类

归档

标签

订阅更新

目录