§2 矩阵对策模型。
具有竞争或对抗性质的现象称为对策行为。在对策行为中,各方面要达到自己的目标,必须考虑对手的各种可能行动方案,从而选出对自己的最有利的策略。
在一个对策行为中,有权决定自己的行动方案的对策参加者称为局中人。一般在一个对策中至少有两个局中人,我们把只有两个局中人的对策称为二人对策,而多于两个局中人的对策称为多人对策。
策略是指在一个对策中,可供局中人采用的实际可行的完整方案。每个局中人策略的全体集合称为策略集。每个局中人从自己的策略集中选择一个策略,便构成一个局势。
当局势确定了,则对策的结果就确定了。对每个局中人而言,就是或胜或负、名次的前或后、财物的收入或支出等等。这些结果可以用数字来表示,于是我们得到在全部局势集合上的一个实值函数,用它来描述每个局势完结后局中人的得失,这个函数称为赢得函数。
在任一局势中,全体局中人的赢得函数值和等于零时,称为零和对策。其实,如果每种对策组合的结果是一个和具体对策组合无关的常数,也都可以作为零和对策。
一般二人有限零和对策的赢得函数可用**形式表示出来,这个**又可用矩阵来表示。在对策模型中,设甲、乙为两个局中人,甲和乙的策略集分别为和,当甲选定策略,而乙选定策略时,就有了局势,对此局势局中人甲的赢得函数值为,我们称为局中人甲的赢得矩阵。因此也称为一个矩阵对策,记为。
为了不和后面的有关概念混淆,以后称策略为纯策略,称局势为纯局势。
对于一个矩阵对策,在什么情况下,对策双方才能选出对自己的最有利的策略?即存在最优纯策略的条件是什么?下面通过一个例子加以阐述。
如果两家电视台可能**的节目分别为四个、三个、甲台节目收视率(%)如下表所示:
表1 甲台节目收视率(%)
为获得最大收视率,他们各自会采取什么样的对策呢?
分析情况可以用通过下表表示。表中最后一列的数字是同一行数字中的最小值。例如表中第三行对应甲台**节目a,最后一个数字是35,它是是三个数字中的最小值,称之为甲台节目a收视率的保守估计。
这个数字表示当甲**节目a时所能得到的最起码的收视率。而在这一列上面的第一个数字a(=50),是甲台各节目收视率保守估计(35,40,50,45)中的最大值。a表示在所有可能的选择中,甲台所能得到保证的收视率中的最大值。
a=50所对应的节目c,也是甲台最稳妥的选择。表中的最后一行是同一列数字中的最大的值。例如该行的第三个数字是50,它是四个数字中的最大值。
这个数字对应乙台**节目2时的情况,说明当乙台**节目2时,只要甲台应对得当(此时甲应该**节目c),甲台所能够得到的最高收视率。这个数字称为乙台**节目2时甲台收视率的乐观估计。该行的第一个数字b=50是所有这一行中数字中的最小值。
表示的是对乙台所有可能的选择,只要应对得当,甲台所能获得的最起码的收视率。在右下角的数字c与a、b相等,这里是50。对应这个数字的是甲台**节目c,乙台**节目2,各获得50%的收视率。
这就是两家电视台会采取的科学对策。
表2 基于甲台节目收视率的双方对策分析表(%)
设为甲台**节目(a、b、c、d)和乙台**节目)时甲台的收益,那么此解满足:。这便是矩阵对策双方存在最优纯策略的条件。
下面具体分析双方采取其他对策组合会发生什么情况。结论将是:任何一方改变选择都将降低自己的收视率,从而双方都不会采用除此以外的其他对策。这也是称此决策为“均衡对策”的原因。
假设甲台不**节目c而**节目a,期望得到更高的收视率(70%);但是此时乙台**节目3,使甲台只能得到35%的收视率,比均衡对策组合中甲得到的收视率(50%)低。而如果乙台不是**节目2,而是**节目3,期望得到更高的收视率(65%)。则此时甲台仍会**节目c,使得乙台只得到45%的收视率,也将低于均衡对策组合50%的收视率。
其他对策组合也将有同样的结果,因而,甲台**节目c、乙台**节目2是双方都能接受的结果。
在矩阵对策中,若,称这个公共值为对策的最优值,取得这个公共值的纯局势称为的纯策略意义下的解,也为的鞍点。而和分别称为局中人甲和乙的最优纯策略,也称纳什均衡解。
在纯策略意义下有鞍点存在的充分必要条件是存在一个纯局势,使得对一切和,均有成立。
数学建模案例分析 对策与决策方法建模6决策树法
6 决策树法。对较为复杂的决策问题,特别是需要做多个阶段决策的问题,最常用的方法是决策树法。决策树法是把某个决策问题未来发展情况的可能性和可能结果所做的 用树状图画出来。其步骤如下 1 用方框表示决策点。从决策点画出若干条直线或折线,每条线代表一个行动方案,这样的直线或折线称为方案枝。2 在各方案枝...
数学建模案例分析 对策与决策方法建模6决策树法
6 决策树法。对较为复杂的决策问题,特别是需要做多个阶段决策的问题,最常用的方法是决策树法。决策树法是把某个决策问题未来发展情况的可能性和可能结果所做的 用树状图画出来。其步骤如下 1 用方框表示决策点。从决策点画出若干条直线或折线,每条线代表一个行动方案,这样的直线或折线称为方案枝。2 在各方案枝...
数学建模案例分析 对策与决策方法建模5不确定型决策
二 等可能性 laplace 准则。当决策者面临着几种自然状态可能发生时,在没有确切理由说明某一自然状态有更多的发生机会时,那么只能认为各种自然状态发生的机会是均等的。决策的一般步骤为 1 计算各方案的收益平均值 平均值 该方案在各种自然状态下收益值的和 自然状态数。2 在这些收益平均值中选出最大者...