也称为帕累托效率(Paretoefficiency),是指资源分配的一种理想状态,假定固有的一群人和可分配的资源,从一种分配状态到另一种状态的变化中,在没有使任何人境况变坏的前提下,使得至少一个人变得更好,这就是帕累托改进或帕累托最优化。
帕累托最优是博弈论中的重要概念
帕累托效率在工程学和社会科学都有广泛应用
通过例子给大家解释一下什么是帕累托最优,
例子1假设现在有两个人,甲和乙,分10块蛋糕,并且两个人都喜欢吃蛋糕。10块蛋糕无论在两个人之间如何分配,都是帕累托最优,因为你想让某一个人拥有更大利益的唯一办法是从另一个人手里拿走蛋糕,导致的结果是那个被拿走蛋糕的人利益受损。
例子2假设现在有两个人,甲和乙,分10块蛋糕10个包子。甲喜欢吃蛋糕而乙喜欢吃包子,而且甲讨厌吃包子,乙讨厌吃蛋糕(甲包子吃得越多越不开心,乙蛋糕吃得越多越不开心)。这种情形下,帕累托最优应当是:把10块蛋糕全部给甲,把10个包子全部给乙。因为任何其他的分配都会使得至少一个人手里拿着一些自己讨厌的东西,比如甲拥有10块蛋糕以及2个包子,乙拥有8个包子。这个时候,如果把2个包子从甲的手里转移到乙的手里,甲和乙都变得比原来更开心了,同时这样的转移并不会使得任何一方的利益受损。
对于一组策略选择(局势),若不存在其他策略选择使所有参与者得到至少和目前一样高的回报,且至少一个参与者会得到严格较高的回报,则这组策略选择为帕累托最优
帕累托最优的策略组合一共有3个,分别是(坦白,抗拒),(抗拒,坦白)和(抗拒,抗拒),这三个局势都是帕累托最优,也就是如果进行拍累托改进,有一方利益就是会受到损失,而对于纳什均衡策略组合(坦白,坦白)不是帕累托最优的策略。这是因为通过拍累托改进,可以转移到(抗拒,抗拒)的状态。
帕雷托有效是一个容易误导的概念,帕累托只考虑效率,不管公平。一个极端的配置是穷人一无所有,富人为富不仁。就拿囚徒困境来看,坦白和抗拒组合也是帕累托最优,没有帕累托改进余地,这是满足帕雷托有效的定义的,但显然,并不是最优解。
在一个博弈案例中,如果有多个纳什均衡点的情况下,所有博弈者通过相互合作达成总利益最大的纳什均衡点就是帕累托最优。
从源点s到目标点t有两条路,第一条路的代价恒为1,第二条的代价和选择该路的人数呈正比。