> ## Documentation Index
> Fetch the complete documentation index at: https://base.bangwu.me/llms.txt
> Use this file to discover all available pages before exploring further.

# Game theory

> Course notes on game theory covering Nash equilibrium, mixed strategies, the prisoner's dilemma, social cooperation, and decision goals.

# 博弈论

> \[!note]
> 简答题(每个要点 3 句话)、论述题(5 句话)、辨析题(与简答题相同)、计算题

## 导论

指明决策的目的、指明决策层次

**必要**目标和**需要**目标

决策者应该是做选择题，而不是做问答题

策划也是年轻人从执行者走向决策者的必由之路

## 个体理性与社会合作

> 社会的基本问题

**社会**是个体之间具有相互行动和相互依赖的群体

社会的两个基本问题：`协调`【如何形成一致预期】、`合作`【如何提供共赢激励】

协调问题的核心是预测，合作问题的核心是激励【个体理性、集体理性】

协作博弈：一荣俱荣，一损俱损。双方都希望得到最有利于自己的协调结果

> 个体理性行为

博弈论：分析理性人在存在相互依赖的情况下如何决策的理论工具

博弈论的基本假设：工具理性假设【所有人是工具理性的】、理性共知假设【工具理性是所有人的共同知识】、规则共知假设【博弈规则是所有人的共同知识】->“谁也不比谁傻”

`约束条件`：技术性约束、制度性约束、信息约束、资源(收入/成本)约束

人们选择的不同，可能是由于偏好不同，也可能是由于面临的约束条件不同，如买车

> 社会效率标准

`帕累托效率`：一种状态(资源配置、社会制度等)被称为`帕累托最优状态`，如果不存在另一种状态能使得没有任何人的处境变坏同时至少有一个人的处境变得更好【除非“损人”就不可能“利己”】

![bangwu20250112085533](https://cdn.bangwu.top/img/202501120855047.webp)

`卡尔多-希克斯标准`：如果一种变革使得受益者的所得足以弥补受损者的所失，这种变革就是一个`卡尔多-希克斯改进`。【状态 X 下，A 的收入是 100，B 的收入也是 100；在状态 Y 下，A 的收入是 1000，B 的收入是 99】“总财富最大化”

## 纳什均衡与囚徒困境博弈

![bangwu20250112090048](https://cdn.bangwu.top/img/202501120900987.webp)

`反复剔除`不仅要求每个人是理性的，而且要求每个人知道其他人是理性的，甚至要求每个人知道每个人知道每个人是理性的，如此等等，即**理性是“共同知识”（理性共识）**

## 多重均衡与制度和文化

社会制度和社会规范，通过写台哦人们的预期而形成一个特定的纳什均衡

## 许诺(威胁)与承诺

许诺或威胁是事前声称战略，其可信性取决于事前与事后最优选择是否一致。像考试博弈中部分学生 “报复” 威胁不可信，因无论老师判分如何，“报复” 都非最优。

\*\*承诺（威慑）\*\*是使许诺（威胁）前后最优一致的行动，通过限制自身或对方自由增强可信度，成本越高越可信，如婚姻彩礼、订金等都是常见的承诺形式。

## 讨价还价与耐心

不是**零和博弈**而是**正和博弈**

贴现因子

## 演化博弈与自发秩序

`ESS(演化稳定战略)`：社会（种群）中的稳定行为方式，能击败任何变异，可以持续存在、不断地复制自己。 ESS 一定是纳什均衡，但并非所有的纳什均衡都是 ESS，**单元均衡**

演化均衡不一定是帕累托最优均衡

一般地，一次性囚徒困境如果存在占优战略，该占优战略是 ESS

## 支付矩阵计算

### 一、完全信息静态博弈

> **博弈的支付矩阵和纳什均衡**

`纳什均衡`：如果别人的策略固定不动，那么我也没有动机改变。所有人都是如此

要会根据`支付矩阵`找出纳什均衡

无限策略的博弈和纳什均衡：

> 古诺双头垄断模型

$$
P=a - bQ=a - b\times\frac{2(a - c_1 - c_2)}{3b}=\frac{a + 2c_1 + 2c_2}{3}
$$

> 混合策略纳什均衡

当纯策略纳什均衡不存在时，找不出纳什均衡的状况。固定一个不变，求另一个，然后画图找交点

### 二、不完全信息静态博弈

不同概率的支付矩阵，至少有一个参与者不能确定另一个参与者的收益函数

n 个支付矩阵、无限策略

### 三、完全信息动态博弈

参与者的行动是**顺序发生的**，根据所有参与者的选择，每个参与者得到各自的结果。每一位参与者的支付函数在所有参与者之间是共同知识。

> 完全且**完美**信息的动态博弈

每一步当中，要选择行动的参与者都知道这一步之前博弈进行的过程

> 完全但**不完美**信息的动态博弈

某些阶段，要选择行动的参与者不知道这一步之前的博弈过程

> **先行动的参与者支付在前**

![bangwu20250110085416](https://cdn.bangwu.top/img/202501100854552.webp)

古诺模型要联立

> 有限重复博弈

把第二步结果代入第一步，列出矩阵

![bangwu20250110093036](https://cdn.bangwu.top/img/202501100930420.webp)

> 无限重复博弈

贴现因子，短见的=0，长远的=1

`子博弈精炼`：子博弈也是纳什均衡的

### 四、不完全信息动态博弈

参与人自己知道，其他参与人不知道——不完全信息

行动有先后，后行动者能观测到先行动者的行动，但不能观测其类型

**混同**、**分离**均衡