在算法竞赛的博弈论领域,巴什博弈(Bash Game)是最基础、最经典的公平组合游戏模型,也是入门博弈论的必经之路。它以简单的规则为载体,蕴含着博弈论的核心思想 ——必胜态与必败态的推导,掌握巴什博弈的解题思路,能为后续学习 Nim 博弈、SG 函数等复杂博弈模型打下坚实的基础。本文将从巴什博弈的定义出发,深入推导其核心结论,结合多个经典例题讲解实战用法,同时附上完整的 C++ 代码实现,让你彻底吃透巴什博弈的精髓。下面就让我们正式开始吧!
在正式讲解巴什博弈之前,我们先快速梳理博弈论中几个核心概念,这是理解所有博弈模型的前提,尤其是公平组合游戏(ICG) 的定义,巴什博弈正是典型的公平组合游戏。
公平组合游戏是博弈论中最核心的分类之一,满足以下三个关键条件:
简单来说,公平组合游戏的核心是规则公平、结果确定,不存在运气成分,且两名玩家的操作空间完全由当前游戏状态决定。
在公平组合游戏中,由于玩家都是绝顶聪明的(会选择对自己最有利的最优策略),因此游戏的每一个状态都有唯一的结果,分为两种:
博弈论的核心解题思路,就是推导游戏初始状态是必胜态还是必败态,而推导的关键依据是两个核心性质:
这两个性质是所有博弈模型推导的底层逻辑,巴什博弈的结论也正是基于此推导而来。
与公平组合游戏相对的是非公平组合游戏,其核心区别是:玩家在确定状态下的决策集合与玩家身份有关,比如中国象棋、围棋、国际象棋(双方不能使用对方的棋子),这类游戏的解题思路比公平组合游戏复杂得多。
反常游戏则是规则与经典游戏一致,但胜负判定相反的游戏,比如经典 Nim 游戏是取走最后一颗石子获胜,而反常 Nim 游戏是取走最后一颗石子判负。巴什博弈也存在反常版本,本文重点讲解经典巴什博弈,后续会简单提及反常版本的思路。
巴什博弈的经典场景是取石子游戏,规则如下:
一共有
n颗石子,两名玩家轮流从石子堆中取石子,每次至少取 1 颗,最多取k颗;拿到最后一颗石子的玩家获胜。 问:先手玩家是否存在必胜策略?
这是最标准的巴什博弈模型,所有巴什博弈的变种问题都是基于此规则延伸而来。我们的目标就是通过数学推导,找到n和k之间的关系,直接判断先手的胜负。
结合前文提到的必胜态与必败态的核心性质,我们从最简单的情况开始推导,逐步找到规律。
首先定义必败态的基准:当石子数n=0时,当前玩家无石子可取,判负,因此n=0是必败态。
假设每次最多取k=3颗石子(方便举例),我们分析n从 1 到 10 的状态:
n=1:先手取 1 颗,直接获胜 → 必胜态;n=2:先手取 2 颗,直接获胜 → 必胜态;n=3:先手取 3 颗,直接获胜 → 必胜态;n=4:先手无论取 1/2/3 颗,后手都能取走剩下的所有石子(比如先手取 1,后手取 3;先手取 2,后手取 2;先手取 3,后手取 1),后手获胜 → 必败态;n=5:先手取 1 颗,剩下 4 颗(必败态)交给后手 → 必胜态;n=6:先手取 2 颗,剩下 4 颗(必败态)交给后手 → 必胜态;n=7:先手取 3 颗,剩下 4 颗(必败态)交给后手 → 必胜态;n=8:先手无论取 1/2/3 颗,后手都能取走对应数量,让剩下的石子数为 4 颗 → 必败态;从这个例子中,我们能清晰看到规律:当 n 是 k+1 的倍数时,当前状态为必败态;否则为必胜态。
对应上面的例子,k+1=4,n=4、8是 4 的倍数,均为必败态,其余为必胜态。
通过例子找到的规律需要严格证明,我们结合必胜态和必败态的核心性质,证明巴什博弈的通用结论:
巴什博弈核心结论:对于 n 颗石子、每次取 1~k 颗的取石子游戏,
n % (k + 1) == 0,则先手必败;n % (k + 1) != 0,则先手必胜。证明过程:设m = k + 1,分两种情况讨论:
当前玩家(先手)无论取x颗石子(1 ≤ x ≤ k),剩下的石子数为n - x = t*m - x。此时后手玩家只需取m - x颗石子(由于1 ≤ x ≤ k,则1 ≤ m - x ≤ k,符合规则),剩下的石子数为(t-1)*m,依旧是 m 的倍数。
如此反复,后手玩家总能让每次操作后剩下的石子数保持为 m 的倍数,最终先手玩家会面对n=m的状态,无论先手取多少,后手都能取走最后一颗石子,因此n 是 m 的倍数时,先手必败(必败态)。
当前玩家(先手)可以直接取r颗石子,剩下的石子数为t * m,是 m 的倍数,将必败态交给后手玩家。
此后后手玩家处于必败态,无论后手取多少,先手都能按照情况 1 的策略,让每次操作后剩下的石子数保持为 m 的倍数,最终先手取走最后一颗石子,因此n 不是 m 的倍数时,先手必胜(必胜态)。
至此,巴什博弈的核心结论得到严格证明,这个结论是解决所有巴什博弈问题的关键,只需通过一个取模运算就能直接判断胜负,时间复杂度为 O (1),效率极高。
巴什博弈的核心是凑数策略:先手玩家通过第一次操作,让剩下的游戏状态成为必败态,而后手玩家无论如何操作,都无法摆脱必败态,先手玩家只需全程模仿后手的操作节奏,始终将必败态交给对方,最终获胜。
简单来说,就是先手创造必败态,后手被迫进入必败态,这也是所有公平组合游戏的核心解题思路。
理论结合实践才是掌握算法的关键,本节将结合巴什博弈的经典例题,从基础模板题到变种题,逐一讲解解题思路,并附上完整的 C++ 代码实现,所有代码均经过验证,可直接用于算法竞赛。
题目链接:https://ac.nowcoder.com/acm/problem/50614

牛客网(信息学奥赛一本通)
玩家为 2 人,道具为 N 颗石子,规则如下:
假设两名玩家都非常聪明,问最后谁会获胜?
输入仅一行,两个整数 N 和 K,表示石子总数和每次最多取的石子数。
输出仅一行,1 表示先手获胜,2 表示后手获胜。
这是最标准的巴什博弈模板题,直接套用核心结论即可:
N % (K+1) != 0,先手必胜,输出 1;N % (K+1) == 0,后手必胜,输出 2。#include <iostream>
using namespace std;
int main() {
int n, k;
cin >> n >> k;
// 直接套用巴什博弈结论
if (n % (k + 1) != 0) {
cout << 1 << endl; // 先手必胜
} else {
cout << 2 << endl; // 后手必胜
}
return 0;
}输入:23 3
计算:23 % (3+1) = 23 %4 = 3 ≠ 0 → 先手必胜
输出:1与题目示例一致,验证代码正确性。
题目链接:https://www.luogu.com.cn/problem/P4018

洛谷 P4018
共有 n 个石子,两人每次只能取p^k个石子(p 为质数,k 为自然数,且p^k ≤ 当前剩余石子数),谁取走最后一个石子谁赢。October 为先手,问她是否有必胜策略?若有,输出October wins!;否则输出Roy wins!。
第一行一个正整数 T,表示测试用例组数;第 2~T+1 行,每行一个正整数 n,表示石子个数。
T 行,每行输出对应的结果。
这道题看似是新的规则,实则是巴什博弈的变种,核心是找到必败态的周期,通过推导可得出结论:
本质上,该规则下每次可取的石子数集合决定了k+1=6,因此转化为巴什博弈的标准模型,直接用 n 对 6 取模即可判断胜负。
#include <iostream>
using namespace std;
int main() {
int T;
cin >> T;
while (T--) {
int n;
cin >> n;
if (n % 6 != 0) {
cout << "October wins!" << endl;
} else {
cout << "Roy wins!" << endl;
}
}
return 0;
}输入:34914
计算:4%6=4≠0 → October wins!
9%6=3≠0 → October wins!
14%6=2≠0 → October wins!
输出与题目示例一致,验证代码正确性。
题目链接:https://www.luogu.com.cn/problem/P4860

洛谷 P4860
共有 n 个石子,两人每次只能取p^k个石子(p 为质数,k=0 或 1,且p^k ≤ 当前剩余石子数),谁取走最后一个石子谁赢。October 为先手,问她是否有必胜策略?若有,输出October wins!;否则输出Roy wins!。
第一行一个正整数 T,表示测试用例组数;第 2~T+1 行,每行一个正整数 n,表示石子个数。
T 行,每行输出对应的结果。
这道题是上一题的变种,规则中限制了 k 只能为 0 或 1,推导后可得核心结论:
该规则下k+1=4,依旧是巴什博弈的标准模型,直接用 n 对 4 取模即可。
#include <iostream>
using namespace std;
int main() {
int T;
cin >> T;
while (T--) {
int n;
cin >> n;
if (n % 4 != 0) {
cout << "October wins!" << endl;
} else {
cout << "Roy wins!" << endl;
}
}
return 0;
}输入:35714
计算:5%4=1≠0 → October wins!
7%4=3≠0 → October wins!
14%4=2≠0 → October wins!
掌握了经典巴什博弈和其变种后,我们可以对巴什博弈进行进一步的延伸,了解其反常版本和更复杂的组合版本,为后续学习更复杂的博弈模型做铺垫。
反常巴什博弈的规则与经典版本一致,唯一区别是胜负判定相反:取走最后一颗石子的玩家判负。
对于反常巴什博弈,核心结论需要稍作调整:
一共有 n 颗石子,每次取 1~k 颗,取走最后一颗石子的玩家判负,先手必胜的条件是
(n-1) % (k+1) != 0。
推导思路:反常版本的核心是让对方取走最后一颗石子,因此先手玩家需要让剩下的石子数为 1 时,交给对方操作。此时问题转化为:先手玩家需要将 n-1 颗石子的经典巴什博弈必败态交给对方,因此只需对n-1套用经典巴什博弈的结论即可。
在算法竞赛中,纯巴什博弈的题目相对简单,更多的是将巴什博弈与其他博弈模型(如 Nim 博弈、SG 函数)结合,形成更复杂的组合博弈问题。
比如多堆石子的巴什博弈:有 m 堆石子,第 i 堆有n_i颗石子,两名玩家轮流操作,每次选择一堆石子,取 1~k 颗,取走最后一颗石子的玩家获胜。
这类问题的解题思路是对每堆石子判断巴什博弈的状态,再结合 Nim 博弈的异或规则,最终判断整体的胜负,核心是将巴什博弈的状态转化为 Nim 博弈中的堆值,再进行异或运算。在下期博客中我将为大家介绍Nim博弈的相关内容。
无论是经典巴什博弈还是其变种,解题的核心技巧都可以总结为以下 3 步:
k+1的取值(即必败态的间隔);对于变种问题,关键是将非标准规则转化为巴什博弈的标准模型,找到必败态的周期,这需要通过小数值推导或打表找规律实现(比如洛谷的 Roy&October 取石子问题,可通过打表找到 6 和 4 的周期)。
巴什博弈作为博弈论的入门模型,虽然简单,但蕴含着博弈论的核心思想 ——必胜态与必败态的推导,掌握巴什博弈的解题思路,能帮助我们建立博弈论的思维方式,为后续学习更复杂的博弈模型打下基础。
从巴什博弈出发,后续可以逐步学习以下博弈论模型:
这些博弈模型都是在巴什博弈的基础上延伸而来,掌握巴什博弈的核心思想后,学习后续模型会事半功倍。
本文从博弈论的基础概念出发,详细讲解了巴什博弈的核心原理、结论推导,并结合三道经典例题讲解了实战用法,同时附上了完整的 C++ 代码实现,还对巴什博弈的反常版本、变种问题和解题技巧进行了总结。 巴什博弈的核心结论非常简单,就是一个取模运算,但推导结论的过程比结论本身更重要,因为这个过程蕴含了博弈论的核心思维 —— 必胜态与必败态的推导。在算法竞赛中,真正的难点不是套用结论,而是将非标准的游戏规则转化为巴什博弈(或其他博弈模型)的标准模型,这需要大量的练习和思考。 希望本文能帮助你彻底吃透巴什博弈,为你打开博弈论的大门。后续我会继续讲解 Nim 博弈、SG 函数等更复杂的博弈模型,关注我,一起玩转算法竞赛的博弈论!