关于麻将能不能进入奥运会的讨论
这篇文章来源于一群软件工程师在晚餐时的讨论,论题是中国麻将能不能进入奥运会。这类问题在不同的群体间相信已经发生过无数次,这次当然也毫无例外的并没有得出任何有价值的结论。但这并不妨碍这是一个有意思的问题,并值得花一些时间思考。
先说说我的观点吧,我个人并不看好麻将进入奥运会。在我看来,麻将是一个比较容易出现弱胜强情况的游戏(相信大家对这一点都有所体会,一个第一次玩麻将的人居然连续赢了好几把钱)。
说到这,我们遇到了一个比较关键的问题,如何定义强和弱?
如何量化一个麻将手的实力?很容易想到大数定理。根据大数定理我们知道,只要实验次数趋近无穷,实验结果的均值就会趋近于事物的本质。也就是说,如果麻将高手和麻将菜鸟打上无数圈麻将,赢的多的那个就更强。在不考虑打麻将风格相克之类的因素的假设下,我们甚至可以设立一个基准麻将手,并用一个选手和基准麻将手玩的成绩来量化一个麻将手的能力。
问题是,大数定理只有在实验次数非常非常多的情况下才奏效,但是在奥运会上,我们甚至不可能打一百圈麻将。而至于打多少圈以上我们才能相信战绩体现了实力,这又是另一个有趣而值得思考的问题了。
当然,我的观点也遭到了一些反驳。理由是:竞技体育中也充满了运气因素,即使 nba 总决赛也不过只是打七场而已(事实上这取决于你如何看待这个问题中的事件,究竟比赛是一场一场打的,还是一个回合一个回合打的,这又是一个有趣且非常复杂的问题)。
在我看来,这种观点存在一些缺陷,或者说这种类比并不准确。麻将正在的问题在于,在所有玩家 take action 前(摸完牌,但是打出第一张牌前),在玩家实力未知的情况下,每个玩家获胜的条件概率(given 发牌情况与后面码好的牌的情况)是不均匀的,并且可能是严重不均匀。简单点说,就是有的玩家一手好牌,有的则一手烂牌。竞技体育则不同,在球队实力未知的情况下,在开球前两支球队获胜的概率几乎是相同的。
对于麻将这类游戏,我有另外一种类比。假设我们对奥运会男子 400 米赛的规则进行一些修改,增加一些人为的趣味性(不确定性),在发令枪响前,由一个随机系统给每个运动员分配一个 1 到 8 的数字(不重复,记为 i),每个选手需要跑完 400 + 0.1i 米的距离,或许对于博尔特之类的选手,即使抽到 8 也有机会夺冠。而如果我们修改一下规则,每个运动员要在比赛中跑完 400 + 10i 的距离,也就是说抽到 1 的要跑 410 米,而抽到 8 的要跑 480 米。这时候场外因素显然开始对比赛产生影响了,抽到 1 的选手即使实力最差,也极有可能第一个完成比赛获得冠军。如果我们再修改一下规则,每个运动员要在比赛中完成 400 + 1000*i 的距离,那这场比赛几乎就成了一场抽签比赛,因为只有有选手抽到了 1,他几乎就稳赢了,这个时候每个选手的胜率几乎是一样的。当然,我们依然可以说这是一场公平的比赛,但是这不是一个好的竞技项目。
扔硬币也是公平的比赛。假设现在奥运会加入了一场扔硬币比赛,我们几乎可以说,在玩家开始扔之前,玩家们的获胜概率必然是均匀的。倘若真的能够练出在非常高的扔均匀硬币次数下让硬币正面朝上的次数明显高于反面朝上次数的能力,那么在概率统计的意义上来说,扔硬币就是一种比麻将更适合于竞技的游戏。
事实上,我们只需要再修改一下规则,这个田径比赛就会更接近麻将游戏。假设每次发令枪响前,每个选手会抽中一个实数 i,然后他需要跑 400 + i 的距离,其中 i 服从正态分布。这个模型还存在一点点缺陷,因为麻将摸牌不是独立事件,所以在把 i 变成一个向量,服从高维正态分布。多么简洁而漂亮的模型!
稍微总结一下,什么样的游戏适合竞技呢?我觉得需要满足两点。第一,在玩家能力未知的情况下,玩家获胜的概率是近似于均匀分布的。第二,在玩家能力已知的情况下,玩家获胜的概率应当偏离均匀分布(学过信息论的同学应该一下就能想到信息增益的概念吧)。通俗点说就是:外部影响因素要少,选手能力影响要大(至少要有影响吧,不然真成抛硬币了)。