黄海懿
在拆解了单家股改博弈格局之后,我们分析的重点也由股改博弈的程序转向了股改博弈的制度。
本文中,我们将运用“重复博弈”理论分析股改存在的方向性问题,并尝试性地给出部分解决方案。
一、“重复博弈”的特点
“重复博弈”理论的重点是通过“阿克谢罗德竞赛”总结出的成功的重复博弈必须具备的五大特点。
阿克谢罗德是名政治科学家,他在1984年的著作中描述了借助数学和计算机化的方法所做的两次以“囚徒困境”为基本博弈单元、重复数百次的“阿克谢罗德竞赛”。
竞赛规则是这样的:参赛者以电脑程序的方式在赛前提交一个博弈策略,这一策略将被固定下来而在竞赛过程中不能加以改动。策略既可以为复杂策略,也可以为非完美策略(如“两次不合作就报复”)。竞赛为循环赛,重复200次“囚徒困境博弈”,前次博弈的结果将被记录下来从而对后次博弈产生影响。竞赛中由电脑将参赛各策略予以匹配,运行结束后累计得分最高者为胜。
首次“阿克谢罗德竞赛”共有15个策略参赛,其中包括阿克谢罗德自己的一个随机程序(以50%的概率选取合作或不合作)。循环赛最后的胜利者为加拿大学者安那托尔&S226;若珀特提交的“针锋相对策略”。该策略的特点是:第一次对局采用合作的策略,以后每一步都跟随对方上一步的策略,你上次若合作,我这次就合作,你上次若不合作,我这次就不合作。
在竞赛中排名前三位的策略有三个共同特点:1)“善良的”,即采用“合作”的博弈策略,从不首先背叛;2)对方出现背叛行为就一定要报复,不能总是合作,即“可激怒的”;3)不会因对方的背叛而进行无休止的报复,如果对方以后改为合作,则也进行合作,即“宽容的”。
为了验证这些特点,阿克谢罗德将第一次的竞赛结果公开发表后,邀请更多的人参加第二轮竞赛。
第二轮共有63个策略参赛,其中仍然包括阿克谢罗德自己的那个随机程序。为避免“连锁店悖论”,第二次竞赛规定博弈结束的概率为0.00346。
第二轮竞赛的获胜者仍然是“针锋相对策略”,同时竞赛中还体现出这样的特点:
1)“善良的”:排在前15位的策略中,14个策略都是“善良”的,只有1个不善良的“哈灵顿程序”(策略为首先合作,当发现对方一直在合作,它就突然来个不合作,如果对方立刻报复它,它就恢复合作,如果对方仍然合作,它就继续背叛)列入其中。排在最后15位的策略中,只有1个“总选择合作的程序”是“善良”的;
2)“可激怒的”、“宽容的”的特点仍然存在;
3)“累积的”:“针锋相对策略”在循环赛博弈中取胜的原因是它能够通过合作行为获得最高的累计分数,它得高分的情况较多而得低分的情况较少。但是“针锋相对策略”从来不是单次试验的最高分(其在对局中的得分从来不可能超过对方,最多打个平手),所以如果遇到淘汰制的循环赛,它会很快被其他策略所淘汰。
4)得胜的策略都是“清晰的”,即能让对方在三、五步对局内辨识出来。如“针锋相对策略”很快就让对手很快发现了规律,从而不得不采取“合作”的态度。而那些过于复杂的策略则由于需要实践的次数过多、“学习”时间过长,博弈的效果并不好
于是通过两次竞赛,阿克谢罗德总结了成功的“重复博弈”须具备这几个特点:“善良的”、“可激怒的”、“宽容的”、“累积的”、“清晰的”。
二、从“重复博弈”理论看股改方向的走偏
股改是一场参与者众多、对我国金融体系进行深度变革的博弈,在这场博弈中各方参与者获得“共赢”而非“共损”的结果是股改的一大重要目标。
就目前的股改实践看,股改后财政资金积极介入但市场却依旧低迷、各方流通股东在持续售股,以“重复博弈”的角度看,这是“股改后的股价走势”这一“囚徒困境博弈”正在得到“共损”结果的市场体现。
为什么会出现这样的博弈结果?当我们运用“重复博弈”理论分析股改的制度建立时,发现在这样几个方面股改









