文章首发于:《FT中文网》(2025年5月27日发表)
中美关税战按下了暂停键,但硝烟远未散尽。当市场情绪伴随着关税战的大起大落而忽高忽低时,有一个问题却是中国,尤其是决策层最需要关注的,即中国应该采取什么样的策略才能从根本上维护自身的长远利益呢?
我们先来看看我们的对手唐纳德•特朗普(Donald Trump,简称特朗普)是如何做的?说实在话,特朗普在关税这个问题上既是言出必行,又是出尔反尔。说他言出必行是指特朗普在竞选的时候就多次赞美关税,并声称要对中国征收高达60%的关税。现在看来,他的确是真正挥舞起了关税这根大棒;说他出尔反尔是指特朗普一会儿说要给多少国家征收多少关税,一会儿又把自己加征关税的命令冻结90天等等。这种忽左忽右的做法让人确实有些摸不着头脑,但想想特朗普商人的出身也不难理解。在特朗普的眼中,这个世界没有正义和邪恶,只有利益和交易,而交易或谈判就是零和博弈,没有双赢,只有我赢你输。他觉得凭借美国世界第一超级大国、第一商品进口大国的地位可以对贸易对象国搞突然袭击、极限施压,再通过后续谈判逼迫对手屈服,接受他的“对等关税”,同时对美国商品和服务进口大开绿灯。这样,特朗普就可以大言不惭地宣称他赢了,而别国的领导人则成了“失败者”的形象。应该说,这种做法还真起到了一定的效果,一些国家“屈服”了,只好“求着”美国达成新的贸易协议。当然,这时候谈判的主导权就到了特朗普的手中。也有一些国家或国家集团说要报复,但到目前为止只是说说而已。
然而,中国没有吃他的这一套。随着特朗普对中国加征越来越高的关税,中国也进行了层层加码的反制。最后,按照双方加征的关税,中美之间的直接贸易相当于被人为的“中断”了。中国的这种做法代表了立地为人、不甘屈服的态度,是一个大国应有的气节。但抛开感情因素来说,这种做法是否更有利于从根本上维护中国自身的长远利益呢?
这方面美国的一项学术研究成果或许可以给我们带来一些启发。
二战后不久,国际地缘政治就进入美国和苏联两极竞争的冷战时代,而美苏这两个超级大国都拥有摧毁整个地球的核威慑力。冷战的阴云也影响到了学术界。当时的学者,尤其是政治学家,非常热衷于使用博弈论(Game Theory)的框架来分析美苏两国的冷战策略,这里面一个典型且常用的博弈论模型就是囚徒困境(Prisoner's Dilemma)。
囚徒困境模型并不复杂,甚至可以说是十分的接地气。它说的是警方逮捕了甲、乙两名合伙犯罪嫌疑人,但没有足够证据指控两人合伙犯罪。于是警方分开审讯嫌疑犯,并向双方提供以下相同的选择:
1. 若你自己认罪并作证检控你的伙伴(我们将此行为定义为“背叛”),而你的伙伴保持沉默,那么作为证人你将即时获释,而你的伙伴将被判监10年。
2. 若你们两人都保持沉默(我们将此行为定义为“合作”),则两人都将被判监半年。
3. 若你们两人都互相检举(互相“背叛”),则两人都将被判监5年。
用表格概述如下:
囚徒困境假定每个玩家(囚徒)都是利己的,即都寻求最大自身利益,而不关心其伙伴的利益。另外,我们假定没有任何其他力量干预个人决策,玩家可完全按照自己意愿选择策略。
陷入困境的玩家到底应该选择哪一项策略才能将自己个人的刑期缩至最短?甲和乙由于隔绝审讯并不知道对方的选择,而且即使他们能交谈,也未必能够尽信对方所说的话。就个人的理性选择而言,背叛对手方获得的刑期,总比沉默要来得低。试设想困境中的甲会如何做出选择:
•若乙沉默、甲背叛,这会让甲获释,所以甲会选择背叛。
•若乙背叛,甲也要背叛才能得到较低的刑期,所以甲也会选择背叛。
两人面对的情况一样,所以两人的理性思考都会得出相同的结论——无论对方做哪种选择,自己选择背叛是最优。在博弈论里,背叛就因此被称为占优策略(Dominant Strategy),也是这个博弈模型的“纳什均衡”(Nash Equilibrium)策略。我们对博弈结果合理的预测就是两人都背叛,同样服刑5年。
从个体出发最理性、收益最大的策略却不是整体上最理性、收益最大的策略。
我们时常会感叹人类的自私与短视,囚徒困境似乎也从学理上支持了这种看法。但有人并没有止步于此,毕竟,现实中人与人之间合作的范例也是举目可见的。难道美苏两国的核军备竞赛的终点注定了就是人类的毁灭吗?是否存在某些条件使得强大的对手能够超越相互确保的核毁灭并转向相互合作呢?
带着对这个问题的好奇,美国密歇根大学的政治学家罗伯特•阿克塞尔罗德(Robert Axelrod,简称阿克塞尔罗德)在1977年设计了一场由计算机模拟的囚徒困境锦标赛。阿克塞尔罗德具体的做法是扩展经典的囚徒困境,改玩一个回合就决定胜负的博弈为玩多个回合的博弈,这就是“重复的囚徒困境”(Iterated Prisoner's Dilemma)。为什么要这么做呢?因为人和国家的寿命都不短,而且并不是所有的交易或谈判都是一锤子买卖。其实,人类大部分重要的交易都发生在“熟人”之间(比如上班的同事们、供应链上的相关企业等)。
阿克塞尔罗德向心理学、经济学、政治学、数学和社会学等领域的专家学者发出邀请,让他们设计他们认为最优的囚徒困境策略,并写成计算机程序代码(使用当时流行的计算机语言Fortran或Basic),然后邮寄给他。阿克塞尔罗德的计划是将这些策略的程序代码放入密歇根大学计算中心的主机中去进行一对一的多回合对垒,看哪种策略获得的积分最高。比赛的规则如下:
• 每种参赛策略都将和另外一个参赛策略配对,然后进行200个回合的囚徒困境博弈。
• 每种参赛策略还将与其自身以及一个随机策略进行博弈,这个随机策略就是由计算机在每一回合随机的选择背叛或合作。
• 参赛策略无法在每一回合前互相交流,所以不知道对手方在本次回合中会做出哪种选择;但可以观察到对手方过去的选择,并参照对手方过去的选择来做出己方现在和未来的选择。
• 每回合的博弈结束后,对垒双方将按以下方式获得积分:相互合作各得三分;相互背叛各得一分;当一名玩家合作另一名背叛时,背叛的玩家得五分,合作的玩家得零分。
从博弈的设计我们可以看到,在相互合作的情况下,双方得分总和达到最高(3+3=6,即可分的蛋糕最大);而在相互背叛的情况下,双方得分总和最低(1+1=2,即可分的蛋糕最小)。所以,囚徒困境并非零和博弈,只要合作就能实现双赢。
比赛结束后,阿克塞尔罗德将统计每种策略的总分数并看看谁是最终的获胜者。这样一来,阿克塞尔罗德就成功的将一个争议不清的定性的问题转化为了一个直观的定量的问题。
阿克塞尔罗德一共收到了14种策略,随后他将这些策略的代码放入计算机中模拟对垒。结果大大出乎他的意料之外,获胜者竟然是“一报还一报”(Tit For Tat)策略。
“一报还一报”的策略非常简单:
1. 在第一回合比赛中要采取合作的态度;
2. 在此后的每一回合比赛中,就做对手在前一回合比赛中所做的事情。换句话说,对方合作,己方立即合作;对方背叛,己方立即背叛。
然而,阿克塞尔罗德对这样的结果仍存有疑虑,因此他又组织了第二场比赛。第二次比赛的规模更大,阿克塞尔罗德一共收到了62种策略。万万没有想到的是,获胜者依然是“一报还一报”。
“一报还一报”意味着奉行这一策略的参赛者对另一方有三个态度:一,先礼;二,礼来回礼;三,兵来回兵。
大家是不是也觉得很有趣呀?假如你觉得你可以设计一个更牛的策略,不妨在自己的电脑上写一个程序,拿“一报还一报”来对垒一下。
阿克塞尔罗德由此推论在适当的条件下,独立的个体完全有可能从各自追求自身的利益发展成一种大家都能繁荣发展的合作状态。进一步说,当人们遵守以下三条规则时,合作就成为可能:1、只要对手愿意合作,就应积极合作,以避免不必要的冲突;2、如果对手背叛你,那就进行一次“一报还一报”;3、假如对手在背叛后又选择合作,那就原谅对手过去的背叛(既往不咎),并选择再次合作。始终遵循步骤1、2和3,这样你的对手就能了解你的行为,并据此调整他的策略。
实际上,细心的读者可能已经发现,“一报还一报”的策略在“一锤子买卖”的博弈中必败无疑,但它却能成功诱导“熟人”长期合作而实现最终的双赢胜利。
回到中美关税战的问题。中国在这场令人眼花缭乱的关税战中先是与特朗普政府针锋相对,随后又打开了谈判的大门,并在日内瓦的谈判上最终与美方达成妥协,双方大幅下调关税,这是不是很像“一报还一报”的策略?毕竟中美两国是全球经济的两极,都具备让全球经济深陷大萧条的能力,也是地球上相互摆脱不了的邻居,只有合作才能实现双赢。
现在关税战只是按下了暂停键,但它并没有完全远离我们而去。笔者认为中国在截至目前的斗争中所采取的策略是正确的。这种“一报还一报”的策略一边诱使、一边逼迫特朗普政府采取合作的态度来解决关税的问题。中方做到了不卑不亢,而特朗普则暴露了其色厉内荏的本质。
特朗普的胃口是难以满足的,这方面我们可以看看英国的例子。英国是美国的传统盟国,而且英国对美国是贸易逆差国,但特朗普依然迫使英国签订了一份损人的关税协议。虽然这个协议对美国的长期利益没有帮助,但特朗普却可以大吹大擂他在谈判桌上的胜利。不敢想象,假如中国采取英国的态度,中美之间的关税协议会是何种摸样?
合作是斗争出来的合作,不是绥靖出来的,所以有以打促和的说法。在中美达成最终的贸易协定之前肯定还会有很多波折,但拿定主心骨,继续坚持“一报还一报”,就像中方所言——“谈,大门敞开;打,奉陪到底”——的那样,那么笔者相信中国一定会在这场波及全球的关税战中不但为自己争取到一个更好的结果,也为维护全球正常贸易、减少这个世界的关税做出自己的贡献,而这就是从根本上维护了中国自身的长远利益。