以牙还牙,拼为yǐ yá huán yá,比喻针锋相对地进行回击。出自《旧约全书?申命记》。
以牙还牙_以牙还牙 -概述
以牙还牙 ( yǐ yá huán yá )
解释用牙咬来对付牙咬。比喻针锋相对地进行回击。
出处《旧约全书·申命记》:“以眼还眼,以牙还牙,以手还手,以脚还脚。”
用法偏正式;作谓语、定语、状语;常与以眼还眼连用
示例鲁迅《坟·论费厄泼赖应该缓行》:“'犯而不校'是恕道,'以眼还眼,~'是直道。
近义词针锋相对
反义词退避三舍
以牙还牙_以牙还牙 -博弈理论
简单介绍
以牙还牙(Titfortat)是1个用于博弈论的重复囚徒困境(ReiteratedPrisoner'sDilemma)非常有效的策略。这策略最先由数学家阿纳托·拉普伯特(AnatolRapoport)提出,并在密歇根大学社会学家罗伯特·阿克塞尔罗(RobertAxelrod)有关囚徒困境的研究中击败其他方法,脱颖而出,成为解决囚徒困境的最佳策略。
这一策略有2个步骤:
第1个回合选择合作
下一回合是否选合作要看上一回对方是否合作,若对方上一回背叛,此回合我亦背叛;若对方上一回合作,此回合继续合作
以牙还牙策略有4个特点:
友善:以牙还牙者开始一定采取合作态度,不会背叛对方
报复性:遭到对方背叛,以牙还牙者一定会还击作出报复
宽恕:当对方停止背叛,以牙还牙者会原谅对方,继续合作
不羡慕对手:以牙还牙者个人永远不会得到最大利益,整个策略以全体的最大利益为依归
在众多策略中,以牙还牙是最有效的,曾连续数年击败由计算机科学家,经济学家和心理学家等团队所提出的策略。博弈论者尽管没有实质证据,但他们认为以牙还牙是最佳的策略。
囚徒困境例子
假设有4个参与者:2个用以牙还牙的策略,另外2个无论任何时候都会背叛其他人以让自己得到最大的好处。假定每个参与者将要面对另外3个参与者进行六次对决。如果一名参与者背叛对方而对方不背叛,前者有5分,后者得0分;如果双方不背叛对方,双方各得3分;如果双方同时背叛对方,双方各得1分。
当以牙还牙者对背叛者,前者第一场比赛选择不背叛,而后者正好相反,后者获得5分。在余下的5场比赛,两位参与者背叛对方,每一场比赛各得1分。最后,背叛者得10分,以牙还牙者得5分。
当双方均为以牙还牙者,在所有6场比赛中彼此均不会背叛对方。双方每回合各得3分,最后每人各得18分。
当背叛者互相对赛,双方每次都会背叛对方。双方每回合各得1分,最后每人各得6分。
尽管以牙还牙者从来没有赢得过一场比赛,而背叛者从未输过一场比赛,考虑到双方的最大共同利益,以牙还牙仍然是最好的策略。
问题
虽然阿克塞尔罗德证明了以牙还牙在某些情况下是最佳的策略,但两名以牙还牙者有的时候在博弈时仍会产生问题。假如其中一方错误理解形势,就可能造成灾难性结果。在以牙还牙的策略下,博弈者被迫惩罚之前背叛自己的对手(尽管他不是有意的),造成恶性循环。双方都认为自己是无辜的,自己所作的只是为了自卫,并归咎对手恶毒或是不跟自己合作。这种情况经常发生在现实世界的冲突,如学生间的打斗和地区战争。而且实际上用以牙还牙策略只能保证和对方打成平手,很难获得更大的胜利。
在重复囚徒困境的20周年纪念赛中,来自英国南安普敦大学的1个小组(由尼古拉斯·詹宁斯(NicholasJennings)领导,包括了拉蒂普·达什(RajdeepDash)、萨瓦帕里·拉姆琼(SarvapaliRamchurn)、亚历克斯·罗杰斯(AlexRogers)斯和皮鲁克里士南·维特林根(PerukrishnenVytelingum))找出了另1种策略,这个新的策略在另一次实验中打败了以牙还牙策略。在以牙还牙策略成功的那个实验里,竞争者与竞争者之间是独立的。而该团队的新策略却提供了1个小组,这个小组的人都有1个目的,就是力保小组中的其中一人。也就是说这个小组可以看作1个大的竞争者。
应用于真实世界
点对点下载
BitTorrent应用以牙还牙策略以优化下载速度[3]。BitTorrent运用的OptimisticUnchoking技术就是运用了以牙还牙策略。BitTorrent会定期随机选择其他用户作上载,以寻找更多潜在合作者(愿意上载的用户),最大化上下载者的共同利益。
互惠利他主义
在动物群落,施予者提供帮助予受益者。利他行为应该得到回报,当双方的需求互换,原来的受益者应报答及帮助原来的施予者。群落当中有机制以查明和惩罚“不报答者”。以牙还牙原则是1个调节互惠利他主义的重要机制。