囚徒困境与学习型组织



  在管理学学界,管理大师彼得·圣吉的《第五项修炼》已经得到人们的普遍称赞,尤其是其提出的所谓学习型组织,更是在实践中被努力推介。所谓学习型组织,是指通过培养弥漫于整个组织的学习气氛、充分发挥员工的创造性思维能力而建立起来的一种有机的、高度柔性的、扁平的、符合人性的、能持续发展的组织。当然,一个学习型的企业不仅只对管理者或员工单独而言的,而是管理与员工共同而言的,这两者必须是同时相互作用的。其实学习型组织的宗旨,就是消除组织和个人之间的冲突,使个人的发展与组织目标的实现完全吻合。而本文正是基于这一点上并运用博弈论中的“囚徒困境”模型来对其进行一种直观的分析,但并不是对其内容的全部分析,而只是针对其中一部分与此模型紧密相关的内容,这可以让我们更好的看到这种学习型组织的重要性。

一.囚徒困境

在博弈论中“囚徒困境”讲的是两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是“坦白从宽,抗拒从严”,如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。其表示如下:

                         A                   

坦白        不坦白

       坦白     -8,-8         0,-10

 B  不坦白   -10, 0        -1, -1

在这里我把管理者和员工分别看成是囚徒A和囚徒B,并且把“坦白”换成管理者和员工的“不一致”,而“不坦白”则变成“一致”。也就是说,“一致”是合作的,而“不一致”是非合作的。在这里的“一致”是指管理者和员工都有一个“共同的愿景”,是学习型组织的一个内在要求。

“囚徒困境”实是反映了个人理性和集体理性的矛盾。如果A和B都选择不坦白,各判刑1年,显然比都选择坦白各判刑8年好得多。当然,A和B可以在被警察抓到之前订立一个“攻守同盟”,但是这可能不会有用,因为它不构成纳什均衡,没有人有积极性遵守这个协定。这里就是说明了这种纳什均衡是非合作的,也是帕累托次优的。如是在一个企业中,特别是一个学习型的企业,则管理者与员工就会产生这种“囚徒困境”的一些问题。虽然在此我们是认为管理者与员工都在不断地学习,而且是按照学习型组织中的要求进行的,但由于双方是基于各自的一种个体的利益出发的,最后反而导致了一种不利的局面,即表现为(不一致,不一致)这一策略。这表现在双方在经过一番博弈后达到的是帕累托次优的纳什均衡,是基于一种非合作博弈而采取的策略。由于在管理者看来,他的学习是为了让自己能够更好地保住管理者的这一位置,而不会去过多的关注那些员工的利益了。而且他也不能肯定地知道员工的学习是否也会真的能达到使他能继续保住这一位置,让他继续成为一个管理者,于是他就会选择“不一致”这一策略。因为这一策略对他来说是一个“占优策略”。同样,员工们也会利用在他们看来也是“占优策略”的原则来选择“不一致”这一策略,故最终双方共同选择了(不一致,不一致)这一帕累托次优的纳什均衡策略。

如果是管理者或员工选择相反的策略,即采取(不一致,一致)或(一致,不一致)的策略,那么对于其中的另一方来说则是不利的。可以说是投入了成本却没有产出,意即只有投入没有产出的学习只会增加企业的成本,是在消耗企业的利润。这显然是不为企业所采纳的。也不能真正地发挥学习型组织的作用。因为如只有管理者真正从学习型组织中得到了提升,而员工没有的话,那么这个企业的很多决策计划、措施等将无法在员工这一层面上开展实施,那么就算是管理者制定出很好的决策计划、措施等也是无效的,因为没有能够把这一很好的决策计划、措施付之实现。这正如大众公司培训部主任麦克尔多姆教授说:“上边出思想,下边出劳力的旧式分工已经死亡,未来属于各个层次都在学习的企业。”

从上述内容可看出,在这种非合作的情况下,管理者和员工最好的结果就是纳什均衡,而且是帕累托次优的。这说明这种非合作的学习型组织并没有达到最初的愿景。当然,在此模型中还存在另一种情况,即(“不坦白”,“不坦白”),而且在直观上看这一结果明显是最好的,但这是一种在合作的条件下的。确实,这一结果是最好的,它可说是一种帕累托最优的。然而在此模型的条件限制下这一结果不能达到的。在这里,这种学习型组织好像表现出来的双方并不是在进行一种能提高效益的学习,反而只是试图去提高个人的效益,不是去学习怎样合作,而是在进行一种非合作。也即是说,如果在该学习型组织下管理者与员工不是基于一个共同愿景的话,尽管双方都是在不断地学习,或许可以提高自身的某些能力,但是这种学习活这些自我提升的能力却并没有转化为对整个企业来说是有益的东西,它反而只会消耗企业在双方所谓的学习上投入的成本,只会增加企业的负担。

 

二.无限次重复的囚徒困境

由于上述的“囚徒困境”模型是属于一种非合作博弈,且是一阶段博弈的,即只进行一次博弈就结束了,故管理者和员工就会采取上述的不合作的即不能达成一致愿景的策略。     

但很明显,在现实中进行的博弈并不是严格一次性的,也就是说,各个行为主体之问进行的是重复博弈活动。同样在一个企业中,管理者与员工不可能就只相互接触一次就再也不接触了。也就是说,管理者与员工不是单纯的一次博弈,而是可重复的无限次博弈,是有无限次相互接触机会的,故可以运用无限次重复的囚徒困境来进一步解释其实质。由于这样的重复博弈活动又具有特定的动态特征,即每个博弈参与人都可以观察到其他参与人过去的行动策略决策并利用这些与博弈历史有关的信息进行现期决策,囚而使得重复动态博弈模刑对现实生活中的真实博弈行为具有更强的解释能力。其实从重复动态博弈理论的不断深化研究中,更深刻揭示了无限重复动态博弈与静态或有限次博弈的根本区别。考虑无限重复博弈纳什均衡情况的无名氏定理表明,在无限次的重复动态博弈过程中,如果博弈参与人有足够的耐心,他可能会在重复进行的博弈过程中为着长远利益的获得而牺牲短期利益,从而选择能够实现帕累托改进的其他可行策略。正因此,管理者与员工会抛弃前述非合作的“囚徒困境”中出于个人的利益而选择了(不一致,不一致)的策略,转而选择上述模型中的(一致,一致)的策略,因为后一个策略能给双方带来更大的利益。

这种无限次重复的囚徒困境也很切合学习型组织的内涵,即不断地“学习”,并且不断地相互交流,共同学习。在学习型组织中,管理者首先必须不断地学习,其次,是促使员工不断地学习。在此不断地学习就是不断地增加管理者与员工的相互了解,通过彼此的不断沟通对话,实际上也是通过相互之间的不断学习,从而不断地修正双方因信息不足或未能形成一个统一的共同愿景而带来的帕累托次优。“如果想使学习持之以恒,管理者与员工也必须内省,必须批判性地反思自己的行为和处理问题的方式,并进行改变自己的行为。”因此通过这种不断地修正,从开始双方由于不合作所得到的惩罚中不断地反思,最后达成一致的共同愿景,采取一种可信的合作,也即达到了帕累托最优。这也就达到了当初学习型组织所希望的目标。“学习型组织是一个熟练地创造、获取和传递知识的组织,同时也要善于修正自身行为,以适应新的知识和见解。”通过这种不断地相互之间的交流、学习后,双方最终就会选择(一致,一致)这一策略,从而也达到了帕累托最优这一最好的结果。在这里,学习型组织可谓是真正地产生了一种不断“学习”的作用,不断地促进了每个人的能力,让双方更加倾向于合作,使双方的愿景完全达成一致。也从而发挥了学习型组织的真正的效用。

在此也很明显地看到,合作比不合作时的效益更好,即双方的共同愿景一致时比不一致时更能产生好的效益。而这也是学习型组织的作用之所在。也可说在“可信的合作”(即共同愿景)这一机制的保障下促使令所有参与人(即管理者与员工)更加偏好的帕累托最优结果作为重复博弈的均衡得以实现。所以不仅存在对低效率纳什均衡实现帕累托改进的可能性,而且也可能获得帕累托最优均衡结果,从而使博弈参与人(即管理者与员工)获得更大的个人收益和集体收益。也就是说,个人对自身利益的合理追求未必会导致帕累托次优结果和两难困境。这种“合理追求”或者说“合理自利”要求个人利益的实现要以他人利益和集体共同利益的实现为前提参与博弈的个人在进行策略决策时,当然需要理性权衡自己不同的行动策略以及相应的收益和效用,以最大化自身利益。与此同时,参与人更需要考虑自己的个人理性行为是否符合集体理性,是否符合同样地受到共同信念指导的其他参与人的理性预期。任何狭隘自利的、短视的策略选择只会损害他人利益并使自身利益难以实现,甚至得不偿失。因而只有致力于共同利益的最大化,才能实现个人利益的最大化在现实社会人与人之间的重复博弈活动中,这种合理追求为实现帕累托改进、甚至获得帕累托最优结果提供了可能性。而这种可能性的存在又反过来为促使人的行为导向从“狄隘自利”向“合理自利”转化,即人的理性转化提供可行的实现途径和方式。这也从另一方面说明学习型组织还可以改善管理者与员工的理性,让他们朝着更有利于企业发展的前提下去真正实行学习型组织。正是通过这种不断地从错误教训中学习经验,逐步地完善个体的各种能力,也同时促使个体去意识到合作的重要性,更多地从集体利益出发,而不是仅仅从个体利益出发。

 

总之,学习型组织不仅单纯时不断地纯粹一般性的学习,而且还应是管理者与员工之间的共同学习,相互不断地交流,更是要在同一个共同愿景下所进行的。如不是在有同一个共同愿景下进行的单独学习型组织,最多也只能是产生一种帕累托次优的结果,而不能达到帕累托最优。因此,学习型组织还更应是学习一种合作,学习如何把从学习型组织中所学得的各种技能在一个共同愿景下统一起来,并发挥出其最大的效用。

 

[1]彼得·圣吉.第五项修炼[M],郭进隆,译 .上海:三联书店,1998

 囚徒困境与学习型组织

[2]克里斯·阿克里斯.教聪明人学会学习[J],哈佛商业评论,1991年5/6月号.转自《知识管理》,杨开峰等译,中国人民大学出版社,2004

[3]戴维·A加文.建立学习型组织[J],哈佛商业评论,1993年7/8月号.转自《知识管理》,杨开峰等译,中国人民大学出版社,2004

[4]普拉伊特·K.杜塔.策略与博弈[M],施锡铨,译.上海:上海财经大学出版社,2005

[5]戴维·M·克雷普斯.博弈论与经济模型[M],邓方,译.北京:商务印书馆,2006

  

爱华网本文地址 » http://www.aihuau.com/a/9101032201/376548.html

更多阅读

解读学习型组织理论

解读学习型组织理论张鸣雨前言不久前,参加学习型组织创建研讨会,深感许多单位,特别是一些企业对组织的学习型化认识尚有偏颇。这些认识,不利于创建学习型组织。根据本人的理解、认识与实践,就学习型组织作如下解读。学习型组织理论是一种

对学习型组织的认识与思考

     一、学习型组织概述  管理大师杜拉克曾说:“在竞争激烈而快速变迁的世界中,只有学习型的组织(Learning Organization),才能得到生存与发展”。持续不断的学习是企业经营的重点,企业唯有成为学习型组织才能够永续经营。企业面

学习型组织构建的双环模型

   学习型组织之父彼得 · 圣吉在其《第五项修炼—学习型组织的艺术与实践》一书中提出,创建学习型组织必经五项修炼:自我超越、改善心智模式、建立共同愿景、团队学习和系统思考。  对承担学习型组织建设的学习发展管理者或培训

学习型组织构建新思(一)——凝聚团队共识的4大要诀

对于构建学习型组织来说,如何凝聚组织内全体成员的共识,如何让学习型组织落地,并使其进一步深化,是企业在建设与发展学习型组织中遇到的难点。在这一系列中,我们将为大家对这三个问题做详细解答,并给出经过优化的实践方案。在现实世界,虽然

学习型组织:梦想与现实的差距

  2月8日,中共中央办公厅印发了《关于推进学习型党组织建设的意见》,将学习型组织建设推向了前所未有的高度。    彼得·圣吉那部伟大的畅销书《第五项修炼》出版至今已经20年,其最新修订版在不久前也被译成了中文。在这些年里,我

声明:《囚徒困境与学习型组织》为网友疯到世界奔溃分享!如侵犯到您的合法权益请联系我们删除