本文发表在 rolia.net 枫下论坛论海盗分金问题(1)--标准答案彻底错误,题目彻底不成立
--------------------------------------------------------------------------------
[不争论] 于 2002-4-9 13:28:43 加贴在 经济人俱乐部 ↑
小论文:论海盗分金问题
这篇东西其实不能算论文,因为很不严密,我也没有精力去严密化。只是业余娱乐,一笑。
第一部分:海盗分金问题“标准答案”及其违背直觉的原因
我在上一个帖子:“智力与智商”中,曾经指出,“小诗版”和“科美版”前提都是有漏洞的,会造成各种博弈的机会,和产生替代的效用(比如,海盗可能喜欢看同伴被扔下海,甚于喜好自己分金)。不过,我当时以为,只要前提足够严密,这个智力题就是成立的。
这里“成立”的意思,就是适用很多网友已经指出的逆推法。根据这个方法,投票表决方式是达到半数即可时,标准答案是:98 0 1 0 1。 如果表决方式是必须过半数,标准答案就是:97 0 1 0 2 ----我在本文以后的讨论中,都采用后一形式(换前一种方式,结论是类似的)。
我在这篇小文中要论证的就是:无论前提怎样严密,逆推法都是不成立的。
我在上篇帖子中说过,最严密的前提是“加洲版”。这个版本可参阅ylgons转贴的文章http://www1.vankeweekly.com/asp/bbs2/showAnnounce.asp?id=234538。
具体前提是:“所有的海盗都乐于看到他们的一位同伙被扔进海里,不过,如果让他们选择的话,他们还是宁可得一笔现金。他们当然也不愿意自己被扔到海里。所有的海盗都是有理性的,而且知道其他的海盗也是有理性的。...这些金块不能再分,也不允许几名海盗共有金块,因为任何海盗都不相信他的同伙会遵守关于共享金块的安排。这是一伙每人都只为自己打算的海盗。”
在上述前提下,结盟是不可能的,效用替代也不存在。因此,似乎可以相信这个前提已经完全严密了--然而问题绝对不是这么简单。
在给出我的论证之前,我先指出一点:这个题目的标准答案是十分违反直觉的。按道理,先提方案的1号海盗处于不利地位,结果他却分到了压倒多数的宝石,且丝毫不必担心别的海盗会生气把他抛下海。这种强烈违背常理之感,出题目的人看来也承认。在“加州版”原文中就说:“数学的逻辑有时会导致看来十分怪异的结论。一般的规则是,如果逻辑推理没有漏洞,那么结论就必定站得住脚,即使它与你的直觉矛盾。”也就是说,他承认答案怪异,但坚信其正确。
我却不那么迷信“数学的逻辑”。实际上做过科研的人都知道,数学或逻辑本身,是不能告诉你任何新知识的,只能实现等价表达式之间的变换。对一个纯逻辑过程来说,结果是否正确,完全取决于你前提是否正确。因此,反过来说,一个合理的怀疑是:既然结论怪异,很可能是推理前提错了。
一个理性的、追求自身利益最大化的海盗,处在题目所给条件下,他真会象“逆推法”那样思考吗?还是他会有不同的思考方案呢?他除了被动等待别人施舍自己1或2块宝石外,难道真地没有其他手段可以利用吗?
我今天下班路上和晚上看完电视新闻后仔细考虑了这个问题,深信:一个理性的海盗,在这种情况下完全可以动用威胁的手段,来达到自己的目标。
这里的关键是:他拥有威胁的资源--有可能操纵对方生杀的一票。
题目排除了结盟,但并未排除威胁。所以,后面的海盗总是可以威胁提方案的海盗说:“听着,你必须分给我XX只宝石,否则我就投票反对你的方案!”(请注意,这个威胁符合理性、利益最大化和互不信任原则,也就是说符合题意。)
即使不允许海盗互相说话的场合(避免复杂的谈判),后面的海盗作为一个足够聪明和理性的海盗,肯定会在心里动威胁的念头。那么,由于提方案的海盗也是一个足够聪明的海盗,他就会猜到对方有此念头--其效果和公开威胁是一样的。
而题目的标准的解答,完全忽视了海盗可在理性范围内运用这一手段,所以,才会得出一个违背直觉的奇怪答案--因此,这个所谓“标准”答案是完全错误的。
==========================================
第二部分:论考虑威胁因素下,不存在唯一解答
但是,另一方面,威胁是不一定起作用的。于是我们要的第二个问题就是:何时海盗会实施威胁?
为此,我必须先引入一个和原题稍有不同的假设:海盗不会滥杀(原题目说的是:海盗总是喜欢看到同伴被杀,只要不损害自己利益)。我改变的假设是,海盗只有在能够获得更大利益的前提下才喜好同伴被杀。
我们举2个海盗说明区别:在原题目条件下,此时4号死定了,即使0 100分配方案5号仍要投反对票杀他。在我的条件下,5号在0 100时不杀4,因为不可能再多得宝石。但1 99时会杀4。所以,在我的假设下,若2个海盗,引入威胁后分配方案不变,仍是0 100,且4号性命保全(假定海盗会滥杀,可以用效用替代法得出其他结论。我后面若有精力会继续讨论)
现在看3个海盗。按简单逆推,3号可实现99 1 0的分配方案。但是,4号会威胁说:“你得给我XX个,否则我投反对票杀你”(5号除非得到100个宝石,否则肯定投反对票)。那么,4号在何种情况下会动用威胁呢?
由于题目说了,海盗是极其自私贪婪的,要最大化个人利益,所以,只有达到最大可能数量才满足。其计算方式是:总宝石量/(过半数必须票数--被威胁者本人1票)。计算可以看出,在3人时,此值为100,(4人时,此值为50)。注意,再贪婪的海盗也不可要求超过此量,否则方案将无足够支持率。因此,一个理性的、高贪婪的海盗将要求此值。
但是,这是在贪婪本性出发的结论。在实际操作中,海盗还必须考虑到风险--即失去宝石的风险。在上例中,3号会看到,4号若反对则下一轮他只能得到0个宝石。3号可以利用这一点来反过来威胁4号。
到这一步,题目的标准答案就变得不确定起来了--它将和海盗的冒险欲望有关了。对冒险欲望的不同模式假设将得出不同结论!
例如,如果3号不怕死,他就可以反过来威胁4号,如果你不赞成我,我宁死不屈,让你得0个宝石!
不过,冒险欲望是可以用一个合理假设,设定为一个刚性条件的:即,所有海盗都是怕死的。在财产生命之间一定选择生命。这个“刚性化”是很符合“自然”的,而且“加洲版”题目也的确说了,海盗是不想死的。
如果这样规定了,是否就可以把题目变回有标准答案了呢?例如:是否3号已经别无出路,只好给4号100个宝石了呢?若如此,标准答案就是0 100 0。
事实是,这种情况下,3号仍有反威胁的手段!3号可威胁4号:我可以做 0 0 100的方案,这样5号因为不愿滥杀,会赞成票。我可以保命,而你一无所获!
4号对此又将如何反应呢?
答案是:到这一步,4号的反应将取决于他贪婪欲望的函数形式!不同的函数假设,也将得出不同结论。
由于贪婪欲望不可能象上面的冒险欲望那样,用一个刚性假设替代掉,换言之,题目不可能再有标准答案了!至此,海盗分金的题目,已经彻底瓦解!
今晚太晚,先写到此。明天我将用最简单情况----海盗的贪婪欲望函数是简单线性的----来具体分析说明。
(贪婪欲望函数线性假设:如果海盗可得到的最大数量和最小数量的差额为A,每当可多得1个宝石时,他投反对票的欲望下降1-1/A。当该欲望小于1/2时,他将投赞成票。)更多精彩文章及讨论,请光临枫下论坛 rolia.net
--------------------------------------------------------------------------------
[不争论] 于 2002-4-9 13:28:43 加贴在 经济人俱乐部 ↑
小论文:论海盗分金问题
这篇东西其实不能算论文,因为很不严密,我也没有精力去严密化。只是业余娱乐,一笑。
第一部分:海盗分金问题“标准答案”及其违背直觉的原因
我在上一个帖子:“智力与智商”中,曾经指出,“小诗版”和“科美版”前提都是有漏洞的,会造成各种博弈的机会,和产生替代的效用(比如,海盗可能喜欢看同伴被扔下海,甚于喜好自己分金)。不过,我当时以为,只要前提足够严密,这个智力题就是成立的。
这里“成立”的意思,就是适用很多网友已经指出的逆推法。根据这个方法,投票表决方式是达到半数即可时,标准答案是:98 0 1 0 1。 如果表决方式是必须过半数,标准答案就是:97 0 1 0 2 ----我在本文以后的讨论中,都采用后一形式(换前一种方式,结论是类似的)。
我在这篇小文中要论证的就是:无论前提怎样严密,逆推法都是不成立的。
我在上篇帖子中说过,最严密的前提是“加洲版”。这个版本可参阅ylgons转贴的文章http://www1.vankeweekly.com/asp/bbs2/showAnnounce.asp?id=234538。
具体前提是:“所有的海盗都乐于看到他们的一位同伙被扔进海里,不过,如果让他们选择的话,他们还是宁可得一笔现金。他们当然也不愿意自己被扔到海里。所有的海盗都是有理性的,而且知道其他的海盗也是有理性的。...这些金块不能再分,也不允许几名海盗共有金块,因为任何海盗都不相信他的同伙会遵守关于共享金块的安排。这是一伙每人都只为自己打算的海盗。”
在上述前提下,结盟是不可能的,效用替代也不存在。因此,似乎可以相信这个前提已经完全严密了--然而问题绝对不是这么简单。
在给出我的论证之前,我先指出一点:这个题目的标准答案是十分违反直觉的。按道理,先提方案的1号海盗处于不利地位,结果他却分到了压倒多数的宝石,且丝毫不必担心别的海盗会生气把他抛下海。这种强烈违背常理之感,出题目的人看来也承认。在“加州版”原文中就说:“数学的逻辑有时会导致看来十分怪异的结论。一般的规则是,如果逻辑推理没有漏洞,那么结论就必定站得住脚,即使它与你的直觉矛盾。”也就是说,他承认答案怪异,但坚信其正确。
我却不那么迷信“数学的逻辑”。实际上做过科研的人都知道,数学或逻辑本身,是不能告诉你任何新知识的,只能实现等价表达式之间的变换。对一个纯逻辑过程来说,结果是否正确,完全取决于你前提是否正确。因此,反过来说,一个合理的怀疑是:既然结论怪异,很可能是推理前提错了。
一个理性的、追求自身利益最大化的海盗,处在题目所给条件下,他真会象“逆推法”那样思考吗?还是他会有不同的思考方案呢?他除了被动等待别人施舍自己1或2块宝石外,难道真地没有其他手段可以利用吗?
我今天下班路上和晚上看完电视新闻后仔细考虑了这个问题,深信:一个理性的海盗,在这种情况下完全可以动用威胁的手段,来达到自己的目标。
这里的关键是:他拥有威胁的资源--有可能操纵对方生杀的一票。
题目排除了结盟,但并未排除威胁。所以,后面的海盗总是可以威胁提方案的海盗说:“听着,你必须分给我XX只宝石,否则我就投票反对你的方案!”(请注意,这个威胁符合理性、利益最大化和互不信任原则,也就是说符合题意。)
即使不允许海盗互相说话的场合(避免复杂的谈判),后面的海盗作为一个足够聪明和理性的海盗,肯定会在心里动威胁的念头。那么,由于提方案的海盗也是一个足够聪明的海盗,他就会猜到对方有此念头--其效果和公开威胁是一样的。
而题目的标准的解答,完全忽视了海盗可在理性范围内运用这一手段,所以,才会得出一个违背直觉的奇怪答案--因此,这个所谓“标准”答案是完全错误的。
==========================================
第二部分:论考虑威胁因素下,不存在唯一解答
但是,另一方面,威胁是不一定起作用的。于是我们要的第二个问题就是:何时海盗会实施威胁?
为此,我必须先引入一个和原题稍有不同的假设:海盗不会滥杀(原题目说的是:海盗总是喜欢看到同伴被杀,只要不损害自己利益)。我改变的假设是,海盗只有在能够获得更大利益的前提下才喜好同伴被杀。
我们举2个海盗说明区别:在原题目条件下,此时4号死定了,即使0 100分配方案5号仍要投反对票杀他。在我的条件下,5号在0 100时不杀4,因为不可能再多得宝石。但1 99时会杀4。所以,在我的假设下,若2个海盗,引入威胁后分配方案不变,仍是0 100,且4号性命保全(假定海盗会滥杀,可以用效用替代法得出其他结论。我后面若有精力会继续讨论)
现在看3个海盗。按简单逆推,3号可实现99 1 0的分配方案。但是,4号会威胁说:“你得给我XX个,否则我投反对票杀你”(5号除非得到100个宝石,否则肯定投反对票)。那么,4号在何种情况下会动用威胁呢?
由于题目说了,海盗是极其自私贪婪的,要最大化个人利益,所以,只有达到最大可能数量才满足。其计算方式是:总宝石量/(过半数必须票数--被威胁者本人1票)。计算可以看出,在3人时,此值为100,(4人时,此值为50)。注意,再贪婪的海盗也不可要求超过此量,否则方案将无足够支持率。因此,一个理性的、高贪婪的海盗将要求此值。
但是,这是在贪婪本性出发的结论。在实际操作中,海盗还必须考虑到风险--即失去宝石的风险。在上例中,3号会看到,4号若反对则下一轮他只能得到0个宝石。3号可以利用这一点来反过来威胁4号。
到这一步,题目的标准答案就变得不确定起来了--它将和海盗的冒险欲望有关了。对冒险欲望的不同模式假设将得出不同结论!
例如,如果3号不怕死,他就可以反过来威胁4号,如果你不赞成我,我宁死不屈,让你得0个宝石!
不过,冒险欲望是可以用一个合理假设,设定为一个刚性条件的:即,所有海盗都是怕死的。在财产生命之间一定选择生命。这个“刚性化”是很符合“自然”的,而且“加洲版”题目也的确说了,海盗是不想死的。
如果这样规定了,是否就可以把题目变回有标准答案了呢?例如:是否3号已经别无出路,只好给4号100个宝石了呢?若如此,标准答案就是0 100 0。
事实是,这种情况下,3号仍有反威胁的手段!3号可威胁4号:我可以做 0 0 100的方案,这样5号因为不愿滥杀,会赞成票。我可以保命,而你一无所获!
4号对此又将如何反应呢?
答案是:到这一步,4号的反应将取决于他贪婪欲望的函数形式!不同的函数假设,也将得出不同结论。
由于贪婪欲望不可能象上面的冒险欲望那样,用一个刚性假设替代掉,换言之,题目不可能再有标准答案了!至此,海盗分金的题目,已经彻底瓦解!
今晚太晚,先写到此。明天我将用最简单情况----海盗的贪婪欲望函数是简单线性的----来具体分析说明。
(贪婪欲望函数线性假设:如果海盗可得到的最大数量和最小数量的差额为A,每当可多得1个宝石时,他投反对票的欲望下降1-1/A。当该欲望小于1/2时,他将投赞成票。)更多精彩文章及讨论,请光临枫下论坛 rolia.net