体育彩票销售站联盟

随机致富的傻瓜(四)

投资阅读分享2019-01-16 14:35:57


第二篇  打字机前的猴子——存活者偏差及其他

如果把无限多的猴子放在打字机前面,让它们去乱敲,那么其中一只肯定会打出一字不差的《伊利亚特》叙事诗。这种概率非常低,但且让我们把这个推理往前推一步:猴子中的大文豪既已诞生,读者愿意拿毕生的积蓄去赌这只猴子下一次会打出《奥德赛》叙事诗吗?上段文字中,有趣的是第二步。过去的表现(打出《伊利亚特》叙事诗)有多少可用于预测未来的表现?同样的问题也适用于所有根据过去的成绩,也就是只依赖过去时间序列的属性做的决策。假使那只猴子带着它以前的惊人之作出现在你家门口,你会不会说:嘿,它打出了《伊利亚特》,赶快和它签下一本书的合约?靠资料做结论的人,往往比别人更快、更有信心地坠入这个陷阱中。我们拥有的资料越多,淹没在里面的可能性越高。认为如果某人过去的表现优于他人,那么将来表现优于他人的概率也很高。但是一如以往,只懂少许概率知识比完全不懂概率的结局更惨。


这个问题出现在商业领域时,因为这个行业十分依赖随机性,所以影响也更严重。从事商业的人数越多,其中某个人纯靠机运便能有惊人表现的可能性越高。很少有人去数市场中的投资人人数有多少,以便计算某段时间里、在这么多投资人的情况下,取得成功的条件概率(不是成功概率)有多少。在现实生活中,其他的猴子多不胜数,也看不见。它们隐藏在某些地方,我们只能看到赢家—因为我们看到的是存活者,而且只看到存活者,以至于我们队机运产生了错误的认知。各种关于随机性的偏差可以简述如下:第一,存活者偏差。第二,不同凡响的成功最常见的原因是运气。第三,我们在生物构造上缺乏了解概率的能力。


第八章  太多“下一个富翁”

马克和珍妮以及3个孩子住在纽约市的公园大道。他任职律师,年收入有50万美元,生活优裕但紧凑忙碌。工作日里他在晚上9点30分以后才能回家,有时则在办公室待到接近午夜。一周结束时,马克疲累异常,大部分时间都躺在床上恢复体力。珍妮平常碰到的人,不是孩子在曼哈顿私立小学同学的父母,就是同栋公寓的另据。从物质条件来说,他们落在这一群人的下层,他们是生活圈内最穷的人,因为大楼里住的都是大公司的高层主管、华尔街的交易员和意气风发的企业家。珍妮常常感到失落,她觉得自己的先生和别人相较下缺乏成就,但她的计算大错特错,因为她使用错误的分布来判断身份地位的高下。和全部美国人相比,马克的表现非常好,比99.5%的同胞都好。就马克和珍妮来说,他们在情绪上承受很大的压力。珍妮嫁给一位事业有成的男士,但触目所及确实相对之下的失败,因为她没办法在感情上用一个公平的样本去衡量他的成就。我一再提及,人的天性很难变得更理性。我建议他们搬到蓝领阶级的社区中,这样就再也不会被邻居看扁,而且身份地位会升高到超越他们的成功概率。他们可以善用反向的扭曲。


存活者偏差是指“表现最好的最容易被看见”。为什么?因为输家并没有现身。基金管理界到处都是大师级的人物,但这个领域充满随机性,大师也可能落入陷阱。有个大师在同行的协助下,针对“罗宾汉”式的投资策略,计算其成功概率。这种策略是指把钱投资在一群经理人中表现比较差的人身上。也就是说,你得把钱从赢家那里取回来,改投资到输家那里,这和一般人的想法大相径庭。这么做的结果,他们的“账面策略”获得的报酬远高于紧抱赢家经理人的策略。在他们看来,这个假设性的例子证实了我们不应该只跟随比较优秀的经理人,而应该转投资于表现最差的经理人。他们的分析有个严重的缺点:样本中只有存活者,忘了考虑已退出这一行的经理人。这种样本只包括仿真期间在操盘,且迄今仍在操盘的经理人。没错,他们的样本包括表现不好的经理人,但也只是表现不好或事后有改善的,并没有已退出这一行的人。所以在某个时点表现不好的经理人,把钱交给他们去投资,后来他们的绩效转好,投资人当然可以获得正报酬!要是他们的表现继续很差,他们就会被迫退出这一行,不会留在样本中。


第九章  买卖证券比煎蛋容易

一群全部能力欠佳的经理人,仍会有少数人的绩效记录很好。蒙古首都乌兰巴托的温度变化,也可能与某种证券的价格走势百分之百相关。本章将讨论绩效记录和历史时间序列一些有违直觉但很有名的特征。这里所谈的观念,名称有几种,如存活者偏差、数据挖掘、数据探索、过度配适、回归平均值等,基本上它们都是因为观察者对随机现象的重要性认知错误,因此过度夸张过去的绩效。


我经常被问到这样的问题:“你以为自己是谁,竟想告诉我,这辈子我可能只是纯凭运气而已?”恩,没人真的相信自己只是运气不错。我使用的方法是利用我们的蒙特卡罗发生器,可以制造出纯属随机的状况。我们可以用人为的力量制造一些供作嘲笑的无名小子;在我们的设计中,他们不具备任何能力,完全就像安慰剂一样。第一个例子是一句流行格言:即使是停住不动的时钟,一天也有两次正确。我们将稍为引申,说明统计学是一把双刃剑。我们借用蒙特卡洛发生器,虚构一万个投资经理人。假设他们每个人的赚赔概率恰好各半:年底时每个人都有50%的概率赚到1万美元,50%的概率赔掉1万美元。我们再多加一条限制,一旦某位经理人某年的表现很差,便从样本中剔除。如此运作很想传奇性的投机分子索罗斯,据说他曾告诉被召来开会的经理人:“明年你们有一半的人会出局。”和索罗斯一样,我们的标准定得极高,我们只留下毫无污点的经理人。蒙特卡洛发生器会掷出硬币,出现正面的话,某位经理人那一年会赚1万美元;出现反面则会赔1万美元。第一年结束时,预期会有5000位经理人各赚1万美元、5000位经理人各赔1万美元。接着再仿真第二年。同样,预期会有2500位经理人连续第二年获利。再过一年是1250位,到了第4年是625位,而第五年只剩下313位。在输赢各半的游戏中,我们现在有313位经理人连续5年获利。这纯粹是靠机运得来的。


我们把以上论点再延伸,好让它更有趣些。我们创造出一大群人,清一色是能力欠佳的经理人。所谓能力欠佳,定义是他们的期望报酬为负值,也就是机运和他们过不去。现在指示蒙特卡洛发生器从罐子里取球。罐中有100颗球,其中45颗是黑球,55颗是红球。每次取出后再放回去。因此红球、黑球的比率不会变。如果取出黑球,经理人赚1万美元;取出红球,赔1万美元。平均来说,每一回合经理人会赔1000美元,不过这只是平均值而已。第一年结束时,我们预期会有4500位经理人获利,第二年,其中的45%的人获利,也就是2025位,第三年有911人,第4年是410人,第五年有184人。我们封给他们向量的头衔,让他们穿名牌西装。没错,存活下来的经理人,只占原始群体的2%以下。这些人现在是众所瞩目的焦点,没有人会去提另外98%。我们能够得到什么结论?第一个有违直觉的结论是:一群全部能力欠佳的经理人,仍然会有少数人的绩效记录很好。第二个有违直觉的论点是:我们所关心的绩效记录的极大值的期望值,受原始样本的大小影响较大,受每位经理人的个别运气影响较小。如果1997年入行的经理人多过1993年,那么2002年的“优秀经理人”会多于1998年—我敢说一定如此。


存活着偏差取决于母群体的原始大小。一个人过去赚到钱这个信息,本身既无意义且不重要。我们必须知道他所述群体的大小。换句话说,如果原始群体只有10个经理人,那么我会毫不考虑地把一半的积蓄交给表现优异者。如果原始群体有一万名经理人,我会对他们的操作成果视而不见。


向不懂统计学的人说明数据挖掘问题时,最简单的方法是利用所谓的“生日悖论”,不过它其实不能算是悖论,只是反直觉的奇怪现象。随便找一个人,你和他的生日碰巧是同一天的概率是1/365.25。一个房间内有23个人,任意两人生日同一天的概率有多少?约为50%。关键在于我们没有指明哪两个人,任意两人都可以。


第十章  输家全拿—生活中的非线性现象

接下来我要从新的角度探讨生命并不公平这句老掉牙的话。令人惊讶的是:生命是以非线性的方式呈现不公平。生活中一点小小的优势,可以带来高的惊人的报偿,或者根本连一点优势也没有,却因随机性提供小小的帮助而鸿运当头。


首先我们来定义什么叫做非线性。解释非线性的方法有很多种,但科学上常见的方法叫做沙堆效应。举例说明如下:我坐在沙滩上向一个小孩借来塑料海滩玩具盖座沙堡—巴别塔。我不断把沙加到顶端,慢慢提高整座沙堡的高度,我那些住在巴比伦的亲戚认为这么做可以上达天堂。不过我的野心没那么大,只想测试能够盖到多高才垮掉。我继续加沙,沙堡终于垮了。我们可以说:最后一粒沙破坏了整座结构。我们在这里看到的是线性力量加在一个物体上,结果产生非线性的效果。多加一丁点东西(这里是指一粒沙),竟然产生不成比例的后果。关于这种现象,前人已有很多智慧语录,如“一根稻草压垮一头骆驼”。这些非线性动态现象有个市场名称,叫做混沌理论。混沌理论主要是讨论起点上的一点小差异最后会造成不成比例的反应。比方说,依据人口模式,起始点很小的差异可能导致某一物种爆炸式地成长,或者使它完全灭绝。气象是另一个常见的科学模拟,例如印度一只蝴蝶挥舞翅膀,可以在纽约造成飓风。


事情的发展在加入随机性之后会变得更为有趣。假想等候室里有一大堆演员,等着试演测验,最终获得录用的演员数目当然不多,却是观众眼里那个行业的代表,正如我们所说的存活者偏差那样。赢家成为大明星,而其他占绝大多数的人继续在附近的星巴克端送泡沫拿铁咖啡。或许有人会说,能够挑大梁饰演主角而名利双收的那些演员,一定都拥有别人所没有的演技、魅力和特殊容貌,和这样的事业生涯搭配得天衣无缝。但我有不同的意见。赢家也许有很不错的演技,但其他演员也有演技,否则就不会再等候室等待试演。名气的形成有其自身的动态过程。演员会因为某一群人认识他,而被另一群人认识,这种名气像螺旋一样动个不停,起点可能在试演室。他会被选上,可能是某个可笑的细节恰好投合主试者当天的心情。要是主试者前一天对某个人产生好感,而那个人的名字听起来和眼前这位试演者很像,那么从那个特殊的样本历史中选出的这位演员,可能就必须在另一个样本历史中端送拿铁咖啡。


研究人员经常以键盘上QWERTY的字母排列顺序为例,说明经济中输赢的诡异动态过程,并举证最后的结果往往不是最好的。打字机上字母的排列方式,正是最不适任者胜出的实例。目前的排列顺序会减慢打字的速度而不是让我们打起字来更为容易,原因是当初的机械式打字机色带容易卡死,为了避免这种情形所以有这样的字母排列顺序出现。后来文字处理走向计算机化,有人曾经设计几种键盘,以便加快打字速度,但打字者已经习惯使用QWERTY键盘,很难改变。这被称做路径依赖结果。信息时代促使人们的品味趋于一致,导致不公平现象更为尖锐—赢家几乎可掌控全部的顾客。微软公司正是邀天之幸大获成功的最佳写照。我们不否认盖茨有很高的个人标准、工作伦理,而且智力高于一般人,但业内就属他最优秀吗?这一切都是他该得的吗?显然不是。大部分人选用他的软件,只是因为别人也都在使用他的软件。这纯粹属于循环效应,经济学家称之为“网络外部性”。


这种事情有违古典经济模式。依古典经济模式,事必有因,没有不确定性这回事,且好人终将出头(好人是指能力较强且拥有较优越技术的人)。经济学家很晚才发现路径依赖效应,之后大量发表这方面的论著。处理这个问题的数学取向应运而生。在传统模式(如财务领域非常有名的布朗随机漫步)中,成功的概率并没有随着每踏出一步而变化,只有累积的财富才会。阿瑟则提出波利亚过程,它在数学上很难处理,但借助蒙特卡洛仿真器却很容易理解。波利亚过程可以这么说明:假设有个罐子,起初装有等量的黑球和红球,每次取球之前,你得先猜测取出来的是哪个颜色。这个玩法是被操纵的。和传统的罐子不一样,在这里,猜对的概率取决于前面猜对的记录,猜的更好或更差,要看前面的表现如何而定。这么一来,先前猜对的话,后来继续猜对的概率会提高;先前猜错的话,后来继续猜错的概率会提高。仿真这种过程,可以看到结果变异很大,有惊人的成功,也有极多的失败,我们称之为偏态。


在比较常见的模式中,玩家是把取出的球放回去后再猜下一次会取到哪种颜色的球。假使你这次赌转盘赢了,这会提高你再赢的概率吗?不会。但波利亚过程会提高再赢的概率。为什么这在数学上很难处理?原因出在独立性的观念被破坏。独立性是指每一次取球时,都不受先前的结果影响,它是处理(已知的)概率数学的必要条件。


随机结果的非线性特质有时可作为打破僵局的一种工具,我们来谈叫做非线性轻推的一个问题。假设有一头驴子,饥饿的程度和口渴的程度相等,我们把它放在距食物和饮水恰好等距的地方。这种情况下,它会死于饥饿和口渴,因为它没办法决定先吃哪一个。现在我们加入随机性,随便把驴子轻轻推向任一方,使它更接近某一边,这么一来,僵局马上解开,这只快乐的驴子将先吃饱再喝水,或者先喝水再吃饱。读者无疑都玩过和布里丹之驴同类的游戏,比方说借“丢铜板”来解决生活中一些小小的僵局,也就是让随机性帮助你做决定,让命运女神做主,你只要欣然接受就可以。技术上来说,在解最优化问题需要扰乱一项函数时,常会使用这种“随机化”方法。