一个预测帝倒下了,你还敢说自己是高盛吗?

一个预测帝倒下了,个预你还敢说自己是测帝高盛吗?

日期:2023/01/24 04:04作者:佚名人气:

导读:同样,投行巨擘高盛新推出的倒下《2014世界杯经济学》研究报告也是从大数据中找规律,一帮应用数学的还敢天才用一大把数据和一个玄之又玄的模型对世界杯比赛结果进行了量化分析。要对世界杯进行量化分析,说自盛海量且靠谱的己高数据是万万不可缺少的,而高盛所需要的个预就是1960年以来主要国际赛事(非友谊赛)的比赛结果,这样一来,测帝就有了14000多个历史样本,倒下以供数学家们演算调整自己的还敢模型。...

文_苏安德

问:预测者可信吗?

A:确实有人可以成功预测每场比赛的说自盛结果,甚至可以预测到比分。己高 不奇怪。个预 从另一个角度来看,测帝这与电子邮件诈骗的倒下思路是一样的。 假设一个诈骗者向 900,000 人发送电子邮件,从巴西对克罗地亚开始,并选择一个结果(赢、平、输)并随机将其发送给 300,000 人。 然后,在本场比赛结果出来后,将下一场比赛的预测发送给收到正确结果的30万人。 再正确一场比赛后,将继续发放100,000枚。 所以,假设最后有10个人收到邮件,发现预测员连续猜对了前10场比赛的每一场,(然后相信他可以继续猜对,就给了他赌钱)…… 所以,一个预言帝成功的同时,却有成千上万的预言帝陨落。

世界杯是球迷的盛会,也是赌徒的狂欢。

对于科学家来说,预测是另一回事。 从量子纠缠的幻想,到我们比较熟悉的天气、地震预测,一般情况下,研究人员都是通过一个或多个定律,结合海量数据,得到一些特定的模型。 这些模型生成的结果在特定条件下触发。 这样一来,只要存在相似的条件,就会出现某种结果的概率。

同样,投行巨头高盛最新发布的研究报告《2014年世界杯经济学》也在​​从大数据中寻找规律。 一群应用数学的天才,用大量的数据和一个神秘的模型,对世界杯的结果进行了定量分析。

Elo系统排名

工欲善其事,必先利其器。 要对世界杯进行量化分析,绝对不能缺少海量可靠的数据,而高盛需要的是1960年以来的重大国际赛事(非友谊赛)的结果。这样一来,就有超过14000个历史样本可供参考数学家调整他们的模型。 此外,高盛还列举了一个重要的参数,就是Elo系统排名。

说到Elo系统排名算法预测世界杯的优势是什么,大多数人都会觉得有些陌生。 这是一个以国家队为标准的国际足球计分系统,不同于国际足联的排名。 显然,高盛认为Elo系统排名更科学。 这主要是因为国际足联的排名主要集中在最近一段时间的比赛,而Elo系统评估的是从1872年至今的完整历史数据。

那么,什么是Elo系统排名呢? 顾名思义,Elo 系统排名背后的算法当然是 Elo 评分系统,它首先由物理学家 Arpad Elo 开发。 Elo出生在风雨飘摇的奥匈帝国。 他10岁时随父母移民到美国。 他自幼酷爱象棋,天生具有研究数字的天赋。 因此,自1939年国际象棋协会在美国成立以来,他就积极热情地参与了协会的工作。 巧合的是,当时美国国际象棋协会的排名算法引起了一些争议,而Elo主动为该协会开发了一个更科学合理的排名算法,被运用到今天的许多体育比赛和电子游戏中。 Elo评分系统。

这个评分系统的核心是单场比赛的判断。 它的算法基于几个重要的参数:赛前得分(Ro)、预期结果(We)和比赛结果(W),再加上一个常数(K)。 公式是Rn=Ro + K × (W - We)——如果你看过《社交网络》,你可能还记得电影中扎克伯格做的Facemash网站,没错,那个网站就是用来判断女生长相的基础是Elo算法。

具体到国际足坛的Elo系统排名,每个参数都有一定的数据指标。 其中,K代表不同级别事件的权重。 例如世界杯决赛圈权重为60,欧洲杯或美洲杯等洲际锦标赛决赛圈权重为50,世界杯预选赛最后一轮为40,其他赛事为30.,友谊赛只有20场。至于W,分胜、平、负三类。 赢是1,平是0.5,输当然只有0。我们比较复杂,需要根据赛前两队的分差来判断。 公式为We=1/(10(-dr/400)+1),其中dr为赛前分差(主队加100分)。 也就是说,如果赛前主队积分为1110分,客队积分为1200分,那么两队的We应该分别为0.514和0.486。

用这个算法对浩如烟海的历史数据进行递归计算,最后的结果还是比较合理的。 世界杯开赛前,巴西以2113分位列国际足坛Elo积分榜榜首,西班牙以2086分紧随其后,德国、阿根廷、荷兰、英格兰和葡萄牙紧随其后。 高盛报告指出,各支球队在Elo系统排名下的评分,是他们用来建立预测模型的“最有力武器”。

上帝也会掷骰子

有了Elo比分的“神队友”,高盛就可以开始预测各支球队在世界杯上的表现了。 怎么做? 高盛在报告中明确写道,他们使用这些数据进行了 100,000 次蒙特卡罗计算。

蒙特卡洛是欧洲小国摩纳哥的一座海滨城市。 它以富人云集和博彩业的繁荣而闻名。 所谓蒙特卡洛计算法与城市无关,只是借用了“拉斯维加斯之城”的名称。 头,开玩笑地揭示了方法的本质:上帝也掷骰子。

是的,蒙特卡洛方法是一种随机模拟方法。 它的基本思想是模拟一个随机事件,最终得到各种概率分布的随机变量,然后用统计方法估计模型的数字特征,从而得到问题的数值解。

不熟悉的人可能会问,如果是纯掷骰子的方式,双方输赢的概率不是相等的吗? 谁不会这样做,高盛还需要数据做什么? 其实没有。 因为蒙特卡洛虽然是随机模拟,但它也有不同的权重——游戏双方的实力不同,就像当骰子大于总数时,双方可以掷出的次数不同。

在遵循蒙特卡洛方法的竞技体育项目中,NBA 乐透可能是最著名的。 在NBA彩票开奖中,主持开奖的人会拿出14个编号为1-14的球,放入一个容器中,随机从中取出4个球,这4个球的组合决定头号彩票. 归因。 如果不计算号码顺序,这种彩票可以有1001个组合,其中一个被规定为“无效票”,另外1000个组合由电脑随机分配给14支没有晋级季后赛的球队. 其中,战绩最差的球队可以获得250个组合,也就是说有25%的机会中头彩; 战绩最好的球队只有5个组合,被选中的概率只有0.5%。

为什么说是随机的呢? 因为赔率毕竟只是赔率,250种组合只能让你的机会比别人大,但并不能保证第一顺位落在你家。 事实上,自1990年NBA采用这种抽签方式以来,只有4支球队以最差战绩抽到了头号乐透; 组合,即有1.7%的概率被选中。

那么让我们回到高盛的预测模型。 他们的体重分配依据肯定不像NBA的战绩那么简单。 报道称,除了Elo评分,高盛还在分析中引入了五个重要变量:

1、近10场国际大赛各队平均进球数;

2、近5场国际大赛各队平均失球数;

3、每支球队的世界杯抽风指数——这个变量主要看某支球队是否有在世界杯上炫耀的倾向,或者突然哑火。 当然,要分析趋势,至少需要足够大的样本,因此高盛只选择了巴西、德国、阿根廷、西班牙、荷兰、英国、意大利和法国进行指数研究;

4、各队主场比赛表现;

5.各队在各自洲的表现。

凭借这些指标,高盛构建了一个分子模型,然后进行了10万次掷骰子模拟,得出了两支球队交锋时最有可能的结果,进而得出了“最合理”的世界杯预测。

巴西夺冠合理吗?

经过10万次模拟,高盛的结果是——巴西将一路夺冠。

这其实很好理解。 我们可以通过对比高盛推出的6个指标来一一分析:在世界杯开赛前的Elo排名中,巴西队高居榜首,比西班牙队高出27分; 去年的联合会杯,他们3-0击败西班牙,4-2击败意大利。 他们进了很多球,丢了很少的球。 巴西队历史上获得过5次世界杯冠军。 英格兰也每场重大比赛都会抽搐; 而且,巴西是主场,根据高盛的计算,主场优势可以让巴西场均多进0.4个球; 欧洲队场均可以多进0.2个球,欧洲队就更惨了。 历史上还没有欧洲球队在美洲举办的世界杯上夺冠的先例。

因此,按照这一预测,本届世界杯最合理的情况是,巴西队在小组赛中分别以4-1、4-1和5-0击败克罗地亚、墨西哥和喀麦隆,然后在小组赛中以3-0获胜。第二轮。 1力克荷兰,1/4决赛3比1战胜乌拉圭,半决赛2比1淘汰德国,最终决赛3比1夺冠。

但高盛也知道,所谓的“合理”在足球界是很不靠谱的。 因为足球不像篮球,往往得分超过100分,所以整场比赛以0-0结束是常有的事,而且我们也知道,这种低比分的比赛也意味着极高的不可预测性——即使你出场了全场对阵对手,射门比为50比2,射门比为25比1,结果门将神勇将你的射门全部扑出,仅用1次射门就将比分追成了1比0。 赢了,这样的故事还不够发生吗? 因此,高盛认为用蒙特卡洛方法计算各队晋级不同阶段的概率更为可靠。

于是又是一轮反复的掷骰子模拟实验,最终高盛得出结论算法预测世界杯的优势是什么,巴西队有99%的几率晋级小组赛,78.8%的几率进入八强,71.7%的几率进入小组赛。进入半决赛,进入决赛的几率为60.3%。 %,中奖概率高达48.5%! 这是一个令人难以置信的数字。 要知道在欧洲赌球的人都只认为巴西有25%左右的机会夺冠。

根据高盛的预测,除了巴西之外,最有可能夺冠的球队还有阿根廷、德国和西班牙,他们的夺冠几率分别为14.1%、11.4%和9.8%。

值得一提的是,为了尽可能将预测保持在理性分析的范围内,高盛并未考虑个别球员对比赛的影响,比如德国队穆勒一到就爆发在世界杯上,或者阿根廷国家队梅西的进球运气、裁判倾向等等,这些不可量化的影响因素都会被排除在外。 这当然会使模拟过程更简单、更容易,但其预测效用将大大降低。

事实上,在四年前的南非世界杯期间,高盛就曾做出过一次预测。 结果不是太离谱,但有一些不准确的地方。 比如他们预测巴西夺冠的概率最大,其次是西班牙,结果西班牙夺冠了。 此外,他们还认为,意大利小组出线的概率达到了84.8%,法国队也有76.0%的出线把握。 两支球队在各自小组中垫底,小组赛结束后不得不回家。 如果你用R-square系统来评估他们的预测准确性,你会发现高盛2010年的预测R-square值只有0.24,距离完美的1(100%准确率)还有相当大的差距。