揭秘财务数据分析中暗藏的"辛普森悖论"-凯发游戏
如果一名篮球运动员的二分球命中率和三分球命中率均比另一名球员高,但是二分球与三分球的加起来的命中率却低于这名球员,这种情况有没有可能出现?
如果一家公司只生产两种产品,这两种产品的利润率均比上年有所提高,但是这家公司两种产品加起来的整体利润率却出现下降,这种情况会不会发生?
答案是肯定的,这两种看似不合逻辑的情况都有可能会发生,这种在数据对比时出现的奇怪现象就是“辛普森悖论”。
今天我们就探讨这个有趣的问题。
一 从投篮命中率对比看诡异的“辛普森悖论”现象
我们来看两位球员的数据对比。
勒布朗.詹姆斯与卡尔.马龙均为nba著名球星,司职前锋。我们可以通过对比两人的投篮命中率,就会发现一个十分诡异的现象。
1. 二分球命中率对比,勒布朗.詹姆斯胜出
首先,我们看两人的二分球命中率对比情况,见下表。
注:由于勒布朗.詹姆斯仍是现役球员,其数据统计截至2019/2020赛季,卡尔.马龙为职业生涯数据,二者均为职业生涯常规赛数据。
从二分球命中率对比来看,勒布朗.詹姆斯的54.89%明显高于卡尔马龙的51.9%。
2. 三分球命中率对比,依然是勒布朗.詹姆斯胜出
接下来,我们再来看二者三分球的命中率对比。见下表。
从三分球的命中率对比看,勒布朗.詹姆斯的34.39%依然高于卡尔.马龙的27.41%。
通过上述数据对比,我们可以看出,无论是二分球还是三分球,勒布朗.詹姆斯的命中率都高于卡尔.马龙,那么正常情况下,如果二分球与三分球加起来的命中率,也应该勒布朗.詹姆斯更高才合理啊?
但是,最后的结果让人大跌眼镜。
3.二分球与三分球加起来的命中率对比,居然是卡尔.马龙胜出
我们来看二分球与三分球合计命中率的对比情况。见下表。
通过上表计算的数据可以看出,二分球与三分球合计命中率,勒布朗.詹姆斯为50.39%,而卡尔.马龙为51.61%,竟然是卡尔.马龙的命中率高于勒布朗詹姆斯!
是不是感觉有些诡异?
其实这种看似反常的现象就是统计学上的“辛普森悖论”。英国统计学家e.h.辛普森(e.h.simpson)于1951年提出的“辛普森悖论”,此悖论指出,当我们进行数据分析比较时,如果进行分层比较得出的结论,与进行整体合并统计时得出的结论,最终可能是相反的。
4. 卡尔.马龙合计命中率高于勒布朗.詹姆斯的原因分析
原因其实很简单。二分球投篮难度低于三分球,二分球的命中率自然高于三分球。勒布朗.詹姆斯出手投了5409个三分球,而卡尔.马龙仅仅投了310个三分球,所以詹姆斯三分球投的数量比马龙多很多,最终拉低了个人的整体命中率。
二 财务数据分析中的“辛普森悖论”
先看案例。
某公司只生产两种产品:a产品和b产品。2019年这两个产品事业部的经营情况如下:
该公司2019年a产品营业利润率2.5%,b产品为8.93%,公司总体营业利润率为6.25%。在2021年年初,该公司透露即将发布的2020年度业绩称,a产品和产品的销售收入、营业利润、营业利润率均会有不同程度的提高,但并未言明公司整体营业利润率的情况。
随后,该公司披露了2020年的财务报表,如下表所示。
2020年的数据与我们想象的不太一样。
我们来对比一下2020年与2019年的数据变化。
2020年a产品销售收入200亿元,比2019年增加100亿元;营业利润6亿元,比2019年增加
3.5亿元;营业利润率为3%,比2019年的2.5%提高0.5个百分点。
再看b产品,2020年销售收入150亿元,比2019年增加10亿元;营业利润14亿元,比2019年增加1.5亿元;营业利润率为9.33%,比2019年提高0.4个百分点。
由此可见,该公司无论是a产品还是b产品,在销售收入、营业利润、营业利润率方面,均有明显提高,正常情况下,该公司的营业利润率应该比去年提高才对啊,但是,我们发现该公司的营业利润率反而下降了,2020年该公司营业利润率为5.71%,而2019年为6.25%,竟然下降了0.54%!
造成这种反常的原因是什么呢?
关键因素是两类产品所占的比重发生的了重大变化。b产品的盈利能力强于a产品,2019年b产品营业利润率为8.93%,a产品仅为2.5%。在2020年a产品和b产品在公司业务比重方面发生了重大变化,作为盈利能力更强的b产品在2020年收入占公司比重42.85%,比2019年降低了15.48%。正是由于盈利能力更强的b产品的比重出现了大幅减少,才导致该公司合并后的营业利润率下滑。
实际上,财务数据对比中的“辛普森悖论”在其他方面也可能出现,比如一家公司下属的几家子公司,每个子公司的盈利能力均提升,但合并在一起的盈利能力有可能下降,其原因也可能是由于不同子公司的业务在总公司的比重发生变化。此外,在产品价格方面对比方面,也有可能出现“辛普森悖论”的现象。
三 如何理解“辛普森悖论”现象
在数据对比分析时,“辛普森悖论”是客观存在的,虽然这种情况并不常见,但在满足一定条件下,是会发生的。对于财务分析中出现的“辛普森悖论”,我有这样几点看法。
第一,在进行总体与部分对比分析时,比如进行总公司与不同部门之间,总公司与各分子公司之间,总公司与不同产品之间,一定要考虑到分组的权重(或者说比重)因素,权重的变化会对分层(部分)与汇总(整体)的结果产生很大变化,甚至是完全相反的变化。
第二,必要时可以设定各分组一定的系数,通过系数来消除分组数据基数差异所造成的影响。
第三,假如一旦出现“辛普森悖论”,就必须深入了解产生此种悖论的原因,要考虑是否存在其他潜在因素导致此种现象的产生。
第四,数据是客观的,真实的,但是不同的人利用同样的数据,可以讲出不同的故事。所以我们经常看到上市公司对我发布财务信息,经常避重就轻,经常挑更有利于自己的数据公布,而表现不好的财务数据经常选择性的回避。
“辛普森悖论”的现象警示我们,不要迷信数据所展现的信息,不要轻信有些人用一些真实的数据,推测出未经证实的结论,从而蛊惑人心达到自己不可告人的目的。对任何数据,包括财务数据的分析、比较、评价,必须考虑多种原因,必须从多个角度着眼,不可以偏概全,也不可以全概偏。
“辛普森悖论”还启示我们,在进行对比时,数量与质量有时候是不等价的,如果单纯的看数量的多少,并不能说明断定一种事情的优劣,还要看质量。