只接受发布货源信息,不可发布违法信息,一旦发现永久封号,欢迎向我们举报!
免费发布信息
批发频道 > 餐饮行业新闻资讯 > 鞋子批发 >  如何看待双十一销售额完美分布在三次回归曲线上且拟合高达 99.94%?是巧合还是造假?


  • 【莆田鞋厂家分类】
  • 【奢侈大牌包包厂家分类】
  • 【潮牌奢侈服饰鞋子厂家分类】
  • 【名表厂家分类】

厂家货源分类区域

如何看待双十一销售额完美分布在三次回归曲线上且拟合高达 99.94%?是巧合还是造假?

发布时间:2019-11-12 15:40:27  来源:互联网整理   浏览:   【】【】【
这涉及两个知识点:泰勒展式和墨菲定理简单说1.任何曲线都可以用n次多项式来拟合,所以什么曲线都可以拟合,精度受n控制2.小概率事件在多次试验中,一定会发生,所以只要活动每年搞,增长情况是什么样的都会大
如何看待双十一销售额完美分布在三次回归曲线上且拟合高达 99.94%?是巧合还是造假?

这涉及两个知识点:泰勒展式和墨菲定理

简单说

1.任何曲线都可以用n次多项式来拟合,所以什么曲线都可以拟合,精度受n控制

2.小概率事件在多次试验中,一定会发生,所以只要活动每年搞,增长情况是什么样的都会大概率有人找到一个曲线可以拟合

不过也佩服这个人,能人肉搞出来

计量没学好呗,还有啥解释?典型的时间序列下的spurious regression。

你用三次回归曲线拟合gdp能高达99%,but this is not the right way to do econometrics

然后又要说“可是gdp也是造假的!”

本科学的经济学 不做经济学已经好多年了 先用三张图抛砖引玉一下:这是一个宏观计量经济学中比较典型的“伪回归/伪相关”问题(spurious regression/spurious relationship)。

  • 2009年-2018年国家统计局发布的社会消费品零售总额(亿元):即从双十一第一年到去年(今年没过完,当然还没有数据)我光用线性模型,连二次项都不用,我就有0.998的R2
2009-2018 社会消费品零售总额 数据来源:国家统计局
  • 1999年-2018年国家统计局发布的社会消费品零售总额(亿元):即从国家统计局网站上有数据的第一年到最后一年,二次回归的R2也有0.997
1999-2018 社会消费品零售总额 数据来源:国家统计局
  • 如果有人怀疑中国的数据不可信,那我们看美国的:2009年-2018年美国的零售总额
2009-2018 美国零售总额 数据来源:美国联邦储备银行圣路易斯分行
  • 最后再防杠一下。2015年美国亚马逊开始搞Prime Day大促销,2015-2019年的Prime Day日销售量用带二次项的线性回归拟合的R2是0.997,但反正你也可以认为亚马逊也在造假。(这一工作是可视化了 @Good Inflation 在微信群里的分享)
亚马逊Prime Day日销售量(billion USD) 2015-2019 数据来源:Statista


知乎上学计算机的比较多,很看重所谓的“训练集”“测试集”问题。那就再多说两句,宏观数据的性质就是这样,如果没有结构性变化相对容易预测,只要关注世界各国(不仅仅是中国)对于各国经济增长的预测即可,比题主贴文里的预测准多了。一般来说,宏观经济学家对于平常年份的经济增长预测比作者准多了,大家诟病预测不准只是说金融危机即结构性变化预测不准而已。

数据能拟合一个简单的模型就是造假吗?那人口数据拟合得更好,岂不是实锤造假?对了我忘了确实有人每年都在说人口数据造假……

诚然,经济数据完美拟合模型不那么容易,但对于双十一这样的数据来说,反而更容易理解——因为任务目标就是这样的,那就完成任务。

事实很可能是——阿里在双十一上有自己的KPI,而KPI是用简单的指数增长算出来的。有了KPI,再层层分解,不断测算完成可能,想尽一切办法,压榨商家也好,预售期提前也好,锁定购物车只能双十一当天下单也好,都是完成KPI的手段。最终完成了KPI,和造假也没什么关系。

另一个例子是中国的数据,很多人一直吐槽国内地方政府GDP之类的数字不真实,因为数字增长非常平稳,比如《蝙蝠侠黑暗骑士》里说的那样。

但政府本身就以GDP为目标,最后完成这个目标,不是一件很正常的事情吗?我接触到的一些地方政府,在前几年仍然考核GDP的时候,最后三季度发现数据不行,那四季度赶紧就得提前上马一些投资,招商引资要再勤快一点,工作会议上再催促压缩一下项目的签约时间。

这都是为了最终完成GDP目标的一个正常工作,这么多年来中国经济增长保持这个平稳增速,完成这个KPI,地方官员是要尽到120%的努力的。换到阿里这样的企业上,这个任务完成只会更精确。

而区别在于,目前中国政府层面可能已经不考核GDP了,因为人们已经发现为了完成这个KPI所做的扭曲市场代价有些大。但阿里仍然在继续使用这个KPI,并且为了完成这个KPI付出大量努力。

所以真正的问题应该是,在目前国内消费增速放缓的大前提下,用各种手段扭曲消费,保证双十一这个KPI的完成,代价会不会太大?最后是让人们把一年的东西放在一天里面下单,还是让消费者买了很多不需要的东西?如果为了完成KPI过度扭曲了人们的正常消费,甚至产生了对消费的挤出,那可能就有些得不偿失了。

这个问题的回答受到了与 @王端端 @沈一冰 等朋友讨论的大量启发。

都是kpi的锅。

我老婆每年双11快结束了都能收到一个大额可叠加红包,类似满1000减150这样。

真的很管用好么。。。

一共才10个点,如果用十个参数的回归模型拟合,拟合度能高达100%呢,敢画置信区间看看么?

公布的太早了.

以后的预测就不准了.


应该先把这个东西先拿出来放到一个不可更改的地方

然后不让别人知道

等3年之后全部落实以后再公布.


为了保险起见还可以验证一下京东,苏宁,拼多多等其他电商是否也有类似的规律.

受此影响,我不禁想到前几天看到的一个图:

日本每年参加汉语考试HSK的人数。我不禁陷入思索,中国是发展中国家,日本是发达国家,中国现在正在经历经济下行,为什么会有这么多日本人学中文?

考试人数是不可能造假的,因为有考场在那里。那么结果呼之欲出了,这有可能是日本帝国主义亡我之心不死,正在大量训练间谍!

我们用这个数据对年份,年份的平方,常数项一起做简单OLS回归。

R^2高达0.9727!

阴谋被我发现了,请问上哪,我是不是可以拿钱了。

不是造假也不是巧合,是市场封闭利于控制。

就是单纯算出了他们领导给他们的KPI,他们领导也是那么算的,这有什么奇怪的

???很难吗?不是每年都在淘宝官方控制?

任务没有完成的,在最后几个小时出现那么多几千的福袋,然后再退款,这不是默认的事情吗?

人在工地,刚刚收工

怎么看?自己都没学好,就来带节奏,题主未来可以一起来搬砖。类似的数据,国内国外都一样。。。精确的像造假。因为它本来就这样

今年的 销售额有水分, 当天不允许退货。如果允许退货 数据会小一些

我找到了美国黑五购物的08-18的数据(https://www.thebalance.com/what-is-black-friday-3305710),然后尝试用多项式回归做了一下,拿08-17年为训练集,18年为测试集

二次线性回归 r-squared 0.9944142038405243

预测18年 707.035 实际 717.5

三次线性回归 r-squared 0.9945320864059383

预测18年 710.14666667 实际 717.5

四次线性回归 r-squared 0.996162712207455

预测18年 730.19166667 实际 717.5

直觉上,只要这个增长没有太多人为干预或者天灾人祸(比如08年次贷危机的时候,美国黑五销售数据就不增反降),跟着经济大盘正常增长,应该不难用多项式回归去拟合一个99%正确的结果,开开脑洞,你把全世界的人的身高排一排,发现正好符合正态分布,你也不能说人类正在进行全球性的身高作假,你只能说自然的身高分布就是符合正态高斯,而一个自然的增长曲线就比较像多项式曲线。

各位请看清楚,别人不只是拟合,而且是预测准确。

那是非常接近事实的真实通胀率

那要看造假的定义是什么了。

以下仅供举例,纯属虚构,如有雷同,纯属巧合。


A公司参加双十一促销,预计销售额8亿。天猫按照8亿规模配备了流量资源。

双十一开始8分钟后,A公司发现实际购买转化率不足,有可能完不成8亿的销售规模。

天猫增加了流量导入;A公司增加了促销投入。

数据仍然不足以保证KPI的实现。

A公司要求渠道商线上进货,取消每个账户限购5台的规定。约定渠道商可以比渠道价还低,双十一结束后以返点形式体现。

渠道商开启了线上批发模式。

但是仍然达不到预计目标。A公司要求渠道商导入线下客户。

渠道商人肉call门店,门店人肉call有购买意向的客户。给予特别折扣,推动其线上购货,或者后台代客下单。

仍然认购额不足,A公司求助天猫总部。

天猫总部帮A公司找了一批愿意以合适价格线上拿货的商家。




最终,A公司KPI顺利完成。

没有完成不了的KPI,双十一这么重要的东西,总有各种办法去完成的,阿里早算好了。至于这些办法算不算造假,见仁见智

虽然阿里今年的某些宣传让人不齿,但怀疑阿里造假我觉得也挺不齿的。

什么是数据造假?

就是数据有水分。

我卖了十个亿,说卖了一百个亿,没有那么多,说自己有那么多。

财务造假,是无数公司败亡的伏笔,它背后的隐患,经济学家写了不知道多少本书。

你是想说阿里高层可能连这个的后果都不知道吗?

官方给商家下任务定指标,总得有个合理的参考标准吧?指标发下去了,标准定出来了,正常完成不就应该是这个样子吗?

话说如果真的是是数据造假,牵扯几千亿的数据造假,怎么可能让你看出来?

人家敢把这个放出来,那就是不怕任何手段督察的,你先别管他怎么做到,但肯定能经得起考察。

那么多竞争者眼睛都盯着阿里,阿里有多大能量,大家心里都有数,状况外的话,早就被大佬爆破了。

更何况,成年人的世界,往往不轻易说断定,哪怕心知肚明。

我从一个数据工作者的角度来回答一下,数据调整和数据造假根本就是两回事。

经常做财务工作的朋友可能会知道,财务记账根本不是一件绝对的事,中间是有不小的调整空间的,研发人员的餐饮补贴既可以算在研发投入中也可以算在经营成本中,今年签订的合同既可以今年入账,也可以明年入账,不同的账款选用哪种方法摊销好像都有道理,在合理的范围内,随便你怎么做账。

例如A股就普遍存在这种情况,咱们先看美国净资产回报率的企业分布率,是呈现下图正态分布的走势,这种才是上市公司正常的资产回报率走势,明显没有什么财务操作。

而A股在投资回报率为0的地方出现了一次断崖,说明有大量上市公司将净利润进行了调整,要么提高了净利润,要么让亏损更多,为下次财报做准备,反正只要不是连续三年亏损就不会退市。这能说明A股的公司喜欢财务造假吗?还真不能确定,只能说有政策、制度因素在驱动中国的上市公司在做财务调整,好让它们的数据更能满足自身利益。

回到阿里的事件上来看,它们双十一的数据调整了吗?肯定调整了。造假了吗?我不知道,也不敢确定。

咱们可以先来对比一下阿里营收和双十一成交额的数据。增长曲线都满足三项式回归曲线,而且营收的增幅好像比双十一的成交额增幅更大,如果这也能算是财务造假的话,哪位胆大的可以去美国证监会了,绝对是一条发家致富的道路。

其实单用一个三项式拟合就说双十一数据造假的话,证据还有些不够,因为市场中大多数公开数据都有数学公式的影子,GDP、人口数这些数据都不说了,最典型的就是波士顿、艾瑞这些智库的研究报告和券商的行业分析报告,对于一些市场无法测算的数据,它们都是采用一些公式来估算,10个数据9个猜,剩下一个靠监管。但我们还不能简单说这些数据就是造假的,人家还是通过一定算法估算出来的最优解,虽然带有一定主观目的。

最后,很多朋友说这是阿里控制优惠券、通过大数据提前测算的结果,我觉得这就有点厚黑了,虽然他们现在大数据的能力已经很强大了,也完全没必要控制得这么精确啊,对比来看,还是直接跳转显示器数据来得比较简单直接。

如果我是负责双十一数据的人的话,我先设定今年总KPI就是2680亿左右,再拉出前几年分时真实成交额数据,直接对应每分每秒应该成交的额度,最后再想想今年我要重点凸显哪几个数据,比如多少秒破10亿,多少秒破百亿,最后再考虑一下凌晨1点的支付分流会导致成交额短时间暴涨,全天分时的成交数据我就能给你安排得明明白白,找不出一点纰漏。最后,你还要问我数据造假了吗?我认为还是没有的,比较淘宝目前是真的还处于增长阶段。

根据易观的数据显示,淘宝APP的活跃用户规模一直处于增长阶段,月活都快要超过7亿了,而且人们线上花钱的金额越来越高,这个增长数据也能说得过去。

最后,打个广告,公众号:原来是凌乐

一个靠数据分析股市逻辑的公众号

点这么少,我觉得R没有什么用,应该考虑chi^2/NDF

责任编辑:
热门阅读排行
© 批发频道