很多朋友在处理数据的时候,经常会碰到这样那样的问题,有些对于数据敏感一些的朋友能立马发现其中的一些问题,但是很多朋友,在处理数据的过程中,并不能发现这一些问题。从而得出结论的错误,导致决策的错误。一个错误的决策,那还不如不费那个时间去做这个分析,凭经验做决策还更加精准和不浪费时间。
那就先跟大家分享几种最常见的错误。
先跟大家举个例子,比如,某某大学年度调查统计显示,本校计算机系的女同学,50%都嫁给了该校的男性老师。看到这个案例大家会怎么想?可能的大家的第一反应是这是什么学校对吧。但是事实上的一个情况就是,该系因为女生非常少,那一届就只有两个女生。就其中一个跟老师结婚了,就占了50%。这是属于非常经典的数据的案例。就是百分比数据,在数据量没有达到一定的量级之前,是不能够成为参考的依据的。这里面虽然并没有计算上的一个错误,但其实更加值得我们关注,并不是说,当你访客数才3个,就有一笔销量的时候,你的宝贝转化率就是33.3%了。这种说法,并不是判断这个宝贝转化率好坏的一个依据。
另外的一种情况,我拿实际案例来跟大家解释。 比如这个,平均访问商品数是通过计算的。就是商品浏览量除以的商品访客数。这是昨为数据源。然后经常我们会干的事情就是需要做报表统计什么的。结果就是这样,咋一看好像没什么不对。但是你试着算算89524除以61935等于多少,是1.44,好像差别也不大,但是为什么不一样呢?再来算算其他的540471除以281367等于1.92,都不一样了是吧。电脑出错了?其实这不是,这个就是在统计里面的,计算之后再统计的问题。我举个最简单的例子。如果第一天的访客数是10,下单数是2个,转化率20%吧,然后第二天的访客数是100,下单数是5个,转化率是5%吧,那两天平均的转化率按道理是(5+2)/(100+10)=6.3%对吧。但是你计算20%和5%的平均数呢?就是12.5%,跟6.3%相差好多。这个就是计算后的再汇总。大家一定要注意,这样子是要出错的。可能有些数据因为相差不大,大家没有注意,但是做数据必须就要严谨。
这时候怎么办,统计的话,就需要统计之后再计算,当然在数据透视表里也可以实现。
在下面的第一个选项里计算字段
点开后是这样的,然后名字可以自己取,计算公式就是大家需要计算的内容咯。确定之后,就会额外有大家看看计算结果。这才是真正的统计之后,再计算结果正确的值。