在线教程

第一节 对比分析法:用数据发现问题, 获取没有的洞见

对比分析法:用数据发现问题,获取别人没有的洞见

你好,欢迎来到圈外同学《7天数据分析入门实战营》,我是圈外同学创始人孙圈圈。和你一起提升数据思维,掌握职场核心竞争力。

 

 

今天我们的小节主题是:如何用数据发现问题,获取洞见。

 

关于这个主题,我特别想给你分享一个我自己的故事。我刚进咨询公司的时候,公司有薪酬调研部门,会收集各家公司所有员工的薪酬、职位、年龄等等信息,然后出具薪酬统计报告。

 

 

我在去咨询公司之前,是在另一家公司做商业分析师,十多年前,商业分析师还是一个非常稀少的职位,所以我会很多其他人不太会的数据分析方法。

 

我觉得这些薪酬数据只做个简单的统计然后发布,实在很浪费,就用这些数据做了些分析,比如看哪些行业涨薪最快,在什么部门升职最快,薪酬分别跟哪些因素最相关,等等。

 

 

这些分析让合伙人跟客户眼前一亮,从此愿意让我参与很多重要项目,也给我赢得了更多发展机会,最终成为公司大中华区晋升最快的顾问。

 

 

今天的课程中,我除了给你一些工作场景案例之外,也会用当时的一些分析作为例子,带着你过一下整个课程的知识点。

 

为了让你能够跟我一起思考,我把当时的数据模拟出来了。数据是一些互联网和高科技公司的薪酬数据,包括各公司员工的薪资、职位、职级以及个人信息,个人信息有出生年份、在这家公司的时长等等。当然,数据做了简化和修改,只是模拟场景。

 

 

你可以暂停半分钟,先看一下这个数据表,思考一下,如果这些数据给到你,你能得出什么样的洞见?

 

好了,我们课程最后给你解答。

 

先回到课程。我们先思考一下:今天要讲的是如何用数据发现问题、提取洞见。那么在日常生活中,我们是怎么发现问题的呢?

 

 

比如,你的另一半一直不太在意个人形象,但某天突然开始健身、保养皮肤,还买新衣服,这时候你会不会想:诶?是不是有什么问题?

 

再比如,你观察你的同事,上个月平均差不多是9点到公司上班,这个月却平均10点才来,你是不是也疑惑:他最近怎么了?

 

所以,你有没有看出来,我们是怎么发现问题的?对了,就是“对比”。同事这个月10点上班,上个月9点上班,这就是对比。

 

所以,实际上从数据中发现问题、获取洞见,核心就是对比。

 

 

那我们应该如何做数据的对比分析呢?

 

 

既然要对比数据,我们就需要回答3个问题:

1、对比什么数据?(What)比如上面同事上班的例子,我们对比的是“上班时间”这个数据;

2、怎么对比?(How)我们用的是上班时间的月平均数这个统计方法来对比的;

3、和谁对比?(Who)我们是拿这个月的“他”和上个月的“他”来对比的。

 

所以,回答以上这三个问题,其实就是对比分析的三个步骤。

 

接下来,我就上面三个步骤,分别来展开,告诉你如何应用。在讲知识点的时候,我会用销售的例子来举例,帮你理解,而每个步骤结束后,我还会带着你,过一遍我上面的薪资相关的例子。

 

 

一、对比什么数据(What)

 

也就是说,选取哪些数据项来对比?

 

 

针对你的工作,如何能够找到足够的数据项来对比呢?从哪里找呢?这里给到你四个来源:

 

第一个,KPI,包括部门KPI和你自己的KPI。一般来说,KPI是老板最关注的数据项,而且很多也是量化的,所以可以用这些数据做对比分析。

 

第二个,是从你的工作流里面找。

 

 

比如说,一个做招聘的HR怎么找数据项?思考一下,招聘的工作流是什么?一般是:发布职位、接收简历、邀约面试、面试结果、谈Offer、入职等等,这里每个环节都有数据项,包括:发布了多少职位、接收到多少简历,邀约了多少人,Offer发了多少人,等等。

 

第三个,是从相关的行业报告/行业分析里面找,看看人家都关注什么数据项。拿圈外来举例,圈外是家在线教育公司,关于在线教育,有各种各样的报告,报告关注的基本上是营收规模、毛利、学员完课情况、课程数量等等,那么这些就可以用来做对比分析。

 

 

第四个,也是最简单的方法,就是你平常处理什么样的数据,拉出你最近的Excel表格文件,看看你手头上都有什么数据,就可以拿这些数据做分析。

 

比如,我当时就是看到,公司薪酬调研部门有很多薪酬数据,但这些数据只是统计一下发布出来,并没有做什么分析,非常可惜,所以就打算自己做些分析。

 

好了,现在你可以跟着我,用我当时的例子,完成这个步骤。根据我前面说的信息,有哪些可以用来对比的数据呢?

 

 

主要就是薪资和职位,在这个案例里,这一步非常简单。

 

当然,这些数据怎么对比,等我跟你讲完后面两个要素之后,你就知道了,现在,继续跟着我看第二个步骤。

 

 

二、怎么对比(How)

 

找到数据项之后,我们知道可以对比什么了,现在要解决第二个问题:How?怎么对比?

 

我在开头的时候,曾经跟你展示过这个表格,问到你有没有什么洞察。

 

 

很难,对吗?显然,这么多数据,你无从下手,很难进行有效对比,哪怕我们知道要对比薪资,这么多员工薪资,怎么比?所以,在我们找到数据项之后,你还得对这些零散的数据进行一些统计,让统计数据来代表整体数据,从而能够方便地进行对比。

 

当你面对大量数据、需要从中提取几个数据用来反映整体情况的时候,都有哪些统计方法呢?

 

 

常见的统计方法,其实有三类——

第一类,用来描述数据的集中趋势,就是平均数、中位数,众数。

第二类,用来描述数据的极端情况,也就是最值,包括最大值、最小值。

第三类,用来描述数据的比值,也就是比率或者比例。

 

接下来,我会展开讲一下这些统计数据一般什么情况下用。如果你之前就会用这些统计,那么你就可以在群里帮助其他没有基础的同学。

 

 

第一类,用来描述数据集中趋势,就是平均数、中位数,众数。

 

平均数最好理解。假设你是一个销售主管,向老板汇报团队的业绩情况,这时候,除了汇报销售总额,通常还会汇报另一个重要的数据:人均销售额,也就是每个团队成员销售额的平均数。

 

销售总额体现的是业绩完成情况,而人均销售额体现的是团队效率。5个销售完成100万,和7个销售完成100万,对公司的意义是不同的。

 

平均数应该是我们最常用的统计方法,但也有它的局限性。

 

 

我们经常说自己的工资“被平均”了,说的就是平均数的局限性。每年国家统计局都会公布平均工资数据。常常是消息一出,网友哀嚎一片,纷纷表示自己的收入低于平均水平,拖后腿了。这是因为,平均工资会被少数高收入人群拉高。

 

那我们看一个社会的工资水平,更合理的应该看什么数据呢?应该用另一个统计方法:中位数。

 

 

中位数,顾名思义就是一组数据从低到高排列,位于中间的数据,这个才代表社会中间层的薪资水平。

 

好,假设你还是我们前面提到的那位销售主管,你做了销售额对比分析,用了上面说的团队成员的平均销售额,发现比上月提升了5%,很开心,我们团队人效的确是在提升的。但我们如果用中位数再看一下,发现团队中位数的销售额比上个月其实是低10%的。为什么会这样呢?原来是因为销售冠军拿下了一个大额订单,拉高了平均水平,而这个大额订单可能1年也碰不到1次,所以下个月就不会有了。所以你看,同一个数据项,对比不同的统计指标,也能帮你发现更多问题。

 

最后我们再来看一下:众数,也就是在一组数据中出现频率最高的数值。

 

这个概念比较好理解,我不赘述,但是这里留一个有趣的小问题给你思考:我们通常所说的“均码”,是平均数、中位数还是众数呢?为什么用这个统计数据?你可以在群里跟同学们讨论一下。

 

 

好,关于这三个统计指标,我们先来做个小总结:如果各个数据之间的差异程度较小,那适合用平均数;如果数据之间的差异程度较大,或者存在个别的极端值,那用中位数或者众数,会更有代表性。

 

如果你不知道用什么怎么办?那么就都用上,因为:你有越多的维度可以对比,那么就有机会得到越多的洞见。

 

 

好了,刚才说的平均数、中位数、众数,描述的都是一组数据的中间情况,那么还有一类统计指标,描述的是极端情况,也就是我们要讲的第二类:最值。

 

 

最值,分为最大值和最小值。

 

研究最值,可以帮助我们寻找成功或者失败的原因。举个例子,一个销售团队去年一共卖5种产品,年销售额达到了小目标:1个亿。其中销售额最大的一个产品,卖了5000万。这时候你会得出什么结论?就是:去年的成功,是因为选对了这个产品。

 

所以,最值也能帮你发现更多洞见。

 

 

好,我们讲了中间情况,也讲了极端情况。我想介绍的最后一类统计指标,就是比率,或者说是比例。

 

还是作为销售主管的你,在工作了几年之后,想要寻求晋升、发展的机会,想看看公司哪个大区比较愿意给内部人才机会。统计了一下,华东团队,有10个经理是从一线销售主管晋升上来的,而华南团队呢,只有5个经理是内部晋升,其他都是外招的。

 

这是不是证明,华东区培养管理人才的能力比较强,更容易得到晋升呢?不一定。

 

因为如果你用比率,就会发现:华东区有20位经理,也就是50%的经理是一线主管晋升的;而华南区只有8个经理, 一线晋升的比率达到了62.5%。

 

 

所以,很多情况下,只看绝对数往往无法分析,或者分析得出的结论是错误的。这时候,比率更能给你提供指导意见。

 

好,讲完这三类统计指标,现在你会发现:使用不同的统计指标,得出的结论是不一样的,对工作也会产生不同的指导意义。

 

如果你在一开始还不太熟悉与熟练,不知道该用哪个统计指标,那么我建议你,把所有我前面提到的指标,在你的工作中都套一遍,你也许会得到一些很有意思、很有启发的结论。

 

好了,讲完第二个步骤,我们接着最开始那个薪资的案例。我当时统计了各个行业、岗位等等的薪资平均数、中位数、最值,那么,关于比率我统计了什么呢?你可以先思考一下。

 

嗯,我统计了各个层级之间的薪资比率差异,也就是说,你在一家公司,每上升一级,薪资涨幅是多少。

 

 

拿到这些数据,我怎么分析的?我讲完第三个步骤你就知道了。

 

 

三、和谁对比(Who)

 

那现在,我们来解答对比分析的第3个问题:Who?和谁对比?

 

 

常见的对比对象也有3种:历史对比、横向对比、外部对比。

 

 

历史对比,就是指将现在的情况,与过去的情况,进行纵向对比。

 

其实前面我在讲中位数的时候,就提到了:团队的销售额平均数虽然比上个月好,但中位数却比上个月差。把这个月的数据,与上个月的进行对比,这就是一个非常典型的历史对比。

 

我们在一些经济报道中,听到的”同比”和“环比”,就是两个经常用的历史对比。

 

 

而横向对比,就是指通过横向对比其他要素的情况,来发现、诊断问题。

 

比如说,你作为销售主管,这个月你的团队销售额业绩提升了5%,本来你很开心,觉得自己做得不错。结果发现,公司其他销售团队的业绩都提升了10%以上。那这个时候,结论就完全不一样了。

 

 

不管是纵向的历史对比,还是横向对比,很多时候是集中在自身或公司内部。但很多时候,做好自己还不够,我们还得关注竞争对手,于是就有了外部对比。

 

 

比如说,公司近来的销售额有所下降,同事提出说,因为最近是淡季,所以下降。那么这时候就可以对比外部同行业的公司。因为如果是淡季,那对于所有销售同类产品的公司,应该都是淡季,那他们的销售额有没有下降呢?

 

那么,这时候你可能会有个疑问:“内部的数据倒是挺容易获取,但外部的数据,该怎么获取呢?”

 

 

这里我给你推荐一个特别简单好用的工具:爬虫。今天在班级群里,班班会有福利给你,就是教会你用爬虫,不需要写代码,你就能够用它爬到很多数据,记得关注班级群哦!

 

好了,现在我们终于把三个步骤都学会了。我们终于可以来看薪资的例子。还记得吗?我们通过第一步和第二步,有了一些数据,包括薪资平均,薪资中位,薪资最高,薪资层差。

 

那么这些数据可以用什么对比方法呢?你应该能够想到,可以进行非常多的横向对比,比如说不同行业的薪资平均差异,不同行业的薪资层级差,不同部门的薪资平均差异,不同公司规模的薪资差异等等。

 

通过当时的一些分析,我有非常多有意思的发现,这里跟你分享几个。其中两个,我会来简单解读一下,如果你有兴趣,可以看一下其它几张图,跟同学们进行讨论。

 

1、不同发展路线的薪资对比

 

 

这里横轴是工作年限,M代表走管理路线,I代表走专业路线,对比下来我们发现,虽然说管理路线和专业路线都可以往上走,但在同样的工作经验情况下,管理岗仍然普遍比专业岗的薪资更高,且随着工作年限的增加,差距会更加明显。

 

2、不同职能的薪资对比

 

 

在互联网和高科技行业,不同职能线的平均工资来看,研发相对较高。

 

3、不同工作年限的薪资对比

 

 

4、不同司龄的薪资对比

 

 

5、不同年龄的薪资对比

 

 

6、不同公司规模的薪资对比

 

 

 

 

好了,今天的课程就到这里,在课后,你也可以尝试着,就你目前的工作领域,用这三个步骤,找到一些可以对比的数据指标,进行对比分析的练习。

 

顺便说一下,对比分析在操作层面,用简单的Excel就能够实现,所以我这里没有教你Excel使用,如果你在做表格的时候遇到问题,可以求助班主任或者班级同学。或者,未来如果有机会,你加入圈外数据学院的正式课程,我们也会有一个单独的关于Excel等等工具的预科练习给到你。

 

 

好了,当你知道了更多维度,掌握了更多对比方法,你就可以发现更多问题,获取别人没有的洞见。

 

那下一节课我们学什么呢?我们会来学习另一种分析方法:漏斗分析,也会给你讲讲经典的海盗模型。

 

 

我是圈外同学创始人孙圈圈,和你一起提升数据思维,掌握职场核心竞争力。我们明天见!