草庐IT

刚入门数据分析,领导就丢给我一个大难题

接地气的陈老师 2023-03-28 原文
​“你自己多想想……”是很多新手数据分析师最怕听的话。如果前边还加个自己不熟悉的业务,比如“做个内容分析,做个售后分析,做个呼入分析……你自己多想想”,那就更难受了。到底该咋个“多想想”,今天我们系统看下。

问题场景:

某个互联网厂子,领导对说:“做个积分分析,你自己多想想”。

就没了

没了

殳了

咋办!

一、从业务场景开始

之所以觉得难下手,是因为这里是两个问题,不是一个问题。

问题一,业务知识:到底是什么业务的,什么样的积分??

问题二,分析目标:这个积分到底啥现状,要分析出什么东西?

两个东西都不清楚,就如同盲人骑瞎马,当然毫无头绪了。

破题,要从业务知识开始。如果连业务的基本情况都不清楚,那就根本没法分析了。而且在梳理业务的过程中,可以收到业务人员的感性反馈,比如:

“积分太鸡肋啦,都没啥用!”

“积分成本太高啦,拿来干别的不行吗!”

“最近积分飚的太高啦,是不是有啥问题?”

这些感性反馈, 可以成为梳理分析目标的起点。

二、业务梳理逻辑

梳理业务,可以依照:来龙去脉,整体局部的顺序进行。搞清楚这个业务的上游、下游环节。从而梳理出最粗框架的业务流程。

以积分为例:

上游:积分从哪里产生

下游:积分在哪里消耗

整明白这两个问题,就能理清积分的业务流程。以电商业务为例,常见的积分来源、消耗方式如下图:

梳理出粗框架业务流程以后,可以落实数据来源,即这些环节的数据有没有记录,有没有清晰的记录,在哪些系统进行记录。以积分为例,很有可能系统自动产生的积分,比如消费积分,是有清晰记录的,能具体到每一笔交易。但是活动赠送,人工调账的,很有可能没有详细记录是哪个活动/哪个投诉补偿进来的。

数据分析最大的难题是:没数据。在梳理业务流程的时候,要提前发现这些问题,避免事后查数据库的时候,面对一堆莫名其妙,没有标注的数据。

以上两个工作,可以不和业务部门沟通,直接顺着业务流程/系统流程/数据字典去查,但是仅仅做这两步,很有可能得到一个:知其然,不知其所以然的结果。

更深层的原因是不知道的,比如:

“为什么注册积分要设计成累积500分?”

“积分兑换的礼品,为啥专门有几款是500分的?”

“派积分的活动,为啥集中在这几个时间段做?”

……

很有可能这些设计的背后,有特定的业务目的。这些业务目的不是直接留在纸面文档里的。

因此,梳理工作不应停在仅了解流程/数据上。还应该再梳理:业务动作。理解了业务部门出于什么目的,做了什么事,才能理解数据背后的东西。很多常识性的结论可以直接从这些问题里获得,进一步分析的灵感也能从这里来。从而极大的避免:分析了一堆,业务说“我早知道了”。

当然,不同公司沟通难度不同,这一点上同学们量力而行。能沟通清楚,是最好的。

三、基础数据呈现

在梳理完业务后,可以做基础数据呈现。基础数据呈现也要遵守:来龙去脉,整体局部的原则。先呈现基础情况,再发现问题。

比如积分情况,可以讲:

1、整体上,存量积分有多少,每月新增多少,消耗多少?

2、整体存量积分,每月新增/消耗,在近1年变化走势如何?

3、积分来源有多少种?每一种占比如何?

4、积分来源的结构是否有变化?

5、积分消耗的方式有多少种?每一种占比多少?

6、积分消耗的结构是否有变化?

呈现完现状以后,根据之前梳理情况,后续有不同的做法。

四、有感性反馈时,如何深入分析

如果在梳理过程中,已经拿到感性反馈,则可以直接对感性反馈进行深入分析。

比如业务部门反馈:“积分太鸡肋了,都没啥用”。可以进一步分析:

1、清晰定义:什么叫没啥用(在产生端没用,还是使用端没用)?

2、数据验证:“没啥用”到底是不是真的在数据上有证据?

3、问题度量:是一直以来都没用,还是逐步变没用?

4、原因分析:如果用户不喜欢积分,用户喜欢啥?

这里要注意几个关键问题:

1、定义一定要清晰。

感性反馈之所以感性,就是因为它没用规范的描述。比如积分没啥用,如果是说生产端,一般指:送积分不能带来效益(比如拉新人、促消费);如果是消耗端没用,一般指:积分不受客户喜欢,客户兑换使用得少。细节一定确认清楚,避免南辕北辙。

2、真实性验证不可少。

业务部门给感性反馈背后的原因也很复杂:

可能是真的了解情况,非常不满

可能根本不了解情况,随口一说

可能有其他目的(比如上新活动,把积分取代掉),就坡下驴

所以要用数据验证下,是否说的是真的。如果感性反馈和数据结果对不上,就得再深入思考:到底真实目的是哈?

3、问题度量先于原因分析。

问题先分轻重缓急,再看什么原因导致的。这样做不但有利于抓真正的重点问题,而且有利于梳理分析标杆,明确改进方向。比如说积分活动ROI太低,低于1:5就算不好,那么以下四种不同的表现,指向的分析结论是完全不同的(如下图)。

五、无感性反馈时,如何深入分析

如果在梳理阶段,啥感性反馈都没拿到。那就只能自己做做探索。

在探索阶段,重点关注:趋势和变化

1、突发性重大变化

2、长期性缓慢变化

3、周期性变化

比如在积分来源端,常见的变化情况如下:

趋势和变化,本身可以成为进一步分析的点,比如:

注册积分已经很少人领取,是否应该优化

活动积分赠送太多,是否为1年后积分到期时埋了地雷

人工调账缺少规范,经常有大笔异动,是否要追查

作为数据分析,可以把这些发现先罗列出来,要不要深入分析交给领导决定。一般情况下,会说出:“你自己想想……”,要么是领导自己不熟悉这个业务,要么是领导自己也不知道情况,要么是丫不关心这回事。

所以在接到问题时就问领导:“你想分析啥”很有可能是没答案的——他自己脑子都是空的。所以在呈现基础数据+变化趋势+变化以后,可以引发进一步的讨论。

当然, 也有可能到这个阶段,领导直接说:先这样吧,让业务看看。那就完美收工了。

六、小结

从本质上看,“自己多想想”问题,来源于对情况的不清晰,不止是分析思路,而是连基础业务情况都不知道。

这时候,破题的核心,就是做好梳理,把情况搞清楚。如果不去梳理流程,不去了解情况动作,不接收感性反馈,不检查数据来源,不分析发展趋势和变化,真的只是“自己多想想”那肯定是抓破脑袋也想不出来的,这一点同学们千万要避免哦。​

有关刚入门数据分析,领导就丢给我一个大难题的更多相关文章

  1. ruby - 解析 RDFa、微数据等的最佳方式是什么,使用统一的模式/词汇(例如 schema.org)存储和显示信息 - 2

    我主要使用Ruby来执行此操作,但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式,例如使用这个yaml文件,它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i

  2. ruby - 使用 Vim Rails,您可以创建一个新的迁移文件并一次性打开它吗? - 2

    使用带有Rails插件的vim,您可以创建一个迁移文件,然后一次性打开该文件吗?textmate也可以这样吗? 最佳答案 你可以使用rails.vim然后做类似的事情::Rgeneratemigratonadd_foo_to_bar插件将打开迁移生成的文件,这正是您想要的。我不能代表textmate。 关于ruby-使用VimRails,您可以创建一个新的迁移文件并一次性打开它吗?,我们在StackOverflow上找到一个类似的问题: https://sta

  3. ruby-on-rails - Rails - 一个 View 中的多个模型 - 2

    我需要从一个View访问多个模型。以前,我的links_controller仅用于提供以不同方式排序的链接资源。现在我想包括一个部分(我假设)显示按分数排序的顶级用户(@users=User.all.sort_by(&:score))我知道我可以将此代码插入每个链接操作并从View访问它,但这似乎不是“ruby方式”,我将需要在不久的将来访问更多模型。这可能会变得很脏,是否有针对这种情况的任何技术?注意事项:我认为我的应用程序正朝着单一格式和动态页面内容的方向发展,本质上是一个典型的网络应用程序。我知道before_filter但考虑到我希望应用程序进入的方向,这似乎很麻烦。最终从任何

  4. ruby-on-rails - 渲染另一个 Controller 的 View - 2

    我想要做的是有2个不同的Controller,client和test_client。客户端Controller已经构建,我想创建一个test_clientController,我可以使用它来玩弄客户端的UI并根据需要进行调整。我主要是想绕过我在客户端中内置的验证及其对加载数据的管理Controller的依赖。所以我希望test_clientController加载示例数据集,然后呈现客户端Controller的索引View,以便我可以调整客户端UI。就是这样。我在test_clients索引方法中试过这个:classTestClientdefindexrender:template=>

  5. ruby-on-rails - 如果 Object::try 被发送到一个 nil 对象,为什么它会起作用? - 2

    如果您尝试在Ruby中的nil对象上调用方法,则会出现NoMethodError异常并显示消息:"undefinedmethod‘...’fornil:NilClass"然而,有一个tryRails中的方法,如果它被发送到一个nil对象,它只返回nil:require'rubygems'require'active_support/all'nil.try(:nonexisting_method)#noNoMethodErrorexceptionanymore那么try如何在内部工作以防止该异常? 最佳答案 像Ruby中的所有其他对象

  6. ruby - 为什么 SecureRandom.uuid 创建一个唯一的字符串? - 2

    关闭。这个问题需要detailsorclarity.它目前不接受答案。想改进这个问题吗?通过editingthispost添加细节并澄清问题.关闭8年前。Improvethisquestion为什么SecureRandom.uuid创建一个唯一的字符串?SecureRandom.uuid#=>"35cb4e30-54e1-49f9-b5ce-4134799eb2c0"SecureRandom.uuid方法创建的字符串从不重复?

  7. ruby-on-rails - Rails - 从另一个模型中创建一个模型的实例 - 2

    我有一个正在构建的应用程序,我需要一个模型来创建另一个模型的实例。我希望每辆车都有4个轮胎。汽车模型classCar轮胎模型classTire但是,在make_tires内部有一个错误,如果我为Tire尝试它,则没有用于创建或新建的activerecord方法。当我检查轮胎时,它没有这些方法。我该如何补救?错误是这样的:未定义的方法'create'forActiveRecord::AttributeMethods::Serialization::Tire::Module我测试了两个环境:测试和开发,它们都因相同的错误而失败。 最佳答案

  8. ruby - Ruby 有 `Pair` 数据类型吗? - 2

    有时我需要处理键/值数据。我不喜欢使用数组,因为它们在大小上没有限制(很容易不小心添加超过2个项目,而且您最终需要稍后验证大小)。此外,0和1的索引变成了魔数(MagicNumber),并且在传达含义方面做得很差(“当我说0时,我的意思是head...”)。散列也不合适,因为可能会不小心添加额外的条目。我写了下面的类来解决这个问题:classPairattr_accessor:head,:taildefinitialize(h,t)@head,@tail=h,tendend它工作得很好并且解决了问题,但我很想知道:Ruby标准库是否已经带有这样一个类? 最佳

  9. ruby - 用 Ruby 编写一个简单的网络服务器 - 2

    我想在Ruby中创建一个用于开发目的的极其简单的Web服务器(不,不想使用现成的解决方案)。代码如下:#!/usr/bin/rubyrequire'socket'server=TCPServer.new('127.0.0.1',8080)whileconnection=server.acceptheaders=[]length=0whileline=connection.getsheaders想法是从命令行运行这个脚本,提供另一个脚本,它将在其标准输入上获取请求,并在其标准输出上返回完整的响应。到目前为止一切顺利,但事实证明这真的很脆弱,因为它在第二个请求上中断并出现错误:/usr/b

  10. ruby - 一个 YAML 对象可以引用另一个吗? - 2

    我想让一个yaml对象引用另一个,如下所示:intro:"Hello,dearuser."registration:$introThanksforregistering!new_message:$introYouhaveanewmessage!上面的语法只是它如何工作的一个例子(这也是它在thiscpanmodule中的工作方式。)我正在使用标准的ruby​​yaml解析器。这可能吗? 最佳答案 一些yaml对象确实引用了其他对象:irb>require'yaml'#=>trueirb>str="hello"#=>"hello"ir

随机推荐