Three layers of data analysis requirements

Text | Wang Jiadong fr

This article comes from: Knowing the column " Look at the data " - about data analysis

Why some reports are easy to use, some are not easy to use, and some companies make a bunch of messy reports, these questions are often thought about recently.

Some people say that data analysis, in order to increase revenue and reduce expenditure, is not wrong. Today, I will interpret it from another angle. Data analysis is to deal with risks (explain: risks and opportunities are together. PMI lists them as risk management, and all risks and opportunities in this article are synonymous). Every operation and every node of open source and throttling is also a risk.

In business operation, the wind and the rain will inevitably encounter large and small opportunities and risks. Seizing the opportunity to avoid risks is the lifelong pursuit of every enterprise and individual.

Risks are grouped into the following categories in the PMI:

  • known known risks
  • unknown known risk
  • Unknown unknown risk.

This article summarizes data analysis into three levels of requirements

Tier 1 Requirements: Addressing Known and Known Risks

This layer of demand can be regarded as passively used data, taking the retail industry as an example:

Buyers have to make purchases without data as a reference, so they can only make blind purchases, and the risk of shortage of goods and overstocking of goods in stores will definitely arise. Therefore, buyers need to check the sales, inventory, and available days of various commodities through data to make judgments, so as to determine the procurement needs, and avoid the risks of shortage of goods and high inventory caused by wrong commodity procurement. This is data to address known known risks.

For enterprises, there are many such applications, so many that some enterprises will ignore this application of data analysis. Business systems commonly used in enterprises, such as erp and other software systems, also come with some simple data viewing reports, which are also used to deal with this type of risk to a large extent.

However, from another perspective, there is also a lot of room for optimization in the response to such risks:

  1. Efficiency of risk response: Improving the efficiency of risk response is a manifestation of improving the standardization of applications. When an application is difficult to use, it is easy to cause people to be lazy and give up use, thereby increasing the probability of risk occurrence.
  2. 复杂的已知的已知风险的应对:绝大部分企业并没有将数据覆盖所有的已知风险,举例:新品的引进,新品的引进为商店带来新的盈利点,但是错误的引进甚至会带来负面效应。大部分企业的新品引进并没有一个很好的方案来应对:通过数据进行品类关联并对比,可以看出本店铺对于市场上销量靠前的商品的缺货情况,本店已有商品的市场占有情况,从而可以优化新品引进的策略。这一类的应用还有很大的空间,这也就是为什么很多企业乐于同行之间的交流,希望彼此可以互通有无,发现类似数据场景的应用。

第二层需求:应对未知的已知风险

这一类数据一般为主动使用的数据,更多的是周期性使用的数据,常见的比如领导们常看的日报表、周报表等。

企业的风险发生的概率是分布在每一天的,但是它每一天都可能发生也可能不发生,例如部分员工的消极怠工、部分商品的质量异常、个别门店突然面临的对手竞争等。这一类风险当然是希望在发生的最短时间内就可以发现并且应对。所以企业中产生了大量的这一类型的报表需求。

这类报表也很常见,但是他们价值的体现不如第一层需求类来的直接,这一类报表经常被浏览,但大部分情况是没有发现风险的,所以有时会产生一种这类报表没什么用的感觉。

在我们所遇到的项目中,这类需求报表占比是很多的,也是争议最大的。领导层所需要看的日/周/月报类报表相对还好,毕竟是每天都会有人看,并且作为企业数据监督和追踪的一种形式。

此外,还会有很多分析类的报表也属于这一层级,比如商品的价格带分析:找到某类商品的价格点,对比销售高点或销量高点,从而发现可能的商品价格分布的不合理或者货架摆放位置的不合理(价格点商品附近陈列丰富的商品可以给顾客带来商品丰富的感觉)。进一步调整商品价格分布以应对商品陈列或者价格分布的风险(机会)。

这类报表的应用难度比较大,因为经验或者知识储备的不同,对风险的认知和识别能力不同。同样以上面的价格带分析报表为例,其目的为应对陈列、商品价格分布、商品引进/采购、目标活动人群选择的风险。但是使用报表的业务人员没有形成对这些风险(机会)的认知,就造成了缺乏对该报表的数据解读能力,该报表便成为了一个花瓶报表,价值无法得到体现。

针对这一类报表,我的建议是场景化,让每一张报表背后都有它的风险机会描述,当自我不能解读的报表,也就不要指望业务可以解读并使用,并不是将一堆的指标都进行展示就能产生价值,它于落地的应用还相隔甚远。

第三层需求:应对未知的未知风险

这类需求近些年来大量出现,大数据概念被大多数人所重视也很大程度上是因为这一类需求。

风险的不可预测性使得大量人群希望通过技术的手段来帮助识别和发现风险。比如很多人希望通过聚类这类算法的应用,来形成用户画像,发现自己之前无法发现的特性,或者通过对商品关联的挖掘,发现未知的商品关联关系,从而调整商品布局以发现巨大的商机,比如“啤酒与尿布”(不知真伪)。

但是这类需求实现难度巨大,目前还属于少数互联网公司的专利,对于大多数企业尤其是传统企业而言,其实现成本是难以接受的,个别数据乙方可能会以此为诱饵进行宣讲,但就我所了解到的还难以形成很好的应用。

但是第三层需要要怎样处理?无论是机器还是算法很多都是对人对模拟,只是拥有更快的速度而已,所以相信通过人的作用可以弥补这一类需求。

同样以商品模块举例:除了我已知的商品价格、布局风险外,通过对商品价格分布那张报表的分析,发现在非价格点的价位(比如是10元)销量比正常值都高,正常情况10元价格商品的销量是价格点商品销量的1/5,但是报表显示这一期间的比例高达了1/3,通过进一步分析,发现是由于某一天活动对该商品进行打折促销,从而该商品销量上升,再进一步分析该商品的销量上升并没有给企业带来业绩的上升,该商品的周边商品销量基本没有变化,也就是该商品的连带率是很低的,同时该商品库存并非临保商品。通过调查发现是店长和供应商的私下协议而采取的促销行为。

以上只是举例,通过人的思考可以发现很多的未知的未知风险。这也就是近些年来bi产品的出现的原因,bi产品希望能够给业务人员一个灵活的数据应用环境,让他们的思考得到延伸和数据上的支持,从而应对未知的未知风险。

当然,理想情况如此,很多企业并没有将bi产品应用成为以上的价值。原因很多,主要的是包括业务人员没有分析意识、没有一个很好的分析入口(不做进一步解读)。

综上:

我将对数据分析的需求分为三层,每一层的使用难度也都有不同,越向后越容易产生“这个报表没什么用”的感觉。现实中,也有很大程度上确实是这个报表没法用,因为很多it人员也并没有理解我做好的报表是为了解决什么样的问题,只知道这个指标有用,我就展示给你看。所以这样的报表可能真的很难用。

我觉得,让数据发挥它的价值,可以尝试将数据与风险相关联,对风险进行数据化的解读,从而来让报表更加落地,更加可用。

ps:一切的文章都是我当时的想法,不能作为知识来解读,大家尽做参考,欢迎交流。

Guess you like

Origin http://43.154.161.224:23101/article/api/json?id=326353640&siteId=291194637
Recommended