python数据分析:商品数据化运营(上)——知识点

版权声明:本文为博主原创文章,如若转载请注明出处 https://blog.csdn.net/tonydz0523/article/details/85063629

商品数据运营指标

销售类指标

  1. 订单量/商品销售量

    • 订单量指用户提交订单的数量,计算逻辑去重后的订单ID的数量。
    • 商品销售量又称销售件数,指销售商品的数量。
  2. 订单金额/商品销售金额

    • 订单金额为用户提交订单时的金额,又称为应付金额。订单金额是用户真正应该支付的金额。计算公式为:订单金额 = 商品销售金额 + 运费 - 优惠凭证金额 – 其他折扣(如满减)
    • 商品销售额是指商品销售的金额,商品销售额与订单金额的区别在于没有计算任何其他费用或优惠金额。计算公式为:商品销售额 = 商品销售单价 × 销售数量

订单金额和商品销售金额都会作为商品总销售收入的评估指标,前者主要侧重于用户实际付款,后者侧重于总收入。

  1. 每订单金额/客单价/件单价

    • 每订单金额指平均每个订单的金额,它是以订单为单位计算。公式:每订单金额 = 订单金额 / 订单量。

    • 客单价指平均每个用户的下单金额,是以用户为计算单位。公式:每订单金额 = 订单金额 / 订单用户量。

    • 件单价又称每件商品价值,指平均每个商品的销售价格。公式:件单价 = 订单金额 / 商品销售量。

这三个指标用来评估单位对象的价值产出,分别侧重于订单个体、用户个体和商品个体。

  1. 订单转化率

订单转化率是电子商务网站最重要的评估指标之一,大多数网站分析工具的计算公式为:订单转化率 = 订单量 / 总访问量 或 订单转化率 = 订单量 / 总UV量,这种计算方式实际上不科学,原因是它衡量的不是人的转化比例。假如一个用户下多个订单或网站存在订单拆分的情况,会使订单量大大高于实际订单人数,导致订单转化率虚高。正确的计算方法为:订单转化率 = 产生订单的访问量 / 总访问量 或 产生订单的UV / 总UV量。

ps:这里没有使用用户ID作为分子和分母,原因是大多数用户在到达网站时不会主动登录,只有在有订单或必须用户登录的条件下才能获取用户ID信息,无法统计到的用户ID便不会加入到分母后,导致数据缺失。

  1. 支付转化率

支付转化率是衡量用户支付转化的数据指标,是用户完成购物的重要步骤,更是企业产生真实销售价值的关键。计算公式为:支付转化率 = 完成支付的客户数 / 需要支付的客户数

支付转化率是针对选择先款后货客户的转化评估指标,因此它只能评估订单用户中的一部分。对于选择货到付款的用户无需该指标评估,用户会在配送验证的时候支付。另外,由于每个订单都对应真实的客户,因此这里客户数计算支付转化率。

  1. 有效订单量/有效订单金额/有效商品销售量/有效商品销售额

有效订单:用户提交订单后,一部分订单销售公司审核未通过导致无效,或是用户下单后取消导致无效,剩下的能够正常进入销售流程的订单为有效订单。

  • 有效订单量:有效订单的总量
  • 有效订单金额:有效订单的金额
  • 有效商品销售向:有效订单中商品的销售量
  • 有效商品销售额:有效订单那种商品的销售额

根据上述指标还可以延伸后有效件单价、有效订单状态率、有效客单价等。

  1. 订单有效率/废单率
  • 订单有效率是用来衡量订单有效比例的重要指标,计算公式为:订单有效率 = 有效订单量 / 订单量

  • 与订单有效率相对的指标是“废单率”,废单率是所有订单中作废的订单比例,计算公式为:废单率 = 1 – 订单有效率

ps: 订单有效率从订单发生时随着时间推移开始下降,直到所有订单完成妥投才处于稳定状态。大多数电子商务企业的订单有效率在60%以上,如果低于该数据值可能说明订单中包含大量作弊或无效订单。

  1. 毛利/毛利率

    • 毛利是衡量自营商品利润最重要的指标之一,公式:毛利 = 商品妥投销售额 – 商品批次进货成本

    • 毛利率是考察自营商品盈利情况另外一个最重要的指标,毛利和毛利率综合反映了商品的盈利规模和盈利能力。毛利率计算公式为:毛利率 = 毛利 / 商品妥投销售额

ps: 这里的毛利仅指销售毛利,即通过商品进销差价计算的毛利,没有考虑商品促销费用、配送费用、活动推广费用及其他摊销费用;另外,公式中使用“商品批次进货成本”计算毛利,原因是相同的商品在不同批次下进货成本可能不同,因此需要使用相应批次的进货成本。

促销活动指标

  1. 每订单成本/每有效订单成本

每订单成本指完成每个订单需要的成本。公式:每订单成本 = 费用 / 订单量。

对于公式中的费用,不同部门有不同的费用支出情况。比如针对广告部门的费用通常只包含广告费用,每订单成本 = 广告费用 / 订单量;对于运营类部门的费用可能只包含促销类费用,如优惠券费用。广告部门中存在一种按订单付费的合作方式CPS,这种方式基于成交订单而支付给推广媒介一定比例的佣金或返点。这也属于订单成本的一种。

每订单成本核算的是每个“毛”订单成本,订单中包含了所有状态(包含无效状态),只适合评估部门级别业务效果或做企业的初级评估指标。

每有效订单成本与每订单成本计算逻辑相似,不同点在于该指标只计算所有订单中有效订单的部分。计算公式为:每有效订单成本 = 费用 / 有效订单量。该指标中仅包含有效订单状态的订单成本,是针对企业级别的真实评估指标。

由于有效订单也不一定最终妥投,其中有些是进行中的状态,因此最终产生价值的订单属于妥投订单,通过妥投订单计算得到的成本才是最终订单成本。

  1. 每优惠券收益/每积分兑换收益

    • 每优惠券收益指每张优惠券能带来的收益。公式:每优惠券收益 = 优惠券带来的订单成交金额 / 优惠券数量。由于企业往往发送不同的优惠券类型以及面值,通常需要在此基础上分别计算每种类型和币值优惠券带来的收益水平。

    • 积分与优惠券类似,都是用来衡量优惠促销对销售的拉动情况。公式:积分兑换收益 = 使用积分兑换的订单成交金额 / 积分兑换量。

ps:在实际业务中,由于用户往往可以在同一个订单中同时使用积分和优惠券,因此可能会出现订单贡献重复计算的情况。

  1. 活动直接收入/活动间接收入

    • 活动直接收入指单纯通过促销活动带来的收入,用户购买的订单均属于促销活动商品。

    • 活动间接收入指通过促销活动带来的用户购买了非活动商品的收入情况。通常计算活动间接收入的逻辑是该用户通过促销活动引入且订单属于非活动商品,通过促销活动引入可通过定义用户落地页是活动页面加以区分,订单属于非活动商品可通过参与活动商品列表进行拆分。

  2. 活动收入贡献

活动收入贡献包含活动直接收入贡献和间接收入贡献的总和,用活动收入贡献总金额除以全站订单成交金额得出活动收入贡献占比,公式:活动收入贡献占比 = (活动直接收入 + 活动间接收入)/ 全站订单成交金额

当然,除了可以用订单成交金额计算外,还可以使用订单量、商品销售量等计算活动贡献情况,其逻辑相同。

  1. 活动拉升比例

活动拉升比例指活动对全站销售的拉升情况,可以指销量拉升、销售额拉升、订单量拉升等。

活动拉升比例通常不能使用活动贡献占比来评估,原因是活动促销期间本来应该通过正常流程和渠道购物的用户反而会通过促销渠道下单。最简单的计算方法是用活动期间的收入与非活动期间的收入进行对比,计算公式为:活动拉升比例 = (活动期间收入 / 非活动期间收入)- 1

注意 在通常情况下,在计算收入拉升比例会发现收入拉升效果不如订单量和销量明显,原因是通常促销客单价较低,影响收入提升效果。

商品数据化运营分析模型

商品价格敏感度模型

商品价格敏感度模型是指通过研究找到用户对于价格是否敏感以及敏感程度的价格杠杆。利用价格敏感度模型可以辅助于销售定价,促销活动的折扣方式、参考价格、价格变动幅度等方面的参考:

  • 促销活动时促销哪些商品较好
  • 商品价格提升,对销售的影响,设置合理价格
  • 在商品详情页的参考价格应该定为多少才能让客户感觉到已经降价并触发下单动作
  • 满减、满返、跨品类用券等哪些方式最适合哪些产品

调查问卷法:

通过调研问卷的形式针对关注的品类或商品做调研分析是比较通用的一种方法。这种方法可以获得品类详细信息,并且可以通过问卷设置不同的关注信息点,收集到的信息更符合实际需求。
但是,当面临新的价格敏感度分析需求时,通常都需要重新开展调研分析工作。这种方式实施起来周期较长且反馈结果较慢,另外,当要收集的商品信息较多时,可能很难获得完整数据。

数据建模法:

通过数据建模的方式建立商品价格和销售量之间的关系模型是研究价格敏感度的有效方法。这种方法实施起来相对简单:

首先,收集不同价格下的销售数据。价格敏感度模型需要有基于不同价格下的销售数据产生,因此需要商品运营部门针对性的做调价。这种调价动作根据需求的不同,可能是长期的,也可能是短期的。长期的调价是一种“自然状态”,因为在一个较长周期内商品会经历生命周期的不同阶段,并结合商品促销、打折等运营工作产生多种价格和销售数据;而短期的调价更多的是为了采集数据而产生。

其次,数据建模分析。商品价格敏感度模型关注的主要是价格和销量之间的关系,可以用回归方法来解决。在回归方法中,自变量中除了价格外,还需要包含其他两类信息:

  • 商品信息:商品品类、上市时间、同期竞争对手价格、是否参与促销活动、促销方式、折扣力度、通用属性等。
  • 客户信息:客户性别、年龄、收入、学历、会员级别、历史订单量、品类偏好度、活跃度、价值度等。

之所以要将大量的商品信息和客户信息加入到回归模型中,是因为如果只针对价格和商品销售量做回归,那么价格本身能解释的商品销售量变化可能会非常有限,销量的变化还可能受到其他很多因素的影响,因此要在控制这些干扰因素的前提下做回归模型。

新产品市场定位模型

新产品市场定位分析用于当企业新生产或策划一款产品时,需要根据市场上现有的竞争对手产品情况做定位分析。该分析的目的是评估新产品与哪些产品能形成竞品关系,可以针对性的找到与竞品的差异性和优势,例如功能特点、使用周期、产品质量等,从而应用到产品定价、市场宣传、渠道推广等方面。
新产品市场定位分析可以通过基于相似度的方法实现。例如,使用非监督式的KNN(K近邻),模型的核心是通过对新产品的数据与现有数据的比较,发现跟新产品相似的其他产品。

销售预测模型

销售预测模型根据历史的销售数据来预测未来可能产生的销售情况。该模型常用于促销活动前的费用申请、目标制定、活动策略等的辅助支持。

销售预测模型通常要得到的结果为未来会产生多少销售量、收入、订单量等具体数值,可通过时间序列、回归和分类三种方法实现。

  • 基于时间序列做销售预测。使用时间序列做销售预测的方法常用于没有太多可用的自变量的场景下,只能基于历史的销售数据做预测性分析。
  • 基于回归做销售预测。基于可控的特征变量建立回归模型来预测未来的销售情况是更常用的方法。
  • 基于分类做销售预测。分类方法是针对每个销售客户产生的是否购买的预测分类,然后再基于能产生购买的预测分类做客单价、订单量和收入的分析。这是一种对于具体数值的变通实现思路。

商品关联销售模型

商品关联销售主要用来解决哪些商品可以一起售卖或不能一起打包组合的问题。关联销售是商品销售的常态,也是促进单次销售收入和拉升复购效果的有效手段。
商品关联销售模型的实现方式是关联类算法,包括Apriori、FP-Growth、PrefixSpan、SPADE、AprioriAll、AprioriSome等,主要实现的是基于一次订单内的交叉销售以及基于时间序列的关联销售

异常订单检测

异常订单检测用来识别在订单(尤其是促销活动中的订单)中的异常状态,目标找到非普通用户的订单记录,例如黄牛订单、恶意订单、商家刷单等。

黄牛订单会大量削减促销对普通用户的吸引程度,使得促销权益和利益被一小部分人获取,而非给到目标会员。

恶意订单则更加危险,很多竞争对手间会通常这种方式在促销活动中,将大量的商品库存通过订单的方式锁定,然后再活动结束后通过取消、退货等方式释放库存。这种方式将使促销活动由于无法真正卖出商品而无法实现促销的目的,同时还会消耗公司大量的人力、物力,是各个公司都非常反感的恶意竞争方式。

商家刷单是一种常见的用于提升商家排名的方式,通常由商家来安排内部或关联人员大量购买商品,以形成商家流量和销售提升的目的。

异常订单检测主要基于两类方法实现:

  • 一类是基于监督式的分类算法。将历史已经识别出来的真实异常订单数据通过分类模型(例如SVM、随机森林等)做训练,然后应用新数据做分类预测,看预测结果是否属于异常订单。
  • 一类是基于非监督式的算法。通过非监督式算法(例如OneClassSVM)基于历史的数据做训练,然后针对新的数据做判别,找到存在异常可能性标签的订单列表。

商品规划的最组合

在做商品促销或广告宣传时,通常企业会面临多种组合策略,它是在一定限制条件下考虑通过何种组合策略来实现最大或最小目标。此时,可以考虑使用线性规划方法。

线性规划(Linear programming,LP)是运筹学中研究比较早、方式相对成熟且实用性非常强的研究领域,主要用来辅助人们进行科学管理,目标是合理地利用有限的人力、物力、财力等资源作出的最优决策。解决简单线性规划问题的最直接的方法是图解法,即借助直线与平面区域的交点求解直线在y轴上的截距的最大值或最小值。

在做线性规划时涉及到几个概念:

  • 未知数:影响决策主要变量或因素。
  • 约束条件:解决线性规划问题时已知的并须遵守的前提条件。
  • 目标函数:用来表示未知数与目标变量关系的函数,线性规划中一般是线性函数。
  • 可行域:满足优化问题约束条件的解叫做可行解,由所有可行解组成的集合叫做可行域。
  • 最优解:满足目标函数最大化或最小化目标的最优的解。

如果线性规划中有多个变量,那么我们无法通过图形的方式直接发现最优值的位置,此时可以借助Python的线性规划库来完成线性求解工作,包括scipy.optimize.linprog、pulp等。

使用层次分析法将定量与定性结合分析

层次分析法(Analytic Hierarchy Process,AHP)是将与决策总目标相关的细分元素进行分解,在此基础上做层次权重的方法,这是一种将定性分析和定量分析相结合的方法。

这种方法可以广泛用于多种将定性与定量分析结合的商品运营决策场景中,例如:

  • 商品资源位的决策中,到底哪些商品应该放到最好的位置上?
  • 商品流量导航的入口,哪些品类应该放在最明显的位置?
  • 公司在天猫上争取到了几个资源位,应该投放哪些商品?
  • 商品贡献价值衡量,除了销量、利润等数字可衡量的因素以外,增加商品标杆、商品品牌价值的提升、企业战略合作商品、投资者关注品类等因素,如何选出贡献最大的商品?

层次分析法是不仅能用于不确定性和主观信息的整合,还可以将以往经验和洞察应用到权重评估过程中,这种基于层次划分的方法,可以使评估人员能有效衡量不同指标间的相对重要性。

使用BCG矩阵做商品结构分析

BCG矩阵又称为波士顿矩阵,它是波士顿咨询集团提出的一种分析方法。该方法常用来分析如何将企业有限的资源有效地分配到合理的产品结构中去,以保证企业利益的最大化,因此这是一种宏观分析方法。

BCG矩阵认为决定商品结构的基本因素有两个:市场引力和企业实力。

  • 市场引力指的是企业销售量、增长率、目标市场容量、竞争对手强弱等市场因素,其中最能反映市场引力的指标是销售增长率,这是决定商品结构的外部因素。
  • 企业实力包括市场占有率,资金、技术等方面的能力,其中市场占有率是决定企业商品结构的内在因素。

基于销售增长率和市场占有率这两个维度,BCG矩阵将商品组合分为4种类型:

  • 明星型商品(Stars):指高增长率,高市场份额的商品,这类商品可能成为企业的现金牛商品。
  • 问题型商品(Question Marks ):指高增长率,低市场份额的商品。这类商品虽然市场增长较快,但是一般利润率较低,所需资金支持和资源投入较大。
  • 现金牛型商品(Cash Cows):指低增长率,高市场份额商品,这类商品能帮助企业回收资金并加速资金流转,可以支持其他商品和业务的发展,是公司发展的基石和后盾。
  • 瘦狗型商品(Dogs):指低增长率,低市场份额的商品。这类商品对企业来讲一般处于亏损或利润贡献比较差的阶段,通常很难为企业带来收益。

如何对矩阵信息做分析?

  • 针对明星型商品品类,应当积极扩大经济规模和市场机会,以长远利益为目标,提高市场占有率,加强竞争地位,例如采用事业部形式直接管理。
  • 针对问题型商品品类,应当重点考虑市场占有的问题,包括市场营销、客户维系、新产品引入等方式来扩大市场面。
  • 针对现金牛型品类,需要重点维持现状,因此单独的事业部以及营销体系是重要措施。
  • 针对瘦狗型品类,需要考虑市场撤出、资源整合到其他商品业务或做结构化改革,以降低其对企业的负面效应。

BCG矩阵的优势是能够将不同的商品或业务放到一个平面做对比,并且基于公司的整体触发可以考虑资源间的最优配置和调整方向。在通过矩阵做输出表示时,其具有非常好的可理解性和应用性,是企业战略研究的重要方法支撑。

4P模型建立商品分析结构

4P是营销学的一种组合概念,包括产品(product)、价格(price)、渠道(place)、促销(promotion)。

  • 产品:包括有关商品的客观实体要素,例如质量、外观、样式、品牌、类别、属性、规格等。
  • 价格:有关商品的价值要素,例如基本价格、促销价格、付款价格、毛利、利润率等。
  • 渠道:有关商品的分销要素,包括分销渠道、供应商、物流、库存、经销商等。
  • 促销:有关商品的促销类要素,包括广告、营销、促销活动、宣传、推广等。

当然,经典4P理论都是围绕商品环节的,在实际销售过程中除了商品本身的要素外,还有更多跟商品运营相关的其他要素,包括:

+ 人员:人员是做商品运营(也包括所有运营)的基石,任何运营活动的结果都跟人挂钩,因此可以从人员的角度分析对运营效果的影响。

  • 资源:资源的支持力度是导致商品运营结果差异的重要因素,不同的促销经费、资源位、站外广告位、活动时间、内部推介等资源支持下,运营效果差异很大。
  • 流程和机制:商品运营过程中的流程也是影响运营结果的主要因素,很多情况下甚至会成为关键因素,包括固定性流程(例如每月一次的**活动)、突发或异常应对机制(例如异常订单的隔离)、临时性流程(临时提报活动的影响)等。

ps:跟4P概念相对应的还有4C,消费者(Consumer)、成本(Cost)、便利(Convenience)、沟通(Communication)。4C跟4P的最大不同是,4P是以商品为出发点考虑营销基本面,而4C则是以消费者为导向的组合方法。随着概念的发展,后来又延伸出4S、4R、4V、4I等不同营销理论。

使用假设检验做促销拉动分析

假设检验(Hypothesis Testing)是数理统计中常用的方法,它实现的是根据一定假设条件由样本推断总体。假设检验的基本实现思路是:根据研究课题的需要对研究总体作某种假设,记作H0;选取合适的统计样本,其选取结果要使得在假设H0成立时,其分布情况已知;然后由实测的样本,计算出统计量的值,并根据预先给定的显著性水平进行检验,作出拒绝或接受假设H0的判断。常用的假设检验方法有卡方检验、T检验法、F检验法、U检验法、Z检验法、方差分析法等。

  • 卡方检验属于非参数假设检验,适用于布尔型或二项分布数据,基于两个概率间的比较,早期用于生产企业的产品合格率等,在网站分析中可以用于目标转化率等有比率度量的比较分析。
  • T检验属于参数假设检验,所以它适用的范围是数值型的数据。T检验的需要总体样本符合正态分布特征,主要用于样本含量较小(例如n<30),总体标准差σ未知的数据。T检验广泛应用于医学统计等领域。
  • F检验又叫方差齐性检验。在判断两种样本检验方差是否相等时,需要使用F检验做验证。因此,它是一种基础的检验方法。至于两组数据之间是否存在系统误差,则在进行F检验并确定它们的精密度没有显著性差异之后,再进行T检验。
  • U检验是在大样本(n>30)的情况下,检验随机变量的数学期望是否等于某一已知值的一种假设检验方法。U检验适用于样本量n较大且符合正态分布的情况。
  • Z检验一般用于大样本(即样本容量大于30)平均值差异性检验的方法,比较两个平均数的差异是否显著。
  • 方差分析法常用来分析多个(2个以上)群体中的计量型数据,以便比较变异的意义和分析其来源。方差分析要求观察样本的分布符合正态分布或近似正态分布,并且各组数据之间的方差具有齐性。

在做假设检验时,经常用到的Python库是scipy中的stats,里面包含了各种参数和非参数检验方法以及用于评估数据分布模型的检验方法。

商品数据运营中的一些注意事项

  1. 企业低于进价价格销售商品原因:扩大市场占有、树立商品形象、共有力的地铺排行、新产品推广、去库存、薄利多销、综合营销策略(爆品吸引顾客光临)
  2. 企业促销的真是情况:与其他公司竞争、用户已经养成促销购买习惯、增加用户的活跃度增加沟通机会、企业市场声量、促销为单一销售模式、彰显企业实力提高谈判地位
  3. 用户关注的商品不一定是想要购买的,很有可能是价格高于自身想买的同类商品
  4. 提供的选择过多并不利于销售,用户会花费时间精力对商品信息进行研究,有些用户不愿意花时间研究转而去买其他商品

参考:
《python数据分析与数据化运营》 宋天龙

猜你喜欢

转载自blog.csdn.net/tonydz0523/article/details/85063629
今日推荐