【机器学习】分析模型的标准方法

概要

在本文档中,描述了分析模型的标准方法(SMAM)。表1中可以找到SMAM阶段的简短概述。最常用的方法是数据挖掘的跨工业标准流程(CRISP-DM),它有几个缺点,可以转化为与业务的频繁摩擦点从业者开始建立分析模型时。

该文件将首先讨论CRISP-DM的各个阶段,并强调其缺点。随后,将描述SMAM的阶段。提供了一组表格,可用作定义新分析模型创建的指导。

 

介绍

近几十年来,分析模型的创建和使用已成为各行各业的共同利益。分析模型在数学技术的深度以及结果的广泛应用方面都有很大的发展。然而,创建分析模型的方法并未得到很好的描述,分析从业者(目前称为数据科学家;旧名称是统计学家,数据分析师和数据挖掘者)的工作涉及大量隐性这一事实可以看出这一点。知识,实践知识不易简化为明确的规则。这种非正式性可以在分析建模的许多领域中看到,包括项目方法,建模和验证数据的创建,分析模型构建方法到模型报告。

分析过程最着名的项目方法是跨数据挖掘的工业标准流程(CRISP-DM)。该方法描述了六个阶段,显示了分析模型开发的迭代方法。虽然它描述了分析模型创建的一般方法(业务理解,数据理解,数据准备,建模,评估,部署),但它缺乏细微差别,描述了业务环境中的分析模型如何实际作为端到端流程进行流程。当从业者开始构建分析模型时,CRISP-DM的缺点的影响转化为与业务的多个摩擦点。

 

目前方法的缺点

这些摩擦点的例子将得到数据科学家的充分认可。不限于给出的一组示例,各阶段的摩擦点包括:

 

CRISP-DM:业务理解

阶段定义:此初始阶段侧重于从业务角度理解项目目标和要求,然后将此知识转换为数据挖掘问题定义,以及旨在实现目标的初步计划。 

问题:这种观点通常被理解为只有那些需要了解业务问题的数据科学家才能确切知道他们想要什么。实际上,企业通常打算“通过使用数据做出更明智的决策”,但他们缺乏对分析模型是什么,如何使用或应该如何使用以及围绕模型有效性的现实期望的理解。因此,业务本身需要转换才能使用分析模型。

业务理解阶段的另一个问题是项目目标和项目要求通常源自组织的不同部分。目标通常来自比要求更高的管理层次并忽略这一事实,而不是很少导致在模型开发之后,分析模型的最终用户需要对模型进行后合理化的情况,这导致很多不满。

 

CRISP-DM:建模

阶段定义:在此阶段,选择并应用各种建模技术,并将其参数校准为最佳值3。

问题:尽管这个定义为尝试不同的技术提供了空间,但是它非常低估了获得可行结果所需的实际实验量,特别是如果用例不是常见的,众所周知的。真正的实验可能需要更改为整个不同格式的数据,甚至可能需要对业务问题进行不同的解释或调整。

扫描二维码关注公众号,回复: 2676376 查看本文章

 

CRISP-DM:评估

阶段定义:在项目的这个阶段,您从数据分析的角度构建了一个看似具有高质量的模型。在进行模型的最终部署之前,重要的是要更全面地评估模型,并检查为构建模型而执行的步骤,以确保它正确地实现了业务目标[3]。 

问题:确实需要彻底的评估,但CRISP-DM方法并没有规定如何做到这一点。结果,对历史数据进行评估,在最坏的情况下,对训练数据的保​​持分区进行评估,在稍微好一点的情况下,对非时间验证样本进行评估。由于模型通常影响业务的重要部分,因此设计适当的实验是一种很好的做法,从而以有限的方式对新数据进行模型测试。正确的实验还将包括ROI计算,该计算可用于确定模型是否足够好以实施。模型评估通常会导致与业务部门进行讨论,他们总是希望分析模型准确度达到90%及以上,而不考虑具体的准确度,并且不受其影响。

通常,评估阶段的另一个问题是所涉及的各方缺乏分析模型的详细程度。数据挖掘的9条法则之一指出“数据挖掘放大了业务领域的感知”。这一事实似乎促使(持久的)可视化和仪表板报告需要成为模型构建输出的组成部分。这涉及模型的作用(分析报告)以及模型如何影响业务(运营报告)。

 

CRISP-DM:部署

阶段定义:根据需求,部署阶段可以像生成报告一样简单,也可以像实现可重复的数据评分一样复杂。

问题:除了在识别用例时需要对模型的部署进行非常详细的讨论(考虑到评分数据的可用性和时间以及集成成本),单个部署阶段的观点也是如此简单化。部署本身涉及多个阶段,需要使用自己的移交流程进行定义,因为这是数据科学家将结果模型移交给IT或确保模型持续执行的运营团队的时刻。此外,从模型有效性角度和模型演化角度来看,还需要考虑模型的生命周期。

 

分析模型的标准方法

在前面的段落中,讨论了CRISP-DM的缺点,其中提出的问题是对分析模型标准方法(SMAM)所做改进的反向观点。SMAM的各个阶段如下:

 

用例识别

用例识别阶段描述了查看模型可能适用的不同区域的头脑风暴/发现过程。它涉及参与分析建模的业务方面的教育,各种方法的实际期望以及如何在业务中利用模型。关于用例识别的讨论涉及数据可用性,模型集成复杂性,分析模型复杂性和模型对业务的影响等主题。从一个区域中确定的用例列表中,应考虑实施上述标准中排名最高的用例。请注意,企业通常不熟悉这个基于数据/事实的第一个漏斗步骤,因此,他们将不得不放弃他们虔诚的初始 - 以及复杂的分析模型理念。参与此阶段的各方(更高)管理层,以确保正确的目标设定,数据可用性的IT,模型相关性检查所涉及的部门以及数据科学家注入分析知识和创造性分析想法供应。这一阶段的结果是一个选择用例,并且可能是一个路线图,其他考虑了时间表上的举措。

 

模型需求收集

用例需求收集阶段描述了所选用例的过程,在该过程中,探索了需要保持模型在业务流程中可行的条件集。讨论主题的非详尽列表是考虑评分的案例/客户/实体,需要保留的条件,需要保持的一致性检查,意外预测的处理或意外输入数据的条件,有关可用性的要求分数,分数的时间(和数据),分数刷新的频率; 可以探索关于模型报告的初步想法,最后是最终用户想要使用分析模型结果的方法。参与此阶段的各方是来自相关部门,最终用户和数据科学家的人员。

 

数据准备

在数据准备阶段,讨论围绕数据访问,数据定位,数据理解,数据验证和建模数据的创建。需要从可用性(成本)和时间角度了解评分所需的操作数据。在此阶段,IT /数据管理员/ DBA与数据科学家密切合作,以数据科学家消费的格式帮助准备数据。这个过程很敏捷; 数据科学家在较小的集合上尝试各种方法,然后可能要求IT大规模地执行所需的转换。与CRISP-DM一样,前一阶段,此阶段和下一阶段按此顺序发生,但经常来回跳跃。相关各方是IT /数据管理员/ DBA /数据建模人员和数据科学家。这个阶段的结束并没有明确定义。有人可能会争辩说,这一阶段的结果应该是数据科学家确信,利用现有数据,模型是可行的,以及模型在运营环境中的得分。

 

建模实验

在建模实验阶段,核心数据科学家是他/她的元素。这是他们可以使用数据的地方; 破解坚果; 试图提出既酷又优雅又有效的解决方案。结果不是立即的; 通过进化和耐心收集洞察力将其融合在一个不断发展的模型中,可以获得进步。有时,手头的解决方案可能看起来不再可行,需要探索整个不同的角度,似乎从头开始。为这一阶段设定正确的期望非常重要。

数据科学家没有免费的午餐,尽管业务似乎总是这么认为。数据科学这个术语确实很荣幸这里正在做的事情:它是科学研究,它的所有斗争,它的尤里卡,以及它对细致实验的需要。研究的主题:数据,因此拟合术语:数据科学。数据科学家可能需要连接到最终用户以验证初始结果,或者进行讨论以获得可以转化为可测试假设/模型特征的想法。该阶段的结果是一个分析模型,该分析模型以可获得的(历史)数据以及这些事实的报告以最佳方式进行评估。

 

洞察力创造

仪表板和可视化对于业务接受模型至关重要。在分析有抱负的公司中,分析模型通常由非常技术性的模型报告报告,模型以不可重复的形式诞生。在更成熟的分析实践中,建模数据用于洞察力创建是一种可重复的方式。此阶段的讨论主题是分析报告和运营报告。

分析报告是指已经观察到(分析模型的)结果的任何数据报告。然后,可以使用该数据来了解模型的性能以及性能随时间的演变。创建结构分析性能报告也为使用控制组进行结构正确测试铺平了道路。

业务报告是指尚未遵守结果的任何数据报告。此数据可用于了解模型在聚合意义上为未来预测的内容,并用于监控目的。对于这两种类型的报告,通常通过查看模型限定的子组行为来创建洞察。通过为洞察创建结构化报告工具,它可以更深入地了解业务用户可以使用的模式变化,作为分析模型重复评分的“免费”补充。涉及的各方是最终用户,涉及的业务部门,可能是报告部门和数据科学家。

 

价值证明:投资回报率

分析模型通常从一个实验开始,在项目开始时,结果无法保证。结果取决于数据的质量和数据所包含的关于要建模的现象的(不可观察的)知识,以及数据科学家的质量,创建解决方案所花费的时间以及当前的技术发展水平。分析模型。如前所述,企业没有受过教育,无法以技术方式考虑分析模型的质量,也不一定能够实现这一目标。但是,由于模型影响了许多业务目标,业务中涉及的各方需要确保他们可以信任模型(非常具体:他们的奖金取决于他们的业务绩效,因此分析模型的性能可能决定他们的奖金)。从业务角度来看,90%的准确度似乎是分析模型的良好目标,无论对所涉及的准确度的理解如何。然而,影响分析模型质量的标准在上面已经讨论过,并且不能由业务部门指挥。为了摆脱这种来回的讨论,需要建立一个适当的实验:以有限的方式,将分析模型应用于新数据,并以可以使结果成为财务的方式衡量结果。如果投资回报率足够积极,企业将确信他们可以信任该模型; 该模型被证明可以再次推广,并且可以决定是否应该部署模型。讨论的主题围绕实验的设置,控制组,测量模型的有效性,计算ROI和成功标准。涉及的人员是最终用户,可能是财务部门,IT部门,以便为实验和数据科学家提供新数据。该阶段的结果是关于实验设置的报告,测量的标准和结果。

 

操作化

操作阶段不适用于所有模型,但最有价值的模型不是一次性执行,而是企业可以采取行动的嵌入式,可重复的评分生成器。操作化是数据科学家与IT部门密切合作的阶段。模型开发发生在一个相对非结构化的环境中,可以使用数据并使用建模方法进行实验。在业务中嵌入分析模型意味着它从这个松散定义的环境迁移到严格和结构的位置。数据科学家和IT运营商需要进行的讨论围绕模型的移交过程展开。此外,IT运营商需要了解模型的数据要求,并需要为此准备运营环境。将模型移交给运营团队需要提供审计结构。如果需要集成到最终用户系统中,程序员就会参与数据科学家的分析模型工作。此外,对于集成本身,可以定义诸如Agile 之类的IT变更过程。该阶段初始部分的结果是移交文件,所有相关方都同意即将到来的流程。此阶段的最终结果是一个功能分析模型,即模型的可重复分数可用于业务流程,以帮助做出更好的决策。如果需要集成到最终用户系统中,程序员就会参与数据科学家的分析模型工作。此外,对于集成本身,可以定义诸如Agile 之类的IT变更过程。该阶段初始部分的结果是移交文件,所有相关方都同意即将到来的流程。此阶段的最终结果是一个功能分析模型,即模型的可重复分数可用于业务流程,以帮助做出更好的决策。如果需要集成到最终用户系统中,程序员就会参与数据科学家的分析模型工作。此外,对于集成本身,可以定义诸如Agile 之类的IT变更过程。该阶段初始部分的结果是移交文件,所有相关方都同意即将到来的流程。此阶段的最终结果是一个功能分析模型,即模型的可重复分数可用于业务流程,以帮助做出更好的决策。该阶段初始部分的结果是移交文件,所有相关方都同意即将到来的流程。此阶段的最终结果是一个功能分析模型,即模型的可重复分数可用于业务流程,以帮助做出更好的决策。该阶段初始部分的结果是移交文件,所有相关方都同意即将到来的流程。此阶段的最终结果是一个功能分析模型,即模型的可重复分数可用于业务流程,以帮助做出更好的决策。

 

模型生命周期

生产中的分析模型将永远不适合。根据业务变化的速度,模型性能会随着时间的推移而降低。洞察力创建阶段负责监控此性能; 模型生命周期阶段定义了需要发生的事情。通常,可能会发生两种类型的模型更改:刷新和升级。在模型刷新中,使用更新的数据训练模型,使模型在结构上不受影响。模型升级通常由新数据源的可用性和业务部门的请求启动,以通过包含新源来提高模型性能。涉及的各方是最终用户,处理模型执行的运营团队,新数据的IT/数据管理员/DBA以及数据科学家。这个阶段的结果是,在该阶段的构建过程中,描述了关于模型更新/升级的变更过程的治理和协议的文档。在执行时,结果是一个模型,它在持续的持续时间内更有效。

 

原文:https://www.linkedin.com/pulse/standard-methodology-analytical-models-olav-laudy/?trk=prof-post

作者:Dr. Olav Laudy

猜你喜欢

转载自blog.csdn.net/ChenVast/article/details/81531106
今日推荐