数据智能,×××!袋鼠云数栈推出 数据科学平台 DTinsight.Science

一句话了解DTinsight.Science

DTinsight.Science是「可视化建模与交互式代码编写于一体的机器学习作业探索平台」,实现数据接入、可视化实验建模、Notebook编程、模型训练、模型部署、任务运维等开发场景,帮助企业构建算法服务能力,提供高效、安全、稳定的算法运行环境。

使用数栈-数据科学平台DTinsight.Science进行一站式数据探索

使用数栈-数据科学平台DTinsight.Science进行一站式数据探索

划重点!

数栈-数据科学平台 DTinsight.Science是什么:
机器学习作业探索平台

数栈-数据科学平台 DTinsight.Science的产品目标是:
提供专业、可靠、高效的算法建模平台,一站式完成算法建模、模型训练、模型部署等机器学习作业,让数据智能×××。

数栈-数据科学平台 DTinsight.Science的客户价值是:
帮助企业构建算法服务能力,让数据智能快速落地,构建数据智能化与业务智能化双向驱动引擎。

数栈-数据科学平台 DTinsight.Science给谁用:
企业的数据科学家和数据分析师们

再深入了解DTinsight.Science

2.1 研发初衷

随着大数据在企业中横向与纵向的深度应用,已经有离线计算、实时计算等大数据产品解决客户常用的计算与运维场景。目前,数据的智能化应用也是更多企业应用、探索的方向,让数据智能驱动业务智能。在这个过程中,怎么让更多的企业快速拥有数据智能化的能力,是数据科学平台思考的方向。

所以今天,数栈推出数据科学平台来构建数据加工后的算法建模能力,为数据科学家数据分析师提供完善易用的开发平台,希望为企业提供更加科学、准确的判断,实现数据的高价值应用。

2.2 产品优势

兼容主流机器学习与深度学习框架

TensorFlow \ MXNet \ Python \ Spark

扫描二维码关注公众号,回复: 6269403 查看本文章

数栈-数据科学平台DTinsight.Science目前支持TensorFlow、MXNet、Python、Spark计算框架,不同的算法任务可选择合适的计算框架,支持多维化开发场景。后续也将支持Pytorch、XGboost等计算框架。
数据智能,×××!袋鼠云数栈推出 数据科学平台 DTinsight.Science

丰富的算法组件库

你需要的组件,我都会有

数栈-数据科学平台DTinsight.Science封装了多类算法组件,包含数据源/目标、SQL脚本工具、数据预处理、特征工程、统计分析、机器学习、深度学习、预测、评估、文本分析、网络分析等算法组件,充分覆盖算法建模场景。

数据智能,×××!袋鼠云数栈推出 数据科学平台 DTinsight.Science

DTinsight.Science具有丰富的算法组件

可视化实验建模

可视化、拖拉拽方式进行算法建模

在大数据深度应用的现在,越来越多的人员对数据与业务的智能结合,算法模型搭建充满兴趣。数栈-数据科学平台DTinsight.Science支持可视化实验建模,可将算法组件拖拉拽至画布区域,组成可视化的实验流,可界面化配置组件参数,并可视化查看数据运行结果以及模型结果,简单易上手。

数据智能,×××!袋鼠云数栈推出 数据科学平台 DTinsight.Science
DTinsight.Science支持可视化实验建模

交互式Notebook数据探索

使用Python自由进行数据探索

除可视化的实验搭建外,数据科学平台同时具备交互式Notebook开发环境,可进行python代码的编写,执行某段语句查看相应结果与运行日志,为数据分析师提供自由的数据探索环境。

数据智能,×××!袋鼠云数栈推出 数据科学平台 DTinsight.Science
交互式Notebook自由进行数据探索

模型离线训练

周期调度,训练模型参数

算法模型开发完成后,可提交任务进行离线调度,调度引擎根据调度周期进行模型训练,产生新的模型参数与数据。模型训练完成后,可查看评估结果,选取合适的模型参数进行保存应用,或在线部署。

模型在线部署

模型在线部署和调用,实时挖掘数据价值

当模型的预测及评估结果达到目标后,可进行模型在线部署,将模型部署至模型服务器上,并生成模型的调用API。部署后,可进行模型的在线调用。
除以上核心功能外,基础的租户隔离、项目创建管理、用户管理、角色管理、数据接入等也是具备的,可一站式完成机器学习作业,欢迎大家体验。

使用DTinsight.Science可以做哪些有意思和有价值的事情?

数栈-数据科学平台 DTinsight.Science可帮助企业构建算法服务能力,服务于企业数据的多样化应用场景,驱动业务创新发展。常用的应用场景如下:

精准营销

基于相关数据进行个性化的商品推荐、视频推荐、旅游商品推荐、广告精准投放等。

关系网络

分析用户关系网络,进行人群关联,精细化任务画像,扩大营销范围及场景。

库存优化

分析销售与库存关系,帮助企业智能化进货、退货,合理使用库存控件,并保证健康的供应链关系。

销售预测

利用整体的销售数据,以及单品历史销售数据,可进行单品未来的销售预测,合理的指导门店销售及铺货。

金融风控

金融领域是算法模型应用比较成熟的领域,应用的场景也很多,比如根据个人信用评估,进行贷款发放的预测,贷款还款的预测,进行风险控制,以及屏蔽羊毛党等营销场景上的使用。

其他

在不同的行业领域,会有更多的分析场景,如文本分析、图片分类、视频分析等。

截止到今天,袋鼠云企业级一站式数据中台PaaS-数栈具有数据计算引擎、数据开发平台、数据科学平台、数据资产平台、数据服务引擎等5大产品模块,平台覆盖全链路的数据采集、数据分析、数据挖掘、任务运维、数据质量、数据地图、数据模型、数据API开放等场景,充分满足企业建设数据中台过程中的多样复杂需求。

目前,西湖风景名胜区、西溪湿地、山西商务厅、老板电器、中金易云、河南世纪联华、浙江大学、常州旅游商贸职业技术学校、宁波图书馆、京东方、福建票付通、观远数据、东方龙马、佰羚数据等客户和合作伙伴都已经在使用或者参与数栈产品共创。

数栈——企业级—站式数据中台PaaS

数据计算引擎

提升企业数据共享能力,加速释放数据价值

离线计算引擎
基于Apache Spark,计算速度比MapReduce快百倍
实时计算引擎
基于Apache Flink,高吞吐、低延迟、高性能

数据开发平台

一站式大数据开发平台,快速完全数据中台搭建

离线计算开发套件
节省80%数据开发时间,全链路数据处理,兼容开源、商用计算引擎
实时计算开发套件
金融级流式数据处理自研组件,10倍采集性能,Flink引擎源码增强
数据同步引擎FlinkX
分布式多节点并发读写,吞吐量高,支持丰富的数据源

数据科学平台

机器学习作业探索平台

可视化实验搭建,集成多种主流计算框架与丰富的算法组件
交互式Notebook开发,提供自由的算法探索环境
模型离线训练,支持周期调度与任务管理
模型在线部署,支持在线调用模型与更新模型版本

数据资产平台

构建企业数据资产中心,实现数据管理规范化

数据地图
可视化数据资产中心,数据全生命周期可知可管
数据质量
覆盖90%质量校验场景,双表逐行校验保障海量数据一致
数据模型
构建OneData数据模型,快速上手清晰易懂的数据规范

数据服务引擎

提升企业数据共享能力,加速释放数据价值

数据可视化
让数据价值看得见,打造新一代“四有”大屏
分析引擎
百亿数据实现秒级查询多维度,频度复杂分析
数据API
“0代码”API生成,多权限控制保障数据开放安全

猜你喜欢

转载自blog.51cto.com/13766600/2399543