如何开始一个数据科学项目？ - 代码天地

如何开始一个数据科学项目？

编程语言 2021-04-02 09:51:53 阅读次数: 0

最近，一家名为 BigPanda 的初创公司邀请我对数据科学项目的结构和流程发表自己的看法，这让我思考是什么让它们独一无二。初创公司的经理和不同团队可能会发现，数据科学项目和软件开发之间存在差异，这种差异并不那么直观，而且令人困惑。如果没有明确的说明和解释，这些根本差异可能会引起数据科学家和同事之间的误解和冲突。

分别来说，来自学术界（或高度研究型的行业研究小组）的研究人员在进入初创公司或小型公司时，可能会面临各自的挑战。他们可能会发现，将新类型的输入（如产品和业务需求、更紧密的基础设施和计算限制以及客户反馈）纳入他们的研究和开发过程中具有挑战性。

因此，本文写作目的就是介绍我和同事在近年来的工作中所发现的具有特色的项目流程。希望本文能够帮助数据科学家与他们一起工作的人，以反映他们独特性的方式来构建数据科学项目。

这个流程是基于小型初创公司的想法建立起来的：一个由数据科学家（通常是一到四个人）组成的小团队，一次只负责一个人领导的中小型项目。规模更大的团队或那些以机器学习为先的高科技初创公司的团队，可能会仍然认为这是一个有用的结构，但在许多情况下，流程会更长，结构也会有所不同。

图 1：初创公司的数据科学项目流程

我将流程分为三个并行运行的方面：产品、数据科学和数据工程。在许多情况下（包括我工作过的大多数地方），可能并没有数据工程师来执行这些职责。在这种情况下，数据科学家通常负责与开发人员合作，帮助他解决这些方面的问题（如果他是全能大神：全栈数据科学家，那么他自己就可以凭一己之力解决所有的问题✨

猜你喜欢

转载自blog.51cto.com/15060462/2680043

如何开始一个数据科学项目？

如何创建一个数据科学项目？

如果是个穷光蛋：如何从零开始学习成为一个数据科学家？

【数据科学项目1】：构建你的第一个数据科学项目

如何从0开始了解一个数据引擎

如何设计一个数据库才是高性能合理科学的（一）

如何设计一个数据库才是高性能合理科学的（四）

如何设计一个数据库才是高性能合理科学的（三）

如何设计一个数据库才是高性能合理科学的（二）

如何开始一个react项目

如何开始一个项目

手把手教你完成一个数据科学小项目（1）：数据爬取

手把手教你完成一个数据科学小项目（3）：数据异常与清洗

一个数据仓库时代开始--Hive

如何成功实施交付一个数据治理项目

如何成功实施一个数据治理项目？实施步骤有哪些？

如何快速开始一个新项目

如何从零开始搭建一个SSM项目？

如何开始一个机器学习项目

如何快速开始一个vue的项目

如何开始第一个开源项目？

如何从零开始一个uniapp项目

为什么说，随波逐流是成为一个数据科学英雄最大的阻碍

我，一个数据科学家的三大弱点

一个数据科学家需要哪些核心工具包?

手把手教你完成一个数据科学小项目（4）：评论数变化情况

手把手教你完成一个数据科学小项目（7）：经纬度获取与BDP可视化

手把手教你完成一个数据科学小项目（5）：省份提取与可视化

手把手教你完成一个数据科学小项目（9）：情感分析与词云

如何架构一个数据工程

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)