机器学习从业者工作内容 - 代码天地

机器学习从业者工作内容

其他 2019-04-20 17:50:55 阅读次数: 0

1、理解上下文：

可以从机器学习中获益的业务领域
与其他利益相关者沟通什么是机器学习，机器学习不具备的能力是什么 (通常有很多误解)
了解业务战略、风险和目标，以确保每个人都达成共识
确定组织拥有的数据类型
适当地构建和审视任务
了解操作约束 (例如，在推理时选出实际可用的数据)
主动识别道德风险，包括性骚扰、猥亵、独裁政府滥用你的工作，或进行宣传 / 虚假宣传活动 (并计划如何减少这些风险)
识别潜在的偏见和潜在的负反馈循环

2、数据：

制定计划收集更多不同的数据（如果需要及可能的话）
将来自许多不同来源的数据拼接在一起：这些数据通常以不同的格式或不一致的惯例收集
处理丢失或损坏的数据
可视化数据
创建合适的训练集、验证集和测试集

3、建模：

选择使用哪个模型
将模型资源需求为约束条件（如，完成的模型是否需要在边缘设备上运行，是否在低内存或高延迟环境中运行等）
选择超参数（如，在深度学习的情况下，这包括选择架构、损失函数和优化器）
训练模型（并调试它为什么训练没有成功）。这可能包括：
调整超参数（如学习率）
输出中间结果，查看损失、训练误差及验证误差是如何随时间变化的
检查模型上错误的数据来查找模式
识别数据潜在的错误或数据
明确需要改变清洗和预处理数据的方式
明确需要更多或不同的数据扩充
明确需要更多或不同的数据
尝试不同的模型
确定数据是否欠拟合或过拟合

4、产品化：

创建一个 API 或 Web 应用，将你的模型作为端点以实现产品化
将模型导出为所需的格式
计划你的模型需多久一次使用更新的数据进行再训练（如，你可能会每晚或每周进行再训练）

5、监控：

跟踪模型的性能表现
监控输入数据，以确定它是否随时间变化，从而使模型无效
将结果转达给组织的其他成员
指定计划，监督和应对错误和意外后果

强调机器学习（特别是深度学习）中，最耗时的是

处理数据格式化、不一致和错误，通常是一个混乱、乏味的过程。
众所周知，训练深度学习模型是一个脆弱的过程。

猜你喜欢

转载自blog.csdn.net/duanshao/article/details/82390366

机器学习从业者工作内容

作为一名IT从业者，你在工作和学习中，遇到哪些问题

给机器学习从业者的 12 条建议

unity3d从业者要学会哪些内容才可以？

IT从业者们，你的工作压力大吗？

安全从业者

浪潮信息联合音乐院校创新音乐分离模型帮助从业者提高工作效率

机器学习从业者必知的5种回归损失函数

【新闻资讯】写给机器学习从业者的12条宝贵建议

机器学习从业者人手必备的8本书

技术从业者的未来

知识产权从业者学习Python

知识产权从业者学习Photoshop

软件测试从业者必备的 Linux 命令-学习链接

疫情后程序员还能达到年薪18万吗？工作3年的从业者透露工资，引热议

IT从业者国企生存指南

IT从业者的成长路径导航

信息安全从业者书单推荐

AI从业者生存技能：化繁为简

支付从业者转型路在何方？

资深互联网从业者感悟：学习是需要持之以恒的！

亲爱的SAP从业者们，烦请做个SAP知识学习种类的小调查

Linux学习1：软件测试从业者的高频Linux命令

自动驾驶从业者顶流学习笔记，值得收藏！

炒币机器人：区块链从业者必知的区块链六大核心算法

大数据从业者应该知道的开源工具

IT从业者都应关注的软件行业的变化

软件行业访谈之游戏程序开发从业者

金融从业者，如何拒绝做流程狗？

安全从业者，该凭什么赢得你的尊严

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)