I recently saw an article about the rise of AI engineers on latent.space, which aroused the author's interest. After further collecting and sorting out some of the latest developments and information about AI engineers. The author sorts it out into this article, hoping to be helpful to everyone, and to discuss and learn together.
This is a discussion on Twitter. With the continuous development of the AI field, different roles are gradually differentiated and the division of labor is refined. The position of the AI engineer is on the right side of the API. In the figure, the position of the AI engineer is to develop some applications and tools based on the API. , proxy, etc.
-
Prompt Engineer (Prompt Engineer ): Responsible for debugging Prompt to make the model have a stable output. Perhaps with the development of the model, the requirements for Prompt will not be so high. To really take advantage of the power of this model, you have to be able to write code, not just a non-technical Prompt Engineer, in order to be more efficient. In other words, they have programming thinking and use natural language for programming. -
Data processing: Understand some data processing methods, clean, preprocess, label, enhance data, and do some model fine-tuning. -
Software engineering: Do some applications based on models, solve some real-world problems based on AI, application deployment and expansion, system stability, scalability design, performance optimization, etc. Understand the supporting tools around the AI model. Some algorithms: You can also go deep into the field of algorithms...to do more difficult AI model training
Focus on the application field of AI and solve some problems in the application.
Most people still think of AI engineering as a form of machine learning or data engineering, so many people think that deep learning, machine learning, etc. need to be mastered. However, according to the observations of some foreign leaders, many outstanding AI-related engineers have not completed the study and research on deep learning, and they do not know PyTorch, or even the difference between data lakes and data warehouses, because AI engineers There is also no direct requirement for data engineering.
In some discussions abroad, some of the concerns of the two are different:
ML engineers are primarily concerned with the design, development, and deployment of machine learning models, and their work is usually more specific and granular. Handle practical issues related to models such as overfitting, imbalanced datasets, feature selection, etc.
AI engineers are used to implement AI solutions: build complete AI applications, such as chatbots, image recognition systems, etc. Not only to deal with machine learning, but also focus on other fields such as deep learning, reinforcement learning, etc.
In the future, no one may suggest that you start learning AI engineering by reading "Attention is All You Need". It is definitely helpful to understand the basics and principles, but it is not a necessary condition. There are so many frameworks in development, and it is not necessary for each framework to go deep into the principle level. Sometimes you only need to use the product, and it is also very important to be able to do the application well.
Maybe in the short term for those with a good data science/ML background, AI engineers, Prompt engineers will feel inferior for a long time. Yet Big Brother's view is that pure demand and supply economics will prevail, and AI engineers will have their place.
▐ Hacker News discussion on AI/LLM engineers
Why do AI engineers appear?
▐ The atmosphere of AI productization is hot
▐There are certain challenges in productization
-
模型的多样性 :从评估最大的GPT-4和Claude模型,到最小的开源Huggingface、LLaMA等模型,选择和评估合适的模型是一大挑战。 -
工具的多样性 :工具的选择范围从最受欢迎的链式、检索和向量搜索工具,如LangChain、LlamaIndex和Pinecone,到新兴的自主代理领域的工具,如Auto-GPT和BabyAGI。 -
信息过载 :每天发布的论文、模型和技术的数量正在指数级增长。以至于跟上这些信息几乎成了一份全职工作。
▐ 市场的供需关系
大公司的角色:像Microsoft、Google、Meta这样的大公司已经垄断了稀缺的研究人才,提供“AI研究即服务”API。你不能雇佣他们,但你可以利用他们的能力,全球大约有5000名LLM研究者,但有约5000万名软件工程师。供应限制意味着一个“中间”类别的AI工程师将应运而生。
GPU囤积:Stability AI通过强调他们的4000 GPU集群引发了初创公司的GPU竞赛。各种公司都在做GPU的储备竞赛。全球芯片短缺进一步加剧了这一趋势。大部分公司是训练不了模型的,只能去利用模型。
快速验证想法:与其要求数据科学家/ML工程师在训练一个特定领域的模型之前进行繁琐的数据收集,不如让产品经理/软件工程师Prompt一个LLM,并构建/验证一个产品想法,然后再获取特定数据进行微调。使用LLM原型的工作流程可以使你的工作速度比传统的机器学习快10-100倍。因此,AI工程师能够以比传统方法低1000-10000倍的成本验证AI产品。
参考AI应用全景报告:https://ramsrigoutham.medium.com/the-landscape-of-generative-ai-landscape-reports-615a417b15d
-
传统方式:程序员通过编写代码来明确指示计算机如何执行任务。 -
新方式:通过神经网络和机器学习来“学习”如何执行任务,而不是通过明确的编程指令。这种方法的优势在于,它可以处理大量的数据并从中学习,而不需要人为地为每一个可能的情况编写代码。 类似于当前的算法推荐;
有人说这种做法只是OpenAI的包装,只是使用技术而没有进行任何创新,还有担心LLM应用的安全隐私问题、提示注入和一些反向工程问题。
问题虽然存在,但毕竟这个是一个正在快速发展的领域,每个都可以有自己的观点,如果相信这个领域会快速发展,这些问题可以在前进的路上逐渐的去解决。还有当前LLM看似大,但也需要人类编写代码(或者通过Prompt)来指导和增强它的功能。
未来的编程不仅仅是由人类编写的代码,随着工程师越来越擅长利用AI,AI也将越来越多地参与到工程设计中。直到有一天,我们可能无法分辨出哪些是人类编写的,哪些是AI生成的代码。通过自然语言就可以构建出复杂的软件工程...
基础教育 AI工程师需要对线性代数、微积分、概率和统计有了解,因为这些都是机器学习算法的基础。掌握至少一种编程语言,如Python或R,这是进行机器学习编程的基础。
专业知识培养: 机器学习: 学习各种机器学习算法,如线性回归、决策树、神经网络等。深度学习: 了解CNN、RNN、Transformer等模型结构,以及如何使用框架如TensorFlow和PyTorch来实现它们。
实践经验:
项目实践: 手头上的项目经验很重要。从小项目开始,逐渐处理更复杂的问题。
参与竞赛: Kaggle等平台提供了很多数据科学和机器学习的竞赛,通过这些竞赛,你可以学习到很多实践经验。
信息获取:
研究: 阅读最新的研究论文,了解最新的技术和趋势。
网络: 加入AI和机器学习的社区,如OpenAI、Google AI等,与其他专家交流,分享知识。
课程与认证:考虑获得与AI和机器学习相关的认证,如TensorFlow认证或AWS Machine Learning认证。
确定方向:AI是一个快速发展的领域,总有新的技术和方法出现。保持好奇心,始终对新知识保持开放的态度。同时AI是一个可以广泛应用的领域,确定你最感兴趣的领域,深入研究。
不过以上感觉是针对研究型人员的成长路径,针对大多数人,想要往AI领域发展,怎么样学习成长,个人尝试按照自己的理解梳理一下:
编程语言: 首先要懂一门编程语言、Python简单易上手,而且现在有AI加持;通过GPT辅助自己学习Python。
基础原理: 了解大模型的原理,LLM是如何工作的,SD是如何工作的,对常见的AI领域的算法有一定了解,知道大致是干什么的。
模型了解:了解市场上有哪些模型,各自的适用场景,都可以用来做什么;能都亲自体验一把
提示词工程,学习怎么通过提示词让模型返回自己期望的结果。
LLM工具,通过工具提升自己对大模型的操作效率,利用相关工具能快速验证想法;
软件工程,将LLM的能力产品化封装,并且能具备一定的部署运维能力,做一些实际的项目,积累实践经验
未来AI工程师的畅想?
与其他领域的合作:也许未来的AI工程师可以类似当前的软件工程师,深入某个领域做领域建模,与领域专家合作,深入到各行各业,与医生、艺术家、建筑师等其他领域的专家合作,共同创建创新解决方案。例如,在医疗领域,AI工程师可以与医生合作,开发出更精确的诊断工具。
自动化任务: 随着技术进步,大部分的任务都可以被AI自动化掉,AI工程师的角色将更多地转向创造、优化和维护复杂的系统,而不仅仅是编写代码。
AI的解释性: 工程师更加重视AI决策的透明度和解释性,确保AI的决策可以被人类理解和接受。
道德和伦理:由于AI的普及和深入,对道德和伦理的考虑将成为AI工程师的基本素养。不仅要考虑技术的创新,还要确保其技术的应用不会对社会和个人造成伤害。
具身AI,机器人:融合对心理学、生物学、神经科学、哲学等学科有一定的理解,开发出能理解人类智慧和情感,更加高效和人性化的AI系统,AI机器人。
当下,随着大模型的不断发展和基础设施的完善,AI的技术越来越丰富,AI工程师这一新角色正在崛起,它会区别于以往的ML工程师,其重点不是设计和训练模型,通过Prompt提示,结合一些软件工程,一些大模型工具,然后构建AI相关的产品,解决实际问题。
最后也尝试去梳理了下成为AI工程师要学习成长的路径,期望能和大家一块进步和探索,在未来的世界中,利用新技术改变大家的生活。
Tomorrow belongs to those who embrace it today
团队以创新为核心价值观之一,鼓励团队成员在工作中不断探索、实验和创新,以推动业界技术的进步和用户体验的提升。我们不仅关注当前业界领先的技术,更注重未来技术的预研和应用。团队成员会积极参与学术研究和技术社区,不断探索新的技术方向和解决方案。
团队立足体系化打造业界领先的用户增长基础设施,以媒体外投平台、ABTest平台、用户运营平台为代表的基础设施赋能阿里集团用户增长,日均处理数据量千亿规模、调用QPS千万级。在用户增长技术团队,我们提供“增长黑客”极客氛围和丰富的岗位选择,欢迎业界贤才加入。
本文分享自微信公众号 - 大淘宝技术(AlibabaMTT)。
如有侵权,请联系 [email protected] 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。