上海人工智能实验室AI训练与计算中心｜全球招聘

上海人工智能实验室（上海AI实验室）AI训练与计算中心致力于定义并引领新一代AI训练与计算系统构建，建设具有广泛包容性的AI计算与编译体系，发展高扩展、广开放、优能效、强适应的系统，承担支撑人工智能技术的基石工作。

面向通用智能和交叉学科的未来发展，中心将打造新一代开放式人工智能训练系统，定义全新的训练系统编程范式，突破多维度并行技术、自适应训练技术以及多元设备环境中的高效分布式协作技术，实现超大模型的高效训练，探索模型训练的能效极限，满足通用智能与超大规模科学计算融合的需求。

目前，中心已推出DeepLink人工智能开放计算体系、书生·天际（LandMark）千亿参数NeRF模型训练与100平方公里1K分辨率模型的实时渲染、书生·浦语（InternLM）计算与通信高效重叠等研究成果，并获得ASPLOS 2023杰出论文奖。

中心还将持续探索开放式的人工智能计算体系，研究并突破面向多计算后端的计算编译技术，推动计算能力与算法发展的同步演进，实现云边端多种计算单元的高效适配与训练支持，满足新一代智算基础设施带来的全新计算需求。

现针对以下岗位招募人才：

AI训练与计算中心青年科学家
高性能异构计算青年科学家
大模型训练技术青年研究员
大模型训练系统研发工程师
深度学习训练框架算法工程师

扫描二维码关注公众号，回复： 16263954 查看本文章
深度学习编译研究工程师
C++开发工程师
多模态大模型青年研究员
多模态大模型工程师
自然语言处理大模型青年研究员
自然语言处理大模型工程师

（相关岗位具体内容可上下滑动查看）

AI训练与计算中心青年科学家

职位描述：

1、带领团队推进分布式训练中的计算和通信优化，充分利用算力，使用大量加速卡探索性能边界；
2、优化加速芯片显存和通讯的使用模式，支持高效训练各种大模型；
3、与高校合作在系统领域研究大规模系统研究工作；
4、提升分布式训练方向在学术、产业的影响力。

职位要求：

1、计算机基础扎实，熟悉 C/C++，具备系统软件开发架构能力；
2、熟悉计算机体系结构以及并行计算基本技术，5年以上大规模分布式训练相关工作经验；
3、具有NVIDIA、AMD、Intel 等至少一种 GPU 体系结构上的性能调优经验；
4、熟悉MPI、NCCL至少一种分布式通信库，有百节点计算任务性能调优经验；

5、熟悉模型训练原理和Optimizer基本原理，了解分布式训练基本方法，对混合精度训练、数据并行等训练加速方法有所了解者优先。

高性能异构计算青年科学家

职位描述：

1、带领团队建设以编译为核心的AI训练计算软件生态，联合AI加速芯片厂商形成软硬件接口标准；
2、设计开放AI编译软件栈架构，对接多种AI加速芯片；
3、关注AI计算&编译前沿技术发展趋势，布局实验室编译技术研究方向；
4、持续提升实验室编译计算方向在学术和产业的影响力。

职位要求：
1. 5年以上工作经验，优秀博士可适当放宽工作年限要求；
2. 计算机基础扎实，熟悉 C/C++，具备系统软件开发架构能力；
3. 熟悉计算机体系结构以及并行计算基本技术；
4. 具有 NVIDIA、AMD、Intel 等至少一种GPU体系结构上的性能调优经验；
5. 熟悉CUDA、OpenCL、Vulkan、Metal、OpenGL Compute Shader 等至少一种开发原语；
6. 有代数矩阵运算、信号处理、计算机视觉、图像处理或 3D 图形学算法在不同处理器上移植和调优经验的优先；

7. 开发运营过开源软件或者为知名开源软件贡献过代码者优先。

大模型训练技术青年研究员

职位描述：
1、跟踪生成式AI研究最新进展；
2、复现生成式AI经典工作；
3、发掘生成式AI训练及推理中的新优化机会。

职位要求：
1、计算机或人工智能相关专业博士学位；
2、具有框架、系统结构方面经验；
3、具备资深工程经验；

4、有AI系统软件方面研究成果者优先。

大模型训练系统研发工程师

职位描述：

1、参与设计并实现高可用、可扩展、分布式机器学习系统，支撑大模型的高效训练与推理，实现技术突破；

2、优化大模型训练场景的分布式系统；

3、持续提升平台的利用效率和易用性，探索业界前沿的大模型相关技术，设计并实现于训练系统中。

职位要求：

1、计算机相关专业硕士及以上学位；

2、扎实的编程基础，熟悉多线程编程、网络通信、内存管理和设计模式，对大型C++/Python系统工程有开发经验，有优化分布式系统性能问题的能力和经验；

3、对AI系统有技术热情，对前沿技术攻坚有浓厚的兴趣和追求，热衷于追求技术极致与创新；

具备以下一个或者多个条件者优先：

a. 对CUDA、NCCL、RDMA通信有编程和性能调优经验；

b. 熟悉Pytorch或者Ray等主流深度学习框架源码。

深度学习训练框架算法工程师

职位描述：

1、负责实验室AI工作负载/算法模型在寒武纪AI芯片（MLU）上的量化分析、移植、实现、端到端性能优化和精度调优；

2、在MLU软硬件平台下，开发训练、推理、机器视觉算法库；分析算子中可能存在的性能瓶颈，并开展优化，提升产品在业界的竞争力；包括但不限于针对算子的需求分析、设计、开发及单元测试、优化、集成和版本维护。

职位要求：

1、计算机、电子工程、数学、通信、自动化等相关专业；

2、熟练操作Linux系统，熟练掌握C/C++/Python/Shell，有良好的编程习惯，熟悉软件开发流程；

3、对计算机视觉、语音识别、搜索广告推荐、自然语言处理、AI HPC中的某一个场景具有浓厚的兴趣和一定的积累与见解；

4、熟悉并使用过至少一种主流深度学习框架(TensorFlow/PyTorch/TVM等)，具有良好的团队协作精神，责任心强，能够积极主动地完成相关工作。

5、拥有以下经验者优先：

a、对至少一种主流深度学习框架(TensorFlow/PyTorch等)有开发者视角的理解，对框架设计或者调优有一定的见解和经验优先；

b、对MPI/CCL等底层高性能分布式方案，以及数据、模型、管道并行等高层分布式方案有一定的见解和经验；

c、熟悉计算机体系结构，有（GPU、TPU、X86、ARM、DSP）上的并行计算、异构计算、性能优化经验；

d、有业界常用的高性能库（如TensorRT、OpenBLAS、MKL、cuDNN等）开发和性能调优经验。

深度学习编译研究工程师

职位描述：
1、参与国产芯片接入深度学习框架的开发工作；
2、承担抽象编译器接入框架的任务，提高接入效率；
3、运用多种技术手段，加速模型训练；
4、参与其他相关前沿技术的调研与运用。

职位要求：
1、具有良好的编程习惯，熟练使用Python/C++语言，有较强的Debug能力；
2、对深度学习框架或者深度学习编译器有较深理解以及实践经验（包含不限于Pytorch、TF、JAX、XLA、MLIR、TVM等）；
3、具备较强的自驱动力，对先进技术有浓厚兴趣；
4、有较强的团队精神和沟通交流能力；

5、熟悉Pytorch2.0新特性，拥有大模型训练优化经验或AI for Science经验者优先。

C++开发工程师

职位描述：
1、参与具体的框架研发，实现深度学习领域新方法的落地，了解相关领域的新技术；
2、参与深度学习框架Parrots的研发与优化，实现大数据工业级应用条件下的深度学习核心架构优化；
3、适配深度学习最新算法与架构，对框架进行调整、改进和优化；
4、优化框架的训练速度，包括计算和通信及其调度，以提高模型训练的效率；
5、扩充深度学习框架的功能并提升计算能力，完善工具体系。

职位要求：
1、以下要求任意满足一条：
a、2年以上Linux下的C++或Python开发经验，熟练使用模板编程，有开源代码贡献经验更佳；
b、熟悉计算机体系结构、并行计算基本技术，以及GPU并行计算基本原理，有2年以上的GPU编程经验；
2、扎实的计算机科学功底和编程能力，熟练使用常见的算法和数据结构，拥有良好的编程习惯和代码风格；
3、有良好的文档习惯，及时按照要求撰写技术文档和工作进展；
4、熟悉Pytorch、Tensorflow等主流深度学习框架源码者优先。

多模态大模型青年研究员

职位描述：

1、直接参与多模态大模型的研发工作，包括多模态大模型的设计、训练、调优等；
2、开展多模态前沿算法研究工作，包括但不限于多模态2D/3D感知、图文生成等；
3、开展大模型训练基础理论研究工作，包括但不限于模型设计、训练策略、优化算法、模型压缩等。

职位要求：
1、计算机或人工智能相关专业博士学位，有多篇顶会顶刊论文发表；
2、对自然语言处理或计算机视觉至少一个方向有深入了解；
3、熟练掌握Python和PyTorch，有较强的工程能力。

4、拥有多模态算法研究和大模型预训练经验者优先；

5、拥有知名学术工作、开源项目、国际竞赛成果者优先；
6、熟悉Deepspeed、Colossalai或Megatron等大模型训练框架者优先。

多模态大模型工程师

职位描述：

1、参与多模态大模型的训练与调优，稳定大模型训练、提高训练效率等；

2、支撑大模型的各种落地应用，将大模型应用于真实场景；

3、参与大模型评测的开发工作。

职位要求：

1、计算机或人工智能相关专业本科及以上学历，有顶会论文可加分；

2、熟悉自然语言处理或计算机视觉至少一个研究方向；

3、熟练掌握Python和PyTorch，有较强的工程能力；

4、熟悉CUDA开发和性能调优可加分；

5、熟悉Deepspeed、Colossalai或Megatron等大模型训练框架，拥有大模型预训练经验优先；

6、拥有知名开源项目、国际竞赛成果者优先。

自然语言处理大模型青年研究员

职位描述：

1、参与大模型研究工作，包括超大规模模型的训练与调优；
2、开展大模型机理以及优化研究，包括大模型能力探究、大模型能力外沿扩展等；
3、负责大模型相关周边研究，如大模型伦理安全研究、大模型推理加速、大模型Prompt优化等。

职位要求：
1、计算机或人工智能相关专业博士学位，有多篇顶会顶刊论文发表；
2、对自然语言处理或计算机视觉至少一个研究方向有深入了解；
3、熟练掌握Python和PyTorch，有较强的工程能力。

4、熟悉Deepspeed、Colossalai或Megatron等大模型训练框架者优先；

5、有知名学术工作、开源项目、国际竞赛成果者优先。

自然语言处理大模型工程师

职位描述：

1、参与大模型的训练与调优中，稳定大模型训练、提高训练效率等；
2、负责Intern-LM算法库的相关工作，实现并维护算法库；
3、支撑大模型的各种落地应用，缩短大模型与真实应用场景的距离。

职位要求：
1、计算机或人工智能相关专业本科及以上学历，有顶会论文可加分；
2、熟悉自然语言处理常见模型；
3、熟练掌握Python和PyTorch，有较强的工程能力。

4、熟悉CUDA开发和性能调优可加分；

5、熟悉Deepspeed、Colossalai或Megatron等大模型训练框架者优先；

6、拥有知名学术工作、开源项目、国际竞赛成果者优先。

本次招聘同时开放社招、校招、实习岗位，欢迎有志该领域的人士踊跃投递。

投递方式

方式一：
发送简历至邮箱：[email protected]，邮件及简历命名格式：姓名 - 申请的岗位名称 -（校招/社招/实习）。

方式二：
登录上海人工智能实验室官方网站（www.shlab.org.cn），点击导航栏“加入我们”，搜索对应岗位名称投递。

方式三：

扫描下方二维码进行或点击文末“阅读原文”投递。

上海人工智能实验室（上海AI实验室）

我国人工智能领域的新型科研机构，开展战略性、原创性、前瞻性的科学研究与技术攻关，突破人工智能的重要基础理论和关键核心技术，打造“突破型、引领型、平台型”一体化的大型综合性研究基地，支撑我国人工智能产业实现跨越式发展，目标建成国际一流的人工智能实验室，成为享誉全球的人工智能原创理论和技术的策源地。

上海人工智能实验室AI训练与计算中心｜全球招聘

猜你喜欢