Laboratório de Inteligência Artificial de Shanghai AI Training and Computing Center|Recrutamento Global

7c5394aab41f7a7727e2a00fabee70cf.png

Laboratório de Inteligência Artificial de Xangai (Shanghai AI Laboratory) AI Training and Computing Center está empenhado em definir e liderar a construção de uma nova geração de sistemas de treinamento e computação de IA, construindo um sistema de computação e compilação de IA amplamente inclusivo e desenvolvendo altamente escalável e amplamente aberto , e otimizado Um sistema com eficiência energética e altamente adaptável assume o trabalho fundamental de apoiar a tecnologia de inteligência artificial.

Enfrentando o desenvolvimento futuro de inteligência geral e assuntos interdisciplinares, o centro criará uma nova geração de sistema aberto de treinamento de inteligência artificial, definirá um novo paradigma de programação de sistema de treinamento, romperá com a tecnologia paralela multidimensional, tecnologia de treinamento adaptável e colaboração distribuída eficiente em um tecnologia de ambiente de vários dispositivos para obter treinamento eficiente de modelos supergrandes, explorar o limite de eficiência energética do treinamento de modelos e atender às necessidades de integração de inteligência geral e computação científica de grande escala.

Atualmente, o centro lançou o sistema de computação aberta de inteligência artificial DeepLink, o treinamento do modelo NeRF de 100 bilhões de parâmetros do LandMark e a renderização em tempo real do modelo de resolução 1K de 100 quilômetros quadrados, e a sobreposição eficiente de computação e comunicação de Shusheng Puyu (InternLM) e ganhou o prêmio ASPLOS 2023 Outstanding Paper.


O centro continuará a explorar o sistema de computação de inteligência artificial aberto, pesquisar e fazer avanços na tecnologia de compilação de computação para back-ends de multicomputação, promover a evolução simultânea de recursos de computação e desenvolvimento de algoritmos e realizar a adaptação eficiente e suporte de treinamento de várias unidades de computação na nuvem e na borda, para atender às novas necessidades de computação trazidas pela nova geração de infraestrutura de computação inteligente.

Estamos agora recrutando talentos para as seguintes posições:

  • Centro de Treinamento e Computação para Jovens Cientistas

  • Cientista jovem de computação heterogênea de alto desempenho

  • Jovem pesquisador de tecnologia de treinamento de modelo grande

  • Engenheiro de P&D do sistema de treinamento de modelo grande

  • Engenheiro de Algoritmo da Estrutura de Treinamento de Deep Learning

  • Engenheiro de Pesquisa de Compilação de Deep Learning

  • Engenheiro de desenvolvimento C++

  • Modelo Grande Multimodal Jovem Pesquisador

  • Engenheiro de Mockup Multimodal

  • Modelo Grande de Processamento de Linguagem Natural Jovem Pesquisador

  • Engenheiro de modelos grandes de processamento de linguagem natural

(Deslize para cima e para baixo para visualizar o conteúdo específico das posições relevantes)

Centro de Treinamento e Computação para Jovens Cientistas

descrição do trabalho:

 1. Liderar a equipe para promover a otimização da computação e comunicação em treinamento distribuído, fazer pleno uso do poder de computação e usar um grande número de placas aceleradoras para explorar o limite de desempenho; 2. Otimizar o modo de uso da memória do chip acelerador
 e comunicação e suporte de treinamento eficiente de vários modelos grandes;
 3. Cooperar com universidades para estudar o trabalho de pesquisa de sistema em larga escala no campo do sistema;
 4. Melhorar a influência da direção de treinamento distribuído na academia e na indústria.

Requisitos do trabalho:

 1. Base de computador sólida, familiarizada com C/C++, capaz de arquitetura de desenvolvimento de software de sistema;
 2. Familiarizada com arquitetura de computador e tecnologia de computação paralela básica, mais de 5 anos de experiência de trabalho em treinamento distribuído em larga escala; 3.
 Com NVIDIA, AMD, Intel Experiência em ajuste de desempenho de pelo menos uma arquitetura de GPU
 4. Familiarizado com pelo menos uma biblioteca de comunicação distribuída de MPI e NCCL e experiência em ajuste de desempenho de tarefas de computação de 100 nós; 

5. Familiarizado com os princípios de treinamento de modelo e os princípios básicos do Optimizer, compreenda os métodos básicos de treinamento distribuído e tenha alguma compreensão dos métodos de aceleração de treinamento, como treinamento de precisão mista e paralelismo de dados.

Cientista jovem de computação heterogênea de alto desempenho

descrição do trabalho:

1. Liderar a equipe para construir uma ecologia de software de treinamento e computação de IA com compilação como núcleo e cooperar com os fabricantes de chips de aceleração de IA para formar padrões de interface de software e hardware; 2. Projetar uma arquitetura de pilha de software de compilação de IA aberta para conectar-se a vários
IA chips de aceleração;
3. Concentre-se na computação AI e compile a tendência de desenvolvimento da tecnologia de ponta e estabeleça a direção de pesquisa da tecnologia de compilação do laboratório;
4. Continue a melhorar a influência acadêmica e industrial da direção de compilação e computação do laboratório.


Requisitos de trabalho:
1. Mais de 5 anos de experiência profissional, médicos excelentes podem relaxar adequadamente o requisito de anos de trabalho;
2. Base sólida de computador, familiar com C/C++ e capaz de arquitetura de desenvolvimento de software de sistema;
3. Familiarizado com arquitetura de computador e tecnologia básica de computação paralela;
4. Experiência em ajuste de desempenho de pelo menos uma arquitetura de GPU, como NVIDIA, AMD, Intel, etc.;
5. Familiaridade com pelo menos uma primitiva de desenvolvimento, como CUDA, OpenCL, Vulkan, Metal, OpenGL Compute Shader 6.
Ter experiência em operações de matriz algébrica, processamento de sinal, visão computacional, processamento de imagem ou algoritmo gráfico 3D e ajuste em diferentes processadores;

7. Aqueles que desenvolveram e operaram software de código aberto ou contribuíram com código para software de código aberto conhecido são os preferidos.

Jovem pesquisador de tecnologia de treinamento de modelo grande

Descrição do trabalho:
1. Acompanhe os últimos progressos na pesquisa de IA generativa;
2. Reproduza o trabalho clássico de IA generativa;
3. Descubra novas oportunidades de otimização no treinamento e raciocínio de IA generativa.


Requisitos:
1. Doutorado em computação ou inteligência artificial
2. Experiência em framework e estrutura de sistemas
3. Experiência em engenharia sênior;

4. Aqueles que têm realizações de pesquisa em software de sistema AI são os preferidos.

Engenheiro de P&D do sistema de treinamento de modelo grande

descrição do trabalho:

1. Participar do projeto e implementação de sistemas de aprendizado de máquina altamente disponíveis, escaláveis ​​e distribuídos, apoiar treinamento e raciocínio eficientes de grandes modelos e alcançar avanços tecnológicos;

2. Otimizar o sistema distribuído de cenários de treinamento de modelos grandes;

3. Continuar a melhorar a eficiência de utilização e a facilidade de uso da plataforma, explorar as principais tecnologias relacionadas a modelos de grande escala do setor, projetar e implementá-las no sistema de treinamento.

Requisitos do trabalho:

1. Mestrado ou superior em áreas relacionadas com informática;

2. Sólida base de programação, familiarizado com programação multi-threaded, comunicação de rede, gerenciamento de memória e padrões de design, experiência em desenvolvimento em engenharia de sistemas C++/Python em grande escala e capacidade e experiência para otimizar problemas de desempenho de sistemas distribuídos;

3. Ter um entusiasmo técnico por sistemas de IA, ter um forte interesse e busca por avanços tecnológicos de ponta e estar empenhado em buscar a perfeição e inovação tecnológica;

Aqueles que atendem a uma ou mais das seguintes condições são preferidos:

a.Experiência em programação e ajuste de desempenho para comunicação CUDA, NCCL, RDMA;

b. Familiarizado com o código-fonte das principais estruturas de aprendizado profundo, como Pytorch ou Ray.

Engenheiro de Algoritmo da Estrutura de Treinamento de Deep Learning

descrição do trabalho:

1. Responsável pela análise quantitativa, transplante, implementação, otimização de desempenho de ponta a ponta e ajuste de precisão do modelo de carga de trabalho/algoritmo de IA de laboratório no chip Cambrian AI (MLU);

2. Sob a plataforma de software e hardware MLU, desenvolver bibliotecas de algoritmos de treinamento, raciocínio e visão de máquina; analisar possíveis gargalos de desempenho em operadores e otimizá-los para melhorar a competitividade dos produtos no setor; incluindo, entre outros, as necessidades dos operadores Análise, design, desenvolvimento e testes unitários, otimização, integração e manutenção de versão.

Requisitos do trabalho:

1. Computação, engenharia eletrônica, matemática, comunicação, automação e outros cursos relacionados;

2. Proficiência em sistema operacional Linux, proficiência em C/C++/Python/Shell, bons hábitos de programação e familiaridade com o processo de desenvolvimento de software;

3. Ter um forte interesse em uma determinada cena em visão computacional, reconhecimento de fala, recomendação de anúncio de pesquisa, processamento de linguagem natural e AI HPC;

4. Familiarizado com e usado pelo menos uma estrutura de aprendizado profundo convencional (TensorFlow/PyTorch/TVM, etc.), ter um bom espírito de trabalho em equipe, ter um forte senso de responsabilidade e ser capaz de concluir ativamente o trabalho relacionado.

5. Preferem-se aqueles que tenham a seguinte experiência:

a. Ter a compreensão de um desenvolvedor de pelo menos uma estrutura de aprendizado profundo convencional (TensorFlow/PyTorch etc.) e ter certos insights e experiência em design ou ajuste de estrutura são os preferidos;

b. Ter certos insights e experiência em soluções distribuídas de baixo nível e alto desempenho, como MPI/CCL, bem como soluções distribuídas de alto nível, como dados, modelos e paralelismo de pipeline;

c. Familiarizado com arquitetura de computadores, experiência em computação paralela, computação heterogênea e otimização de desempenho em (GPU, TPU, X86, ARM, DSP);

d. Ter experiência em desenvolvimento e ajuste de desempenho de bibliotecas de alto desempenho comumente usadas na indústria (como TensorRT, OpenBLAS, MKL, cuDNN, etc.). 

Engenheiro de Pesquisa de Compilação de Deep Learning 

Descrição do trabalho:
1. Participar do desenvolvimento da estrutura de aprendizado profundo de acesso ao chip doméstico;
2. Realizar a tarefa de estrutura abstrata de acesso ao compilador para melhorar a eficiência do acesso;
3. Usar vários meios técnicos para acelerar o treinamento do modelo;
4. Participar de outras pesquisas e aplicação de tecnologias de ponta relevantes.


Requisitos do trabalho:
1. Ter bons hábitos de programação, uso proficiente da linguagem Python/C++ e forte capacidade de depuração;
2. Ter um profundo conhecimento e experiência prática em estruturas de aprendizado profundo ou compiladores de aprendizado profundo (incluindo, entre outros, Pytorch, TF, JAX, XLA, MLIR, TVM, etc.);
3. Possuir forte auto-motivação e forte interesse em tecnologia avançada;
4. Ter forte espírito de equipa e capacidade de comunicação;

5. Familiarizado com os novos recursos do Pytorch 2.0, experiência em otimização de treinamento de modelo grande ou AI for Science é preferencial.

Engenheiro de desenvolvimento C++

Descrição do trabalho:
1. Participar da pesquisa e desenvolvimento de estruturas específicas, realizar a implementação de novos métodos no campo de aprendizado profundo e entender novas tecnologias em áreas relacionadas; 2.
Participar do desenvolvimento e otimização do framework de aprendizado profundo Parrots , e realizar aprendizado profundo sob as condições de aplicativos de nível industrial de big data Otimização da arquitetura central; 
3. Adaptar-se ao mais recente algoritmo e arquitetura de aprendizado profundo, ajustar, melhorar e otimizar a estrutura;
4. Otimizar a velocidade de treinamento da estrutura, incluindo cálculo e comunicação e seu agendamento, para melhorar a eficiência do treinamento do modelo,
5. Expansão Melhore as funções da estrutura de aprendizado profundo e melhore o poder de computação e melhore o sistema de ferramentas.

Requisitos do trabalho:
1. Qualquer um dos seguintes requisitos deve ser atendido:
a. Mais de 2 anos de experiência em desenvolvimento C++ ou Python no Linux, proficiência em programação de modelos, experiência em contribuição de código-fonte aberto é preferencial; b. Familiaridade
com computador arquitetura e tecnologias básicas de computação paralela, e os princípios básicos da computação paralela de GPU, com mais de 2 anos de experiência em programação de GPU
; estilo; 3.
Bom hábito de documentação, escrever documentos técnicos e progresso do trabalho em tempo hábil, conforme necessário;
4. Familiarizado com o código-fonte das principais estruturas de aprendizado profundo, como Pytorch e Tensorflow, é o preferido.

Modelo Grande Multimodal Jovem Pesquisador

descrição do trabalho:

1. Participar diretamente da pesquisa e desenvolvimento de grandes modelos multimodais, incluindo design, treinamento, ajuste, etc. de grandes modelos multimodais; 2. Realizar pesquisas sobre algoritmos de ponta multimodais, incluindo, entre
outros para percepção 2D/3D multimodal, geração de gráficos, etc.;
3. Realizar pesquisas teóricas básicas sobre treinamento de modelos grandes, incluindo, entre outros, design de modelos, estratégias de treinamento, algoritmos de otimização, compressão de modelos, etc.

Requisitos do trabalho:
1. Um doutorado em áreas relacionadas a computação ou inteligência artificial, com vários artigos publicados nos principais periódicos;
2. Compreensão aprofundada de pelo menos uma direção do processamento de linguagem natural ou visão computacional;
3. Proficiência em Python e PyTorch , com capacidade de engenharia relativamente forte.

4. Experiência em pesquisa de algoritmos multimodais e pré-treinamento de modelos grandes é preferencial;

5. Aqueles que têm trabalhos acadêmicos bem conhecidos, projetos de código aberto e resultados de competições internacionais são preferidos
;

Engenheiro de Mockup Multimodal

descrição do trabalho:

1. Participar do treinamento e ajuste de grandes modelos multimodais, estabilizar o treinamento de grandes modelos, melhorar a eficiência do treinamento, etc.;

2. Apoie vários aplicativos de pouso de modelos grandes e aplique modelos grandes a cenas reais;

3. Participar do desenvolvimento da avaliação de modelos grandes.

Requisitos do trabalho:

1. Bacharelado ou superior em áreas relacionadas a computação ou inteligência artificial, pontos extras para trabalhos em conferências importantes;

2. Familiarizado com pelo menos uma direção de pesquisa de processamento de linguagem natural ou visão computacional;

3. Proficiente em Python e PyTorch, com forte capacidade de engenharia;

4. A familiaridade com o desenvolvimento CUDA e o ajuste de desempenho podem agregar pontos;

5. Familiarizado com estruturas de treinamento de modelos grandes, como Deepspeed, Colossalai ou Megatron, experiência em pré-treinamento de modelos grandes é preferencial;

6. Aqueles que têm projetos de código aberto bem conhecidos e resultados de competições internacionais são os preferidos.

Modelo Grande de Processamento de Linguagem Natural Jovem Pesquisador

descrição do trabalho:

1. Participar de pesquisa de modelo em grande escala, incluindo treinamento e ajuste de modelos de supergrande escala;
2. Realizar pesquisa de otimização e mecanismo de modelo em grande escala, incluindo exploração de capacidade de modelo em grande escala, expansão externa de capacidade de modelo em grande escala , etc .; 3.
Responsável pela pesquisa periférica relacionada ao modelo em grande escala, como pesquisa de segurança ética de modelo grande, aceleração de raciocínio de modelo grande, otimização imediata de modelo grande, etc.


Requisitos do trabalho:
1. Um doutorado em áreas relacionadas a computação ou inteligência artificial, com vários artigos publicados nos principais periódicos;
2. Compreensão aprofundada de pelo menos uma direção de pesquisa em processamento de linguagem natural ou visão computacional;
3. Proficiência em Python e PyTorch, com forte capacidade de engenharia.

4. A familiaridade com estruturas de treinamento de modelos grandes, como Deepspeed, Colossalai ou Megatron, é preferida;

5. Aqueles com trabalhos acadêmicos conhecidos, projetos de código aberto e resultados de competições internacionais são os preferidos.

Engenheiro de modelos grandes de processamento de linguagem natural

descrição do trabalho:

1. Participar do treinamento e ajuste de grandes modelos, estabilizar o treinamento de grandes modelos, melhorar a eficiência do treinamento, etc.; 2.
Responsável pelo trabalho relacionado à biblioteca de algoritmos Intern-LM, implementar e manter a biblioteca de algoritmos;
3. Apoiar vários aplicações de pouso de modelos grandes, para encurtar a distância entre o modelo grande e a cena real do aplicativo.


Requisitos do trabalho:
1. Bacharel ou superior em áreas relacionadas a computação ou inteligência artificial, pontos extras para artigos nas principais conferências;
2. Familiarizado com modelos comuns de processamento de linguagem natural;
3. Proficiente em Python e PyTorch, com fortes capacidades de engenharia.

4. A familiaridade com o desenvolvimento CUDA e o ajuste de desempenho podem agregar pontos;

5. Familiaridade com estruturas de treinamento de modelo grande, como Deepspeed, Colossalai ou Megatron é o preferido;

6. Aqueles que têm trabalho acadêmico conhecido, projetos de código aberto e resultados de competições internacionais são os preferidos.

Este recrutamento está aberto a recrutamento social, recrutamento escolar e posições de estágio ao mesmo tempo.Os interessados ​​neste campo são bem-vindos.

Método de Entrega

Método 1:
Envie seu currículo para o e-mail: [email protected], e-mail e formato de nomenclatura do currículo: nome - cargo pretendido - (recrutamento escolar/recrutamento social/estágio).


Método 2:
Faça login no site oficial do Laboratório de Inteligência Artificial de Xangai (www.shlab.org.cn), clique em "Junte-se a nós" na barra de navegação, procure o nome da postagem correspondente e envie.

Método 3:

Digitalize o código QR abaixo para enviar ou clique em "Ler o texto original" no final do artigo para entregar.

5743e1472ee4746398d6f54ab0bb1ad7.jpeg

Laboratório de Inteligência Artificial de Xangai (Laboratório de IA de Xangai)

Um novo tipo de instituição de pesquisa científica no campo da inteligência artificial em meu país, realizando pesquisas científicas estratégicas, originais e voltadas para o futuro e avanços tecnológicos, rompendo importantes teorias básicas e principais tecnologias de inteligência artificial e criando um " integração inovadora, líder e plataforma" É uma base de pesquisa abrangente em grande escala que apóia a indústria de inteligência artificial do meu país para alcançar um desenvolvimento acelerado e visa construir um laboratório de inteligência artificial de classe mundial e se tornar uma fonte de inteligência artificial original de renome mundial teorias e tecnologias de inteligência.

b2c5af2ce5a20e33e7c8aeb53574cff4.png

ea48d67dd9e3525fd8059653dd251db3.png

a756626c5c96fc47bf84a006775aeb73.png

456adf5bb19152bb00e9b7e2f25bb50e.png

3f5ed414d46f6be38afe920198b1b1ef.png

Acho que você gosta

Origin blog.csdn.net/qq_27590277/article/details/132331941
Recomendado
Clasificación