Falando sobre a API Intel One

1. Plano de indústria OneAPI

1.1 Desafios de Programação para Múltiplas Arquiteturas

Cargas de trabalho cada vez mais especializadas exigem uma variedade de hardware centrado em dados. Hoje, cada arquitetura requer um modelo de programação e uma cadeia de ferramentas separados.A complexidade do desenvolvimento de software limita a liberdade de escolha da arquitetura.

 1.2 OneAPI Um modelo de programação para várias arquiteturas e fornecedores

Liberdade de escolha
Escolha a melhor tecnologia de aceleração que o software não pode decidir por você
Perceba todo o valor do hardware
Desempenho em CPUs, GPUs, FPGAs e outros aceleradores
Desenvolva e implemente software com confiança
Padrões abertos da indústria fornecem um caminho claro e seguro para o futuro Caminho
▪ Compatível com linguagens e modelos de programação existentes, incluindo C++, Python, SYCL, OpenMP, Fortran e MPI

 1.3 Poderosa biblioteca OneAPI

Realiza todo o valor do hardware
Projetado para acelerar a
liberdade de escolha de
função crítica específica do domínio Pré-otimizado para cada plataforma de destino para desempenho máximo

2. Produtos Intel oneAPI

Baseado na rica herança de ferramentas de CPU da Intel e estendido para a arquitetura XPU, um conjunto completo de compiladores de alto nível, bibliotecas e ferramentas de portabilidade, análise e depurador Utiliza recursos de hardware de última geração para acelerar a computação Compatível com a
programação
existente modelos e bases de código (C++, Fortran, Python, OpenMP, etc.) interoperabilidade, os desenvolvedores podem ter certeza de
que os aplicativos existentes funcionarão perfeitamente com uma API
▪ Transição fácil para novos sistemas e aceleradores - usar uma única base de código dá aos desenvolvedores mais tempo para inovar

 2.1 Ferramenta de compatibilidade Intel® DPC++

 Auxiliar os desenvolvedores na migração de código escrito em CUDA para DPC++ de uma só vez, gerando código legível tanto quanto possível
Cerca de 90-95% do código geralmente é migrado automaticamente
Fornece comentários em linha para ajudar os desenvolvedores a concluir a portabilidade do aplicativo

2.2 Ferramentas de análise e depuração

 2.3 Kit de ferramentas Intel® oneAPI

Um conjunto de ferramentas de desenvolvedor comprovadas que escalam de CPUs para mais aceleradores

 3. Detalhes sobre o Intel® oneAPI Toolkit

3.1 Kit de ferramentas básico Intel® oneAPI

Um conjunto básico de ferramentas e bibliotecas para desenvolver aplicativos de alto desempenho em CPUs, GPUs e
FPGAs Intel®.
Para quem?
▪ Vários desenvolvedores em diferentes setores
▪ Usuários do conjunto de ferramentas complementares, pois é a base de todos os conjuntos de ferramentas
Principais recursos/benefícios
▪ Compilador C++ paralelo de dados, biblioteca e ferramentas de análise
▪ Ferramentas de compatibilidade DPC++ para ajudar a migrar aplicativos existentes escritos em CUDA Com código
▪ A distribuição do Python inclui bibliotecas aceleradas scikit-learn, NumPy e SciPy
▪ Bibliotecas de desempenho otimizado com suporte para threading, matemática, análise de dados, aprendizado profundo e
vídeo/imagem/sinal

3.2 Compilador Intel® oneAPI DPC++/C++

O compilador oferece eficiência e desempenho de programação paralela excepcionais em CPUs e aceleradores
▪ Suporta reutilização de código para hardware de destino diferente, bem como ajuste personalizado para aceleradores específicos
▪ Alternativa aberta e intersetorial para linguagens proprietárias
DPC++ é baseado em ISO C++ e Khronos SYCL
▪ Usa construções C e C++ comuns e familiares para obter os benefícios de eficiência de C++
▪ Integra-se com o SYCL do Khronos Group para oferecer suporte ao paralelismo de dados e
anos de experiência em programação  heterogênea

3.3 A biblioteca de comunicação convergente Intel® oneAPI otimiza o modo de comunicação

  •  Fornece um modo de comunicação otimizado para obter alto desempenho em CPUs e GPUs Intel para distribuir o treinamento do modelo para vários nós
  • Oferece suporte transparente a várias interconexões, como Intel® Omni-Path Architecture, InfiniBand e Ethernet
  • Construído em middleware de comunicação de baixo nível (MPI e libfabrics)
  • Suporte para implementação eficiente de ensembles para treinamento de aprendizado profundo — coleta total, redução total e dispersão reduzida

3.4 Analisador Intel® VTune™

 Análise DPC++⎯para ajuste de CPU, GPU e FPGA

Dados de perfil Parallel C++ (DPC++)
Visualize as linhas mais demoradas do código DPC++ Ajuste
para CPUs, GPUs e FPGAs Intel Otimização do descarregamento
para qualquer acelerador de hardware compatível Ajuste do desempenho do descarregamento do OpenMP Vários perfis de desempenho CPU, GPU, FPGA, threads, memória, Cache, armazenamento… Suporte para linguagens comuns DPC++, C, C++, Fortran, Python, Go, Java ou uma combinação de linguagens





 3.5 Consultor Intel®

 Assistente de design — feito sob medida para hardware moderno

Offload Advisor
estima o desempenho transferido para aceleradores
Análise Roofline
Otimiza código de CPU/GPU para memória e computação
Vectorization Advisor
adiciona e otimiza vetorização
Threading Advisor
adiciona funcionalidade de threading eficiente a aplicativos não threaded
Analisador de gráfico de fluxo
Criação eficiente e gráfico de fluxo de análise

Acho que você gosta

Origin blog.csdn.net/lovebaby1689/article/details/126946101
Recomendado
Clasificación