Hablando de Intel One API

1. Plan de la industria OneAPI

1.1 Desafíos de programación para múltiples arquitecturas

Las cargas de trabajo cada vez más especializadas requieren una variedad de hardware centrado en datos. Hoy en día, cada arquitectura requiere un modelo de programación y una cadena de herramientas independientes.La complejidad del desarrollo de software limita la libertad de elección de la arquitectura.

1.2 OneAPI Un modelo de programación para múltiples arquitecturas y proveedores

Libertad de elección
Elija la mejor tecnología de aceleración que el software no puede decidir por usted
Obtenga todo el valor del hardware
Rendimiento en CPU, GPU, FPGA y otros aceleradores
Desarrolle e implemente software con confianza Los
estándares abiertos de la industria brindan un camino seguro y claro hacia el futuro Camino
▪ Compatible con lenguajes y modelos de programación existentes, incluidos C++, Python, SYCL, OpenMP, Fortran y MPI

1.3 Potente biblioteca OneAPI

Realiza todo el valor del hardware
Diseñado para acelerar la función crítica específica del dominio
Libertad de elección
Preoptimizado para cada plataforma de destino para un rendimiento máximo

2. Productos Intel oneAPI

Basado en el rico legado de herramientas de CPU de Intel y extendido a la arquitectura XPU, un conjunto completo de compiladores, bibliotecas y herramientas de portabilidad, análisis y depuración de alto nivel Utiliza capacidades de hardware de última generación para acelerar la computación Compatible con la programación
existente interoperabilidad de modelos y bases de código (C++, Fortran, Python, OpenMP, etc.), los desarrolladores pueden estar seguros de
que las aplicaciones existentes funcionarán sin problemas con oneAPI
▪ Fácil transición a nuevos sistemas y aceleradores: el uso de una única base de código les da a los desarrolladores más tiempo para innovar

2.1 Herramienta de compatibilidad Intel® DPC++

Ayudar a los desarrolladores a migrar el código escrito en CUDA a DPC++ de una sola vez, generando tanto código legible por humanos como sea posible Aproximadamente el
90-95 % del código generalmente se migra automáticamente
Proporciona comentarios en línea para ayudar a los desarrolladores a completar la migración de la aplicación

2.2 Herramientas de análisis y depuración

2.3 Kit de herramientas Intel® oneAPI

Un conjunto de herramientas de desarrollo comprobadas que escala desde CPU a más aceleradores

3. Detalles sobre el kit de herramientas Intel® oneAPI

3.1 Kit de herramientas básico de Intel® oneAPI

Un conjunto básico de herramientas y bibliotecas para desarrollar aplicaciones de alto rendimiento en CPU, GPU y
FPGA Intel®.
¿Para quien?
▪ Varios desarrolladores en diferentes industrias
▪ Usuarios de conjuntos de herramientas complementarias, ya que es la base de todos los conjuntos de herramientas
Características/beneficios clave
▪ Herramientas de análisis, biblioteca y compilador C++ de datos paralelos
▪ Herramientas de compatibilidad con DPC++ para ayudar a migrar aplicaciones existentes escritas en CUDA con código
▪ La distribución de Python incluye bibliotecas aceleradas de scikit-learn, NumPy y SciPy
▪ Bibliotecas de rendimiento optimizado con soporte para subprocesos, matemáticas, análisis de datos, aprendizaje profundo y
video/imagen/señal

3.2 Compilador Intel® oneAPI DPC++/C++

El compilador ofrece una eficiencia y un rendimiento de programación paralelos excepcionales en CPU y aceleradores
▪ Admite la reutilización de código para diferentes hardware de destino, así como ajustes personalizados para aceleradores específicos
▪ La alternativa abierta e intersectorial a los lenguajes propietarios
DPC++ se basa en ISO C++ y Khronos SYCL
▪ Utiliza construcciones comunes y familiares de C y C++ para lograr los beneficios de eficiencia de C++
▪ Se integra con SYCL de Khronos Group para admitir el paralelismo de datos y
la programación heterogénea años de experiencia

3.3 La biblioteca de comunicación convergente Intel® oneAPI optimiza el modo de comunicación

Proporciona un modo de comunicación optimizado para lograr un alto rendimiento en las CPU y GPU de Intel para distribuir el entrenamiento del modelo a varios nodos
Admite de forma transparente múltiples interconexiones como Intel® Omni-Path Architecture, InfiniBand y Ethernet
Basado en middleware de comunicación de bajo nivel (MPI y libfabrics)
Compatibilidad con la implementación eficiente de conjuntos para la capacitación en aprendizaje profundo: recopilación total, reducción total y reducción de dispersión

3.4 Analizador Intel® VTune™

Análisis DPC++⎯para ajuste de CPU, GPU y FPGA

Datos de perfil C++ paralelo (DPC++)
Vea las líneas de código DPC++ que consumen más tiempo Ajuste
para CPU, GPU y FPGA de Intel Optimización de la descarga
para cualquier acelerador de hardware compatible Ajuste del rendimiento de descarga de OpenMP Varios perfiles de rendimiento CPU, GPU, FPGA, subprocesos, memoria, Caché, Almacenamiento… Soporte para lenguajes comunes DPC++, C, C++, Fortran, Python, Go, Java o una combinación de lenguajes

3.5 Asesor Intel®

Asistente de diseño: hecho a medida para el hardware moderno

Offload Advisor
estima el rendimiento descargado a los aceleradores
Análisis de línea de techo
Optimiza el código de CPU/GPU para memoria y computación
Vectorization Advisor
agrega y optimiza la vectorización
Threading Advisor
agrega funcionalidad de subprocesos eficiente a aplicaciones sin subprocesos
Analizador de gráfico de flujo
Gráfico de flujo de análisis y creación eficiente