Las CPU Xeon escalables de tercera generación de Intel ofrecen procesamiento de FPU de 16 bits


Intel tiene hoy sus procesadores escalables Xeon de tercera generación (es decir, Gold y Platinum), así como las nuevas generaciones de su memoria Optane-Persistent (léase: SSD con latencia extremadamente baja, larga vida) y Stratix AI-FPGA Productos anunciados.

El hecho de que AMD Intel actualmente supere a casi todas las métricas de rendimiento imaginables con la excepción de IA acelerada por hardware no es nuevo en este momento. Claramente, esto tampoco es una novedad para Intel, ya que la compañía no afirma el rendimiento de Xeon escalable en comparación con los procesadores Epyc Rome de la competencia. Más interesante aún, Intel apenas mencionó las cargas de trabajo informáticas de uso general.

Para encontrar una explicación para la única mejora de generación en generación que no requiere IA, es necesario saltar varias notas al pie. Con suficiente determinación, finalmente encontramos que la "ganancia de rendimiento promedio de 1.9 veces" mencionada en la diapositiva general se refiere a los puntos de referencia SPECrate 2017 "estimados o simulados", en los cuales un sistema Platinum 8380H de cuatro zócalos con un período de cinco años El sistema antiguo con cuatro bases se compara con E7-8890 v3.

Para ser justos, Intel parece haber introducido algunas innovaciones inusualmente impresionantes en el espacio de IA. Deep Learning Boost, que solía ser solo la marca del conjunto de instrucciones AVX-512, ahora incluye un nuevo tipo de datos de punto flotante de 16 bits.

Con generaciones anteriores de Xeon escalable, Intel fue pionero e instó a utilizar un entero de 8 bits – INT8 – procesamiento de inferencia con la biblioteca OpenVINO. Para las cargas de trabajo de inferencia, Intel argumentó que la menor precisión de INT8 era aceptable en la mayoría de los casos al tiempo que ofrecía una aceleración extrema de la tubería de inferencia. Sin embargo, para la capacitación, la mayoría de las aplicaciones requerían una mayor precisión del procesamiento de coma flotante de 32 bits de FP32 .

La nueva generación proporciona soporte para procesadores de coma flotante de 16 bits, que Intel llama bfloat16 . Reducir a la mitad el ancho de bits de los modelos FP32 acelera el procesamiento en sí, pero principalmente reduce a la mitad la RAM necesaria para mantener los modelos en la memoria. Para programadores y bases de código que usan modelos FP32 usar el nuevo tipo de datos es más fácil que convertirlo a un entero.

Intel también ha proporcionado un juego que se centra en la eficiencia del tipo de datos BF16. No podemos recomendarlo como un juego o como una herramienta de enseñanza.

Aceleración de la memoria Optane

Intel también anunció una nueva generación 25% más rápida de sus SSD Optane con "almacenamiento persistente" que puede acelerar significativamente la IA y otras tuberías de almacenamiento. Los SSD Optane funcionan más con la tecnología 3D Xpoint que los SSD flash NAND típicos. 3D Xpoint tiene un tiempo de escritura enormemente más largo y una latencia más baja que NAND. La menor latencia y el mayor tiempo de escritura lo hacen particularmente atractivo como tecnología de almacenamiento en caché rápido, que incluso puede acelerar todas las matrices de estado sólido.

La gran ventaja de esto es que la latencia extremadamente baja de Optane permite que las tuberías de IA aceleren, lo que a menudo conduce a cuellos de botella en la memoria, al acceder rápidamente a modelos que son demasiado grandes para permanecer completamente en RAM. Para las tuberías que involucran escrituras rápidas y pesadas, una capa de caché de optano también puede aumentar significativamente la esperanza de vida de la memoria primaria NAND subyacente al reducir el número total de escrituras que realmente deben comprometerse.

  Latencia versus IOPS con una carga de trabajo de lectura / escritura de 70/30. Las líneas naranja y verde son SSD NAND tradicionales para centros de datos. La línea azul es Optane.
Ampliar / Latencia versus IOPS con una carga de trabajo de lectura / escritura de 70/30. Las líneas naranja y verde son SSD NAND tradicionales para centros de datos. La línea azul es Optane.

Por ejemplo, un Optane con 256 GB tiene una especificación de resistencia de escritura de 360 ​​PB, mientras que un Samsung 850 Pro SSD con 256 GB solo está diseñado para una vida útil de 150 TB, una ventaja de más de 1,000: 1 para Optane.

Mientras tanto, esta excelente prueba realizada por Tom & # 39; s Hardware de 2019 muestra hasta qué punto Optane en polvo deja SSDs de calidad de centro de datos convencionales en términos de latencia.

Stratix 10 NX FPGAs

Finalmente, Intel anunció una nueva versión de su Stratix FPGA. Los arreglos de compuerta de campo programables se pueden usar como aceleración de hardware para algunas cargas de trabajo, lo que permite que los núcleos de CPU de uso más general realicen tareas que los FPGA no pueden realizar.

Imagen de listado de Intel

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *