PR Newswire
SAN JOSÉ, California, 3 de abril de 2025
– Los primeros sistemas Supermicro NVIDIA HGX™ B200 del mercado demuestran su liderazgo en rendimiento de IA con los resultados de MLPerf® Inference v5.0
– Las últimas pruebas demuestran que los sistemas Supermicro con NVIDIA B200 superan a la generación anterior con el triple de generación de tokens por segundo
SAN JOSÉ, California, 3 de abril de 2025 /PRNewswire/ — Super Micro Computer, Inc. (SMCI), proveedor de soluciones informáticas integrales para IA/ML, HPC, nube, almacenamiento y 5G/Edge, anuncia el primer rendimiento líder del mercado en varias pruebas de referencia MLPerf Inference v5.0, utilizando NVIDIA HGX™ B200 8-GPU. Los sistemas 4U con refrigeración líquida y 10U con refrigeración por aire lograron el mejor rendimiento en las pruebas seleccionadas. Supermicro demostró más de 3 veces la generación de tokens por segundo (Token/s) para las referencias Llama2-70B y Llama3.1-405B en comparación con los sistemas H200 8-GPU.

«Supermicro sigue siendo un líder en la industria de la IA, como lo demuestran los primeros nuevos puntos de referencia publicados por MLCommons en 2025», comentó Charles Liang, presidente y consejero delegado de Supermicro. «Nuestra arquitectura de bloques de construcción nos permite ser los primeros en llegar al mercado con una diversa gama de sistemas optimizados para diversas cargas de trabajo. Seguimos colaborando estrechamente con NVIDIA para afinar nuestros sistemas y asegurar una posición de liderazgo en las cargas de trabajo de IA».
Aprenda más acerca de las referencias MLPerf v5.0 Inference en: https://mlcommons.org/benchmarks/inference-datacenter/
Supermicro es el único proveedor de sistemas que publica un rendimiento de inferencia MLPerf récord (en pruebas de rendimiento seleccionadas) para los sistemas NVIDIA HGX™ B200 8-GPU refrigerados por aire y por líquido. Tanto los sistemas refrigerados por aire como los refrigerados por líquido estaban operativos antes de la fecha de inicio de ,la referencia MLCommons. Los ingenieros de Supermicro optimizaron los sistemas y el software para mostrar el impresionante rendimiento. Dentro del margen operativo, el sistema B200 refrigerado por aire de Supermicro mostró el mismo nivel de rendimiento que el sistema B200 refrigerado por líquido. Supermicro ha estado entregando estos sistemas a los clientes mientras realizábamos las pruebas comparativas.
MLCommons hace hincapié en que todos los resultados sean reproducibles, que los productos estén disponibles y que los resultados puedan ser auditados por otros miembros de MLCommons. Los ingenieros de Supermicro optimizaron los sistemas y el software, tal y como permiten las normas de MLCommons.
El SYS-421GE-NBRT-LCC (8x NVIDIA B200-SXM-180GB) y el SYS-A21GE-NBRT (8x NVIDIA B200-SXM-180GB) mostraron liderazgo en rendimiento ejecutando los benchmarks Mixtral 8x7B Inference, Mixture of Experts con 129.000 tokens/segundo. El sistema basado en NVIDIA B200 refrigerado por aire y líquido de Supermicro proporcionó más de 1.000 tokens/segundo de inferencia para el modelo de gran tamaño Llama3.1-405b, mientras que las generaciones anteriores de sistemas de GPU obtuvieron resultados mucho menores. Para tareas de inferencia más pequeñas, utilizando la referencia LLAMA2-70b, un sistema Supermicro con la NVIDIA B200 SXM-180GB instalada muestra el mayor rendimiento de un proveedor de sistemas de nivel 1.
Específicamente:
- Stable Diffusion XL (Servidor)SYS-A21GE-NBRT (8x B200-SXM-180GB)#1 queries/s, 28.92
- llama2-70b-interactive-99 (Servidor)SYS-A21GE-NBRT (8x B200-SXM-180GB)#1 Tokens/s, 62,265.70
- Llama3.1-405b (offline)SYS-421GE-NBRT-LCC (8xB200-SXM-180GB)#1 Tokens/s 1521.74
- Llama3.1-405b (Servidor)SYS-A21GE-NBRT (8x B200-SXNM-180GB)#1 Tokens/s, 1080.31 (para un nodo 8-GPU)
- mixtral-8x7b (Servidor)SYS-421GE-NBRT-LCC (8x B200-SXM-180GB)#1 Tokens/s, 129,047.00
- mixtral-8x7b (Offline)SYS-421GE-NBRT-LCC (8x B200-SXM-180GB)#1 Tokens/s, 128,795.00
«MLCommons felicita a Supermicro por su participación en la referencia MLPerf Inference v5.0. Nos complace ver que sus resultados muestran un aumento significativo del rendimiento en comparación con las generaciones anteriores de sistemas», explicó David Kanter, director de MLPerf en MLCommons. «Los clientes estarán encantados con las mejoras de rendimiento conseguidas, validadas por los resultados neutrales, representativos y reproducibles de MLPerf.»
Supermicro ofrece una cartera completa de IA con más de 100 sistemas optimizados para GPU, tanto opciones refrigeradas por aire como por líquido, con una selección de CPU, que van desde sistemas optimizados para un solo zócalo hasta sistemas multiprocesador de 8 vías. Los sistemas Supermicro a escala de bastidor incluyen componentes informáticos, de almacenamiento y de red, lo que reduce el tiempo necesario para instalarlos una vez que se entregan en las instalaciones del cliente.
Los sistemas NVIDIA HGX B200 8-GPU de Supermicro utilizan tecnología de refrigeración líquida y por aire de última generación. Las placas frías de nuevo desarrollo y la nueva unidad de distribución de refrigerante (CDU) de 250 kW duplican con creces la capacidad de refrigeración de la generación anterior en el mismo factor de forma 4U. Disponible en configuraciones de 42U, 48U o 52U, el diseño a escala de rack con los nuevos colectores verticales de distribución de refrigerante (CDM) ya no ocupa valiosas unidades de rack. Esto permite instalar ocho sistemas con 64 GPU NVIDIA Blackwell en un rack de 42U y hasta 12 sistemas con 96 GPU NVIDIA Blackwell en un rack de 52U.
El nuevo sistema NVIDIA HGX B200 de 10U refrigerado por aire presenta un chasis rediseñado con mayor margen térmico para alojar ocho GPU TDP Blackwell de 1.000 W. Pueden instalarse hasta 4 de los nuevos sistemas de 10U refrigerados por aire y totalmente integrados en un rack, la misma densidad que la generación anterior, a la vez que proporcionan hasta 15 veces más rendimiento de inferencia y 3 veces más de formación.
Acerca de Super Micro Computer, Inc.
Supermicro (NASDAQ: SMCI) es líder mundial en soluciones de TI totales optimizadas para aplicaciones. Fundada y operando en San José, California, Supermicro se compromete a ofrecer innovación de primera en el mercado para la empresa, la nube, la IA y la infraestructura de TI 5G Telco/Edge. Somos un proveedor de Soluciones de TI Totales con servidores, IA, almacenamiento, IoT, sistemas de conmutación, software y servicios de soporte. La experiencia en diseño de placas base, alimentación y chasis de Supermicro facilita aún más nuestro desarrollo y producción, permitiendo la innovación de próxima generación desde la nube hasta el borde para nuestros clientes globales. Nuestros productos se diseñan y fabrican internamente (en Estados Unidos, Taiwán y los Países Bajos), aprovechando las operaciones globales para la escala y la eficiencia y optimizados para mejorar el coste total de propiedad y reducir el impacto medioambiental (informática ecológica). La galardonada cartera de Server Building Block Solutions® permite a los clientes optimizar para su carga de trabajo y aplicación exactas mediante la selección de una amplia familia de sistemas construidos a partir de nuestros bloques de construcción flexibles y reutilizables que admiten un amplio conjunto de factores de forma, procesadores, memoria, GPU, almacenamiento, redes, energía y soluciones de refrigeración (climatizada, refrigeración por aire libre o refrigeración líquida).
Supermicro, Server Building Block Solutions y We Keep IT Green son marcas comerciales y/o marcas registradas de Super Micro Computer, Inc.
Todas las demás marcas, nombres y marcas registradas pertenecen a sus respectivos propietarios.

Foto – https://mma.prnewswire.com/media/2656893/Super_Micro_Computer_MLPerf.jpg
Logo – https://mma.prnewswire.com/media/1443241/Supermicro_Logo.jpg