El sistema de inteligencia artificial supera a la supercomputadora en simulación de combustión

Sistemas Cerebras, que crea una computadora de IA especializada basada en chip más grande jamás fabricado, está saliendo de su papel original como potencia de entrenamiento de redes neuronales y orientando sus talentos hacia la informática científica más tradicional. En una simulación con 500 millones de variables, el CS-1 derrotó a la 69ª supercomputadora más poderosa del mundo.

También resolvió el problema—Combustión en una central eléctrica de carbón—más rápido que la llama del mundo real que simula. Para colmo, Cerebras y sus socios en el Centro Nacional de Tecnología de Energía de EE. UU. Afirman que el CS-1 realizó la hazaña más rápido que cualquier CPU o supercomputadora basada en GPU actual.

los investigación, que se presentó esta semana en la conferencia de supercomputación SC20, muestra que la arquitectura de inteligencia artificial de Cerebras “no es un pony de un solo truco”, dice el CEO de Cerebras, Andrew Feldman.


El pronóstico del tiempo, el diseño de alas de avión, la predicción de temperaturas en una planta de energía nuclear y muchos otros problemas complejos se resuelven simulando “el movimiento de los fluidos en el espacio a lo largo del tiempo”, dice. La simulación divide el mundo en un conjunto de cubos, modela el movimiento del fluido en esos cubos y determina las interacciones entre los cubos. Puede haber 1 millón o más de estos cubos y se pueden necesitar 500 000 variables para describir lo que está sucediendo.

Según Feldman, para resolver eso se necesita un sistema informático con muchos núcleos de procesador, toneladas de memoria muy cerca de los núcleos, montones de ancho de banda que conectan los núcleos y la memoria, y un montón de ancho de banda que conecta los núcleos. Convenientemente, eso es lo que también necesita una computadora de entrenamiento de red neuronal. El CS-1 contiene una sola pieza de silicio con 400.000 núcleos, 18 gigabytes de memoria, 9 petabytes de ancho de banda de memoria y 100 petabits por segundo de ancho de banda de núcleo a núcleo.


Los científicos de NETL simularon la combustión en una central eléctrica utilizando tanto un Cerebras CS-1 como el superordenador Joule, que tiene 84.000 núcleos de CPU y consume 450 kilovatios. En comparación, Cerebras funciona con unos 20 kilovatios. Joule completó el cálculo en 2,1 milisegundos. El CS-1 fue más de 200 veces más rápido y terminó en 6 microsegundos.

Esta velocidad tiene dos implicaciones, según Feldman. Una es que no existe una combinación de CPU o incluso de GPU en la actualidad que pueda superar al CS-1 en este problema. Él respalda esto señalando la naturaleza de la simulación: no escala bien. Así como puede tener demasiados cocineros en la cocina, arrojar demasiados núcleos a un problema en realidad puede ralentizar el cálculo. La velocidad de Joule alcanzó su punto máximo cuando usó 16,384 de sus 84,000 núcleos.

La limitación proviene de la conectividad entre los núcleos y entre los núcleos y la memoria. Imagine el volumen que se va a simular como una pila de cubos de 370 x 370 x 370 (136,900 pilas verticales con 370 capas). Cerebras asigna el problema al chip de escala de obleas asignando la matriz de pilas verticales a una matriz correspondiente de núcleos de procesador. Debido a esa disposición, la comunicación de los efectos de un cubo sobre otro se realiza mediante la transferencia de datos entre núcleos vecinos, que es lo más rápido posible. Y mientras se calcula cada capa de la pila, los datos que representan las otras capas residen dentro de la memoria del núcleo, donde se puede acceder rápidamente.

(Cerebras aprovecha un tipo similar de mapeo geométrico al entrenar redes neuronales.[Verbarralateral”[Seesidebar“[Verbarralateral”[Seesidebar“El lado del software de Cerebras, ”Enero de 2020.])

Y debido a que la simulación se completó más rápido que el evento de combustión del mundo real que se está simulando, el CS-1 ahora podría tener un nuevo trabajo en sus manos: desempeñar un papel en los sistemas de control para máquinas complejas.

Feldman informa que el SC-1 también ha avanzado en el propósito para el que fue construido originalmente. El fabricante de medicamentos GlaxoSmithKline es un cliente conocido, y el SC-1 está realizando trabajos de inteligencia artificial en el Laboratorio Nacional Argonne y el Laboratorio Nacional Lawrence Livermore, el Centro de Supercomputación de Pittsburgh. Dice que hay varios clientes que no puede nombrar en las industrias militar, de inteligencia y de fabricación pesada.

Se está trabajando en un SC-1 de próxima generación, dice. La primera generación utilizada TSMC Proceso de 16 nanómetros, pero Cerebras ya tiene una versión de 7 nanómetros en la mano con más del doble de memoria (40 GB) y el número de núcleos de procesador de IA (850.000).

El sistema de inteligencia artificial supera a la supercomputadora en simulación de combustión

Related Stories

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí