Un nuevo agente de IA desarrolla algoritmos para matemáticas y aplicaciones prácticas en informática.
Al combinar la creatividad de grandes modelos de lenguaje con evaluadores automatizados.
Los grandes modelos de lenguaje LLM son muy versátiles.
Pueden resumir documentos, generar código o incluso generar nuevas ideas.
Estas capacidades han avanzado para abordar problemas fundamentales y de alta complejidad en matemáticas e informática moderna.
AlphaEvole es un agente de codificación evolutiva basado en grandes modelos de lenguaje para el descubrimiento y la optimización de algoritmos de propósito general.
Combina las capacidades creativas de resolución de problemas de modelos Gemini con evaluadores automatizados.
Que verifican las respuestas y utiliza un marco evolutivo para mejorar las ideas más prometedoras.
Mejorando la eficiencia de los centros de datos de Google, el diseño de chips y los procesos de entrenamiento de IA, incluyendo el entrenamiento de los grandes modelos de lenguaje que sustentan AlphaEvolve.
También ha ayudado a diseñar algoritmos de multiplicación de matrices más rápidos y a encontrar nuevas soluciones a problemas matemáticos sin resolver.
Mostrando un gran potencial de aplicación en diversas áreas.
Diseño de mejores algoritmos con grandes modelos de lenguaje
En 2023, se demostró por primera vez que los modelos de lenguaje de gran tamaño pueden generar funciones escritas en código informático.
Para ayudar a descubrir conocimiento nuevo y demostrablemente correcto sobre un problema científico abierto.
Es un agente que puede ir más allá del descubrimiento de una sola función para evolucionar bases de código completas y desarrollar algoritmos mucho más complejos.
Aprovecha un conjunto de modelos de lenguaje de gran tamaño: el modelo más rápido y eficiente, Gemini Flash, maximiza la amplitud de las ideas exploradas, mientras que el modelo más potente, Gemini Pro, proporciona una profundidad crítica con sugerencias perspicaces.
Estos modelos proponen programas informáticos que implementan soluciones algorítmicas como código.
Diagrama que muestra cómo el muestreador de indicaciones crea primero una indicación para los modelos de lenguaje, que luego generan nuevos programas.
Estos programas son evaluados por evaluadores y almacenados en la base de datos de programas.
Esta base de datos implementa un algoritmo evolutivo que determina qué programas se utilizarán para futuras indicaciones.
Verifica, ejecuta y califica los programas propuestos mediante métricas de evaluación automatizadas.
Estas métricas proporcionan una evaluación objetiva y cuantificable de la precisión y calidad de cada solución.
Esto hace que AlphaEvolve sea especialmente útil en una amplia gama de áreas donde el progreso puede medirse de forma clara y sistemática, como en matemáticas e informática.
Optimizando el ecosistema informático
Se han implementado algoritmos descubiertos por AlphaEvolve en todo el ecosistema informático de Google, incluyendo centros de datos, hardware y software.
El impacto de cada una de estas mejoras se multiplica en la infraestructura de IA y computación para construir un ecosistema digital más potente y sostenible para todos los usuarios.
Diagrama que muestra cómo AlphaEvolve ayuda a Google a ofrecer un ecosistema digital más eficiente.
Desde la programación del centro de datos y el diseño de hardware hasta el entrenamiento de modelos de IA.
Mejora de la programación del centro de datos
AlphaEvolve descubrió una heurística sencilla pero eficaz para ayudar a Borg a orquestar los vastos centros de datos de Google de forma más eficiente.
Esta solución, en producción desde hace más de un año, recupera continuamente, en promedio, el 0,7 % de los recursos informáticos globales de Google.
Esta mejora sostenida de la eficiencia significa que, en cualquier momento, se pueden completar más tareas con la misma huella computacional.
La solución de AlphaEvolve no solo ofrece un alto rendimiento, sino que también ofrece importantes ventajas operativas de código legible: interpretabilidad, depuración, previsibilidad y facilidad de implementación.
Asistencia en el diseño de hardware
AlphaEvolve propuso una reescritura de Verilog que eliminó bits innecesarios en un circuito aritmético clave y altamente optimizado para la multiplicación de matrices.
Es crucial que la propuesta supere métodos de verificación robustos para confirmar que el circuito modificado mantiene su correcto funcionamiento.
Esta propuesta se integró en una futura Unidad de Procesamiento Tensorial TPU, el acelerador de IA personalizado de Google.
Al sugerir modificaciones en el lenguaje estándar de los diseñadores de chips, promueve un enfoque colaborativo entre los ingenieros de IA y de hardware para acelerar el diseño de futuros chips especializados.
Mejora del entrenamiento y la inferencia de la IA
Al encontrar formas más inteligentes de dividir una gran operación de multiplicación de matrices en subproblemas más manejables, aceleró este núcleo vital de la arquitectura de Gemini en un 23 %
Lo que resultó en una reducción del 1 % en el tiempo de entrenamiento de Gemini.
Dado que el desarrollo de modelos de IA generativos requiere considerables recursos computacionales, cada aumento de eficiencia se traduce en un ahorro considerable.
Además de las mejoras de rendimiento, reduce significativamente el tiempo de ingeniería necesario para la optimización del núcleo.
De semanas de trabajo experto a días de experimentos automatizados, lo que permite a los investigadores innovar con mayor rapidez.
También puede optimizar instrucciones de GPU de bajo nivel.
Este dominio increíblemente complejo suele estar altamente optimizado por los compiladores, por lo que los ingenieros humanos no suelen modificarlo directamente.
AlphaEvolve logró una aceleración de hasta un 32,5 % en la implementación del kernel FlashAttention en modelos de IA basados en Transformer.
Este tipo de optimización ayuda a los expertos a identificar cuellos de botella en el rendimiento e incorporar fácilmente las mejoras en su código fuente, lo que aumenta su productividad y permite futuros ahorros en computación y energía.
Las fronteras de las matemáticas y el descubrimiento de algoritmos
También puede proponer nuevos enfoques para problemas matemáticos complejos.
Con un esqueleto de código mínimo para un programa informático, diseñó numerosos componentes de un novedoso procedimiento de optimización basad en gradientes.
Que descubrió múltiples algoritmos nuevos para la multiplicación de matrices, un problema fundamental en informática.
El procedimiento de AlphaEvolve encontró un algoritmo para multiplicar matrices complejas de 4×4 mediante 48 multiplicaciones escalares, lo que mejora el algoritmo de Strassen de 1969, considerado el mejor en este contexto.
Este hallazgo demuestra que es un avance significativo, AlphaTensor, especializado en algoritmos de multiplicación de matrices, que para matrices de 4×4 solo encontró mejoras en la aritmética binaria.
Para investigar la amplitud de AlphaEvolve, aplica el sistema a más de 50 problemas abiertos de análisis matemático, geometría, combinatoria y teoría de números.
La flexibilidad del sistema permitió configurar la mayoría de los experimentos en cuestión de horas.
En aproximadamente el 75 % de los casos, redescubrió soluciones de vanguardia, según el conocimiento.
En el 20 % de los casos, AlphaEvolve mejoró las soluciones previamente más conocidas, logrando avances en los problemas abiertos correspondientes.
Por ejemplo, avanzó en el problema del número de beso.
Este desafío geométrico ha fascinado a los matemáticos durante más de 300 años y se centra en el número máximo de esferas no superpuestas que tocan una esfera unitaria común.
Descubrió una configuración de 593 esferas externas y estableció un nuevo límite inferior en 11 dimensiones.
Muestra la progresión desde el descubrimiento de algoritmos para dominios específicos hasta el desarrollo de algoritmos más complejos para una amplia gama de desafíos del mundo real.
AlphaEvolve se aplica actualmente en matemáticas e informática, su naturaleza general permite su aplicación en cualquier problema cuya solución pueda describirse como un algoritmo y verificarse automáticamente.
Podría ser transformador en muchas otras áreas, como la ciencia de los materiales, el descubrimiento de fármacos, la sostenibilidad.
Aplicaciones tecnológicas y empresariales más amplias.







