DALL·E es un sistema de IA que crea imágenes a partir de un texto.
Entrenado con una red neuronal que crea imágenes a partir de subtítulos de texto para una amplia gama de conceptos expresados en lenguaje natural.
DALL·E es el acrónimo de WALL·E y Salvador Dalí.
Utiliza una versión de 12 mil millones de parámetros del modelo GPT-3 Transformer para interpretar las entradas del lenguaje natural y generar las correspondientes imágenes.
Puede crear imágenes de objetos realistas así como objetos que no existen en la realidad.
¿Que es DALL·E?
DALL·E es un programa de software de Inteligencia Artificial que crea imágenes a partir de descripciones textuales.
Su lanzamiento oficial por OpenAI fue el 5 de enero de 2021.
DALL-E es capaz de generar imágenes a partir de indicaciones de lenguaje natural, que «comprende».
Las imágenes que genera DALL-E están seleccionadas por CLIP (Contrastive Language-Image Pre-training o Pre-entrenamiento de Imagen-Lenguaje Contrastante) que presenta las imágenes de más alta calidad.
OpenAI no publica el código fuente de cualquiera de los modelos.
El modelo Generative Pre-Training Transformer (GPT) fue desarrollado inicialmente por OpenAI en 2018, utilizando la arquitectura Transformer.
DALL·E es una versión de 12 mil millones de parámetros de GPT-3 entrenada para generar imágenes a partir de descripciones de texto, utilizando un conjunto de datos de pares de texto e imágenes.
Tiene diversas capacidades, como la creación de versiones antropomórficas de animales y objetos, la combinación de conceptos no relacionados de manera plausible, la representación de texto y la aplicación de transformaciones a imágenes existentes.
¿Qué es DALL·E 2?
DALL·E 2 es un sistema de IA que puede crear imágenes y arte realistas a partir de una descripción en lenguaje natural.
Crea imágenes, arte originales y realistas a partir de una descripción del texto, combinando conceptos, atributos y estilos.
DALL·E 2 puede expandir imágenes más allá de lo que hay en el lienzo original, creando nuevas composiciones expansivas.
Puede realizar ediciones realistas en imágenes existentes a partir de una leyenda en lenguaje natural, agregando y eliminando elementos teniendo en cuenta las sombras, los reflejos y las texturas.
Toma una imagen y crear diferentes variaciones del mismo inspiradas en el original.
DALL·E 2 ha aprendido la relación entre las imágenes y el texto que las describe.
Utiliza un proceso llamado «difusión», que comienza con un patrón de puntos aleatorios y altera gradualmente ese patrón hacia una imagen cuando reconoce aspectos específicos de esa imagen.
Las mitigaciones de seguridad que han desarrollado incluyen:
Prevención de generaciones dañinas;
Limitando la capacidad de DALL·E 2 para generar imágenes violentas, de odio o para adultos.
Al eliminar el contenido más explícito de los datos de entrenamiento, minimizamos la exposición de DALL·E 2 a estos conceptos.
Utilizando técnicas avanzadas para evitar generaciones fotorrealistas de rostros de personas reales, incluidos los de figuras públicas.
Frenar el mal uso;
Su política de contenido no permite que los usuarios generen contenido violento, para adultos o político, entre otras categorías.
Impidiendo que se generen imágenes si los filtros identifican avisos de texto y cargas de imágenes que pueden violar las políticas.
Disponen de sistemas de monitoreo automatizados y humanos para protegerse contra el uso indebido.
Implementación por fases basada en el aprendizaje;
Aprende del uso en el mundo real, como parte importante del desarrollo y la implementación de la IA de manera responsable.
Su meta que las personas puedan expresarse de manera creativa.
Comprendiendo cómo los sistemas avanzados de IA ven y entienden el mundo, con intención de crear una IA que beneficie a la humanidad.
Referencias;
openai.com/dall-e-2/
openai.com/blog/dall-e/
Imagen; fondo-abstracto-azul-tecnologia-hud > de pikisuperstar > en Freepik > freepik.es