Buscar
Cerrar este cuadro de búsqueda.

DALL·E 2: Sistema Inteligencia Artificial IA para crear imágenes

 

DALL·E es un sistema de IA que crea imágenes a partir de un texto.

 

Entrenado con una red neuronal que crea imágenes a partir de subtítulos de texto para una amplia gama de conceptos expresados en lenguaje natural.

 

DALL·E es el acrónimo de WALL·E y Salvador Dalí.

 

Utiliza una versión de 12 mil millones de parámetros del modelo GPT-3 Transformer para interpretar las entradas del lenguaje natural y generar las correspondientes imágenes.​

 

Puede crear imágenes de objetos realistas así como objetos que no existen en la realidad.

 

¿Que es DALL·E?

 

DALL·E  es un programa de software de Inteligencia Artificial que crea imágenes a partir de descripciones textuales.

 

Su lanzamiento oficial por OpenAI fue el 5 de enero de 2021.​

 

DALL-E es capaz de generar imágenes a partir de indicaciones de lenguaje natural, que «comprende».

 

Las imágenes que genera DALL-E están seleccionadas por CLIP (Contrastive Language-Image Pre-training o Pre-entrenamiento de Imagen-Lenguaje Contrastante) que presenta las imágenes de más alta calidad. ​

 

OpenAI no publica el código fuente de cualquiera de los modelos.​

 

 

El modelo Generative Pre-Training Transformer (GPT) fue desarrollado inicialmente por OpenAI en 2018, utilizando la arquitectura Transformer.

 

DALL·E es una versión de 12 mil millones de parámetros de GPT-3 entrenada para generar imágenes a partir de descripciones de texto, utilizando un conjunto de datos de pares de texto e imágenes.

 

Tiene diversas capacidades, como la creación de versiones antropomórficas de animales y objetos, la combinación de conceptos no relacionados de manera plausible, la representación de texto y la aplicación de transformaciones a imágenes existentes.

 

¿Qué es DALL·E 2?

 

DALL·E 2 es un sistema de IA que puede crear imágenes y arte realistas a partir de una descripción en lenguaje natural.

 

Crea imágenes, arte originales y realistas a partir de una descripción del texto, combinando conceptos, atributos y estilos.

 

DALL·E 2 puede expandir imágenes más allá de lo que hay en el lienzo original, creando nuevas composiciones expansivas.

 

Puede realizar ediciones realistas en imágenes existentes a partir de una leyenda en lenguaje natural, agregando y eliminando elementos teniendo en cuenta las sombras, los reflejos y las texturas.

 

Toma una imagen y crear diferentes variaciones del mismo inspiradas en el original.

 

DALL·E 2 ha aprendido la relación entre las imágenes y el texto que las describe.

 

Utiliza un proceso llamado «difusión», que comienza con un patrón de puntos aleatorios y altera gradualmente ese patrón hacia una imagen cuando reconoce aspectos específicos de esa imagen.

 

Las mitigaciones de seguridad que han desarrollado incluyen:

 

 

Prevención de generaciones dañinas;

 

Limitando la capacidad de DALL·E 2 para generar imágenes violentas, de odio o para adultos.

 

Al eliminar el contenido más explícito de los datos de entrenamiento, minimizamos la exposición de DALL·E 2 a estos conceptos.

 

Utilizando técnicas avanzadas para evitar generaciones fotorrealistas de rostros de personas reales, incluidos los de figuras públicas.

 

 

Frenar el mal uso;

 

Su política de contenido no permite que los usuarios generen contenido violento, para adultos o político, entre otras categorías.

 

Impidiendo que se generen imágenes si los filtros identifican avisos de texto y cargas de imágenes que pueden violar las políticas.

 

Disponen de sistemas de monitoreo automatizados y humanos para protegerse contra el uso indebido.

 

 

Implementación por fases basada en el aprendizaje;

 

Aprende del uso en el mundo real, como parte importante del desarrollo y la implementación de la IA de manera responsable.

 

Su meta que las personas puedan expresarse de manera creativa.

 

Comprendiendo cómo los sistemas avanzados de IA ven y entienden el mundo, con intención de crear una IA que beneficie a la humanidad.

 

 

 

 

Referencias;

openai.com/dall-e-2/

openai.com/blog/dall-e/

 

Imagen; fondo-abstracto-azul-tecnologia-hud > de pikisuperstar > en Freepik > freepik.es