La Inteligencia Artificial (IA) ha emergido como una de las disciplinas más fascinantes y transformadoras en el mundo de la tecnología.
Este diccionario está diseñado para servir como una guía exhaustiva de términos relacionados con la Inteligencia Artificial, ofreciendo una visión detallada y accesible del extenso universo de conceptos que conforman esta emocionante área de estudio.
La Inteligencia Artificial se refiere a la capacidad de las máquinas para imitar la inteligencia humana y ejecutar tareas que normalmente requerirían la intervención humana.
Desde el aprendizaje automático hasta la visión por computadora, desde el procesamiento de lenguaje natural hasta la robótica, la IA abarca una amplia gama de campos interconectados.
Este diccionario está diseñado tanto para aquellos que son nuevos en el mundo de la IA como para aquellos que buscan profundizar en sus conocimientos, proporcionando definiciones claras y concisas, ejemplos ilustrativos y referencias cruzadas que permiten explorar a fondo cada concepto.
Ya sea que te estés adentrando en los fundamentos del aprendizaje automático, estudiando las complejidades de las redes neuronales, o explorando las implicaciones éticas de la inteligencia artificial, este diccionario está aquí para servir como tu compañero confiable. A medida que la IA sigue evolucionando y transformando nuestra sociedad, este diccionario también se actualizará para reflejar las últimas tendencias y desarrollos en este apasionante campo.
Explora, aprende y descubre el mundo de la Inteligencia Artificial a través de este diccionario de términos, y adéntrate en un viaje que te llevará desde los conceptos más básicos hasta las fronteras más avanzadas de esta revolucionaria disciplina.
Glosario de Términos y Definiciones de Inteligencia Artificial (IA)
Artificial Intelligence (AI) – Inteligencia Artificial (IA)
Se refiere a la simulación de la inteligencia humana en máquinas que están programadas para pensar y actuar como humanos.
Estas máquinas inteligentes pueden entrenarse para realizar diversas tareas procesando grandes cantidades de datos y aprendiendo de ellos.
Los sistemas de IA se pueden clasificar en dos categorías principales: limitados o generales.
Los sistemas estrechos de IA están diseñados para realizar tareas específicas, mientras que los sistemas generales de IA están diseñados para realizar cualquier tarea intelectual que pueda realizar un ser humano.
El objetivo final de la investigación de IA es crear sistemas que puedan comprender, pensar y actuar de manera inteligente, de una manera que no se pueda distinguir de un ser humano.
Action space -Espacio de acción
El conjunto de todas las acciones posibles que un agente puede tomar en un problema de aprendizaje por refuerzo.
Active learning -Aprendizaje Activo
El aprendizaje activo es una forma de aprendizaje automático semi supervisado en el que el algoritmo puede elegir de qué datos quiere aprender.
Con este enfoque, el programa puede consultar activamente una fuente de autoridad, ya sea el programador o un conjunto de datos etiquetado, para conocer la predicción correcta para un problema determinado.
El objetivo de este enfoque de aprendizaje iterativo es acelerar el proceso de aprendizaje, especialmente si no tiene un gran conjunto de datos etiquetados para practicar los métodos tradicionales de aprendizaje supervisado.
Una de las aplicaciones más populares para el aprendizaje activo se encuentra en el campo del procesamiento intensivo del lenguaje natural de etiquetado.
Este método puede producir resultados similares a los del aprendizaje supervisado, con una fracción de la participación humana.
Active learning – Red Adversaria Generativa
Una red antagónica generativa, o GAN, es un marco de red neuronal profunda que puede aprender de un conjunto de datos de entrenamiento y generar nuevos datos con las mismas características que los datos de entrenamiento.
Por ejemplo, una red adversaria generativa entrenada con fotografías de rostros humanos puede generar rostros de aspecto realista que son completamente ficticios.
Las redes antagónicas generativas consisten en dos redes neuronales, el generador y el discriminador, que compiten entre sí.
El generador está capacitado para producir datos falsos y el discriminador está capacitado para distinguir los datos falsos del generador de los ejemplos reales.
Si el generador produce datos falsos que el discriminador puede reconocer fácilmente como inverosímiles, como una imagen que claramente no es una cara, el generador es penalizado.
Con el tiempo, el generador aprende a generar ejemplos más plausibles.
Active learning – Métricas de evaluación
Las métricas de evaluación se utilizan para medir la calidad del modelo estadístico o de aprendizaje automático.
Evaluar modelos o algoritmos de aprendizaje automático es fundamental para cualquier proyecto.
Hay muchos tipos diferentes de métricas de evaluación disponibles para probar un modelo.
Estos incluyen precisión de clasificación, pérdida logarítmica, matriz de confusión y otros.
La precisión de la clasificación es la relación entre el número de predicciones correctas y el número total de muestras de entrada, que es a lo que generalmente nos referimos cuando usamos el término precisión.
La pérdida logarítmica, también llamada pérdida de registro, funciona penalizando las clasificaciones falsas.
Una matriz de confusión nos da una matriz como salida y describe el desempeño completo del modelo.
Hay otras métricas de evaluación que se pueden usar que no se han enumerado.
Las métricas de evaluación implican el uso de una combinación de estas métricas de evaluación individuales para probar un modelo o algoritmo.
Artificial neural network – Red neuronal artificial
Un tipo de algoritmo de aprendizaje automático modelado a partir de la estructura y función del cerebro humano, que consta de capas de «neuronas» interconectadas que pueden procesar y transmitir información.
Attention Models – Modelos de Atención
Los modelos de atención, o mecanismos de atención, son técnicas de procesamiento de entrada para redes neuronales que permiten que la red se centre en aspectos específicos de una entrada compleja, uno a la vez hasta que se categoriza todo el conjunto de datos.
El objetivo es dividir las tareas complicadas en áreas de atención más pequeñas que se procesan secuencialmente.
Similar a cómo la mente humana resuelve un nuevo problema al dividirlo en tareas más simples y resolverlas una por una.
Los modelos de atención requieren refuerzo continuo o entrenamiento de back popagation para ser efectivos.
Artificial neural network – Red neuronal artificial
Un tipo de algoritmo de aprendizaje automático modelado a partir de la estructura y función del cerebro humano, que consta de capas de «neuronas» interconectadas que pueden procesar y transmitir información.
Autoencoder – Codificador automático
Tipo de red neuronal utilizada para la reducción de la dimensionalidad y el aprendizaje de funciones, que consiste en un codificador y un decodificador que aprenden a comprimir y reconstruir datos respectivamente.
Bagging
Una técnica de conjunto de aprendizaje automático en la que se entrenan varios modelos en diferentes subconjuntos aleatorios de los datos de entrenamiento y se combinan para hacer predicciones, con el objetivo de reducir la varianza y mejorar la generalización del modelo.
Batch Normalization – Normalización por lotes
La normalización por lotes es una técnica de aprendizaje supervisado que convierte las salidas de la capa intermedia de una red neuronal en un formato estándar, llamado normalización.
Esto «restablece» efectivamente la distribución de la salida de la capa anterior para que la capa posterior la procese de manera más eficiente.
Bayes Theorem – Teorema de Bayes
El teorema de Bayes es una fórmula que rige cómo asignar un grado subjetivo de creencia a una hipótesis y actualizar racionalmente esa probabilidad con nueva evidencia. Matemáticamente, es la probabilidad de un evento.
Big Data
Grandes conjuntos de datos que se pueden analizar y utilizar para obtener información y tomar decisiones informadas.
Boosting – Impulsar
Una técnica de conjunto de aprendizaje automático en la que los alumnos débiles se combinan para formar un alumno fuerte, con el objetivo de mejorar la precisión general de la predicción.
ChatGPT
ChatGPT es un chatbot de OpenAI construido sobre su modelo de lenguaje grande GPT3.5, entrenado con datos públicos.
Classification – Clasificación
El proceso de categorizar datos en clases o grupos predefinidos.
Clustering – Agrupación
El proceso de agrupar puntos de datos en función de similitudes o características comunes.
Cognitive computing – Computación cognitiva
El desarrollo de sistemas informáticos que pueden realizar tareas que normalmente requieren una inteligencia similar a la humana, como el aprendizaje y la resolución de problemas.
Computer vision – Visión por computador
La capacidad de una computadora para interpretar y comprender datos visuales del mundo, como imágenes y videos.
Convolutional neural network – Red neuronal convolucional
Un tipo de red neuronal diseñada específicamente para tareas de reconocimiento de imágenes y videos, que utiliza capas convolucionales para aprender y reconocer patrones en los datos.
Convolutional neural network – Red neuronal convolucional
Una red neuronal convolucional, o CNN, es una red neuronal de aprendizaje profundo diseñada para procesar matrices estructuradas de datos, como imágenes.
Las redes neuronales convolucionales se utilizan ampliamente en la visión por computadora y se han convertido en el estado del arte para muchas aplicaciones visuales, como la clasificación de imágenes, y también han tenido éxito en el procesamiento del lenguaje natural para la clasificación de textos.
Las redes neuronales convolucionales son muy buenas para detectar patrones en la imagen de entrada, como líneas, degradados, círculos o incluso ojos y caras.
Es esta propiedad la que hace que las redes neuronales convolucionales sean tan poderosas para la visión artificial.
A diferencia de los algoritmos de visión por computadora anteriores, las redes neuronales convolucionales pueden operar directamente en una imagen sin procesar y no necesitan ningún procesamiento previo.
Cross-validation – Validación cruzada
Una técnica de evaluación de modelos en la que los datos de entrenamiento se dividen en varios pliegues y el modelo se entrena y evalúa en cada pliegue para obtener una estimación de su rendimiento de generalización.
Data mining – Procesamiento de datos
El proceso de extraer patrones y conocimientos útiles de grandes conjuntos de datos.
Decision tree – Árbol de decisión
Una estructura de árbol similar a un diagrama de flujo que se utiliza para tomar decisiones basadas en una serie de divisiones binarias.
Deep dream – Sueño profundo
Una técnica de generación de imágenes desarrollada por Google que utiliza una red neuronal convolucional para generar imágenes de ensueño al amplificar las funciones de la red.
Deep learning – Aprendizaje profundo
Un subcampo del aprendizaje automático que implica entrenar redes neuronales de varias capas para aprender y tomar decisiones por sí mismas.
Dimensionality reduction – Reducción de dimensionalidad
El proceso de reducir la cantidad de características o dimensiones en un conjunto de datos mientras se conserva la mayor cantidad de información posible.
Discount factor
Factor de descuento; El factor por el cual las recompensas futuras se descuentan en el algoritmo de aprendizaje por refuerzo, para equilibrar la compensación entre las recompensas a corto y largo plazo.
Dynamic programming
Programación dinámica; Un método para resolver problemas de optimización dividiéndolos en sub problemas más pequeños y almacenando las soluciones a estos sub problemas en una tabla o matriz.
Ensemble learning
Aprendizaje conjunto; Una técnica de aprendizaje automático en la que se entrenan y combinan varios modelos para hacer predicciones, con el objetivo de mejorar el rendimiento general del modelo.
Episode
Episodio; La secuencia de estados, acciones y recompensas que experimenta un agente en un problema de aprendizaje por refuerzo antes de llegar a un estado terminal.
Evolutionary computation
Computación evolutiva; Un conjunto de algoritmos que utilizan los principios de la evolución natural, como la reproducción, la mutación y la selección, para encontrar soluciones a los problemas.
Expert system
Experto en Sistemas; Un programa de computadora que utiliza técnicas de inteligencia artificial para imitar las habilidades de toma de decisiones de un experto humano en un campo específico.
Exploration – exploitation tradeoff
Intercambio de exploración-explotación; La tensión en el aprendizaje por refuerzo entre explorar nuevas acciones y explotar las buenas acciones conocidas, para equilibrar el aprendizaje y los objetivos de maximización de recompensas del agente.
Face recognition
Reconocimiento facial; El proceso de identificación y verificación de personas en función de sus rasgos faciales.
Feature engineering
Ingeniería de características; El proceso de seleccionar y crear funciones informativas y relevantes a partir de datos sin procesar para su uso en un modelo de aprendizaje automático.
Feature selection
Selección de características; El proceso de elegir un subconjunto de las funciones más relevantes de un conjunto más grande de funciones para usar en un modelo de aprendizaje automático.
Fine-Tuning
Sintonia FINA; Una técnica de aprendizaje automático que implica ajustar los hiperparámetros o parámetros de un modelo previamente entrenado en un nuevo conjunto de datos para optimizar su rendimiento para una tarea específica.
El ajuste fino se usa comúnmente cuando un modelo previamente entrenado está disponible para una tarea relacionada, pero los datos disponibles para la nueva tarea son limitados o la tarea de destino es ligeramente diferente de la tarea original.
Function approximation
Aproximación de funciones; El uso de una función para aproximar la función de valor o la política en un problema de aprendizaje por refuerzo, cuando los espacios de estado o acción son demasiado grandes para ser representados explícitamente.
Fuzzy logic
Lógica difusa; Una forma de lógica matemática que permite la incertidumbre y la imprecisión en la entrada y salida de un sistema.
GAN
GAN; Un tipo de modelo generativo que consta de dos redes neuronales en competencia, un generador y un discriminador, que aprenden a generar y reconocer datos sintéticos respectivamente.
Generative adversarial network
Red adversaria generativa; Un tipo de red neuronal que consta de dos redes en competencia, un generador y un discriminador, que aprenden a generar y reconocer datos sintéticos respectivamente.
Generative model
Modelo generativo; Un modelo de aprendizaje automático que aprende la distribución subyacente de los datos y puede generar nuevas muestras sintéticas a partir de ellos.
Genetic algorithms
Algoritmos genéticos; Algoritmo de búsqueda que utiliza los principios de la evolución natural, como la reproducción, la mutación y la selección, para encontrar soluciones a los problemas.
GPT
GPT; un gran modelo de lenguaje desarrollado por OpenAI que utiliza una arquitectura transformadora y un aprendizaje auto supervisado para generar texto similar al humano.
Heuristics
Heurística; Un método de resolución de problemas que implica encontrar una solución a través de prueba y error y aprender de experiencias pasadas.
Hyperparameter tuning
Ajuste de hiper parámetros; El proceso de ajuste de los parámetros de un modelo de aprendizaje automático que se establecen antes del entrenamiento, para mejorar su rendimiento.
Image annotation
Anotación de imagen; El proceso de etiquetar o anotar imágenes con información relevante, como clases de objetos o cuadros delimitadores.
Image captioning
Subtítulos de imagen; El proceso de generar una descripción en lenguaje natural de una imagen.
Image classification
Clasificación de imágenes; El proceso de asignar una imagen a una o más categorías o clases predefinidas.
Image colorization
Colorización de imagen; El proceso de agregar colores a una imagen en escala de grises.
Image enhancement
Mejora de la imagen; El proceso de mejorar la calidad visual de una imagen, como aumentar su contraste o eliminar el ruido.
Image generation
Generación de imágenes; El proceso de creación de nuevas imágenes sintéticas utilizando técnicas de inteligencia artificial.
Image preprocessing
Preprocesamiento de imágenes; El proceso de preparación de las imágenes para su uso.
Image restoration
Restauración de imagen; El proceso de reparar o restaurar una imagen degradada o dañada.
Image retrieval
Recuperación de imágenes; El proceso de buscar y recuperar imágenes de una gran base de datos en función de su contenido visual.
Image segmentation
Segmentación de imagen; El proceso de dividir una imagen en varias regiones o segmentos, cada uno de los cuales representa un objeto o fondo diferente.
Image-to-image translation
Traducción de imagen a imagen; El proceso de convertir una imagen de un dominio a otro, como convertir una fotografía en una pintura o un boceto.
Inference
Inferencia; El proceso de deducir conclusiones a partir de premisas usando razonamiento lógico.
Inpainting
Repintando; El proceso de reparar o rellenar partes dañadas o faltantes de una imagen.
K-medians
K-medians; Un algoritmo de aprendizaje automático no supervisado que se utiliza para agrupar puntos de datos en un número predefinido de grupos.
Knowledge representation
Representación del conocimiento; La forma en que el conocimiento se codifica y almacena en un sistema informático.
Language Model
Modelo de lenguaje; Un modelo de lenguaje en inteligencia artificial es un modelo estadístico que se utiliza para predecir la probabilidad de una secuencia de palabras o tokens en un idioma.
Los modelos de lenguaje se usan comúnmente en tareas de procesamiento de lenguaje natural para generar texto coherente y apropiado.
Large Language Model
Modelo de lenguaje grande; Un modelo de lenguaje grande en inteligencia artificial es un tipo de modelo estadístico que se entrena en un conjunto de datos de texto muy grande y utiliza técnicas de aprendizaje automático para aprender los patrones y la estructura del lenguaje.
Los modelos de lenguaje grande se usan comúnmente para tareas como la generación de lenguaje, la traducción automática y la clasificación de texto, y pueden generar texto similar al humano con un alto grado de coherencia y fluidez.
Machine learning
Machine learning ó Aprendizaje automático; Un método de entrenamiento de algoritmos que usa grandes cantidades de datos y permite que el algoritmo aprenda y mejore por sí solo sin programación explícita.
Markov decision process
Proceso de decisión de Markov; Un marco matemático utilizado en el aprendizaje por refuerzo para modelar el proceso de toma de decisiones de un agente en un entorno secuencial e incierto.
Markov property
Propiedad de Markov; La propiedad de un estado en un proceso de decisión de Markov que dice que el futuro es independiente del pasado, dado el estado presente.
Markov reward process
Proceso de recompensa de Markov; Un proceso de decisión de Markov que solo tiene un componente de recompensa, sin ninguna toma de decisiones involucrada.
Model
Modelo; Un modelo es una representación de un problema o un sistema que se puede usar para hacer predicciones, tomar decisiones o aprender patrones en los datos.
Los modelos son una parte fundamental del aprendizaje automático y se utilizan para realizar diversas tareas, como clasificación, regresión, agrupamiento o reducción de dimensionalidad.
Los modelos se pueden entrenar en un conjunto de datos utilizando varios algoritmos de aprendizaje automático, como aprendizaje supervisado, aprendizaje no supervisado o aprendizaje de refuerzo, para aprender las relaciones y patrones en los datos y hacer predicciones o decisiones basadas en ellos.
Model deployment
Despliegue del modelo; El proceso de hacer que un modelo de aprendizaje automático esté disponible para su uso en entornos de producción, como implementarlo en un servidor web o integrarlo en una aplicación.
Model evaluation
Evaluación del modelo; El proceso de medir el rendimiento de un modelo de aprendizaje automático en una tarea específica, utilizando métricas como exactitud, precisión y recuperación.
Model selection
Selección de modelo; El proceso de elegir el mejor modelo entre un conjunto de modelos candidatos para una tarea determinada.
Monte Carlo method
Método de Montecarlo; Un algoritmo de aprendizaje por refuerzo que utiliza muestreo aleatorio para estimar la función de valor o la política óptima.
Multi-armed bandit
Bandido de múltiples brazos; Un problema de aprendizaje por refuerzo en el que un agente debe elegir entre un conjunto de acciones, cada una con una distribución de recompensas desconocida, y aprender qué acciones son las más gratificantes a través de prueba y error.
Naive Bayes classifier
Clasificador Naive Bayes; Un algoritmo de aprendizaje automático utilizado para tareas de clasificación basado en el teorema de probabilidad de Bayes.
Natural language processing
Procesamiento natural del lenguaje; La capacidad de una computadora para comprender, interpretar y generar lenguaje humano.
Neural network
Red neuronal; Un tipo de algoritmo de aprendizaje automático modelado a partir de la estructura y función del cerebro humano, que consta de capas de «neuronas» interconectadas que pueden procesar y transmitir información.
Normalization
Normalización; El proceso de escalar los valores de una característica o un conjunto de datos a un rango común, como [0, 1] o [-1, 1].
Object detection
Detección de objetos; El proceso de identificar y localizar objetos en una imagen o un video.
Ontology
Ontología; Un sistema que representa las relaciones y categorías dentro de un dominio particular de conocimiento.
Optimal policy
Política óptima; La política que maximiza la recompensa acumulada esperada en un problema de aprendizaje por refuerzo.
Optimal value function
Función de valor óptimo; La función de valor que corresponde a la política óptima en un problema de aprendizaje por refuerzo.
Overfitting
Sobreajuste; Una condición en la que un modelo de aprendizaje automático funciona bien con los datos de entrenamiento, pero deficiente con los datos nuevos e invisibles, debido a que es demasiado complejo y se adapta al ruido de los datos de entrenamiento.
Pattern recognition -Reconocimiento de patrones
La capacidad de identificar patrones o regularidades en los datos.
Planning
Planificación; El proceso de determinar un curso de acción para lograr una meta específica.
Policy iteration
Iteración de políticas; Un algoritmo de aprendizaje por refuerzo que consiste en alternar entre evaluar la política actual y mejorarla en función de la función de valor aprendido.
Preprocessing
Preprocesamiento; El proceso de preparación de los datos para su uso en un modelo de aprendizaje automático, incluida la limpieza, la transformación y el escalado de los datos.
Q-Learning
Q-aprendizaje; Un algoritmo de aprendizaje por refuerzo que aprende una función de valor de acción, también conocida como función Q, que estima las recompensas futuras esperadas para cada acción en un estado determinado.
Reasoning
Razonamiento; El proceso de sacar conclusiones basadas en evidencia y argumentos lógicos.
Recurrent neural network
Red neuronal recurrente; Un tipo de red neuronal diseñada específicamente para procesar datos secuenciales, utilizando conexiones de retroalimentación para permitir que la red recuerde y haga uso de información pasada.
Regression
Regresión; Una técnica de aprendizaje automático utilizada para predecir un valor numérico continuo basado en un conjunto de características de entrada.
Reinforcement learning
Aprendizaje reforzado; Un tipo de aprendizaje automático en el que un agente aprende a través de prueba y error al interactuar con su entorno y recibir recompensas o castigos por sus acciones.
Reinforcement Learning From Human Feedback
Aprendizaje por refuerzo a partir de la retroalimentación humana; Un tipo de técnica de aprendizaje automático en la que un sistema de inteligencia artificial (IA) aprende de los comentarios o recompensas proporcionados por un usuario o entrenador humano.
Reward function
Función de recompensa; La función que define la recompensa o el castigo que recibe un agente por sus acciones en un problema de aprendizaje por refuerzo.
Robotics
Robótica; El estudio y aplicación de robots y automatización.
SARSA
SARAS; Un algoritmo de aprendizaje por refuerzo que aprende una función de acción-valor utilizando la recompensa esperada y el valor de la siguiente acción, en lugar de la recompensa final como en Q-learning.
Semantic web
Web semántica; Una extensión de la World Wide Web que permite a las máquinas comprender el significado de los datos en la web.
Stable Diffusion
Stable Diffusion es un modelo de texto a imagen basado en aprendizaje profundo que puede generar imágenes muy detalladas basadas en descripciones de texto.
Standardization
Estandarización; El proceso de transformar los valores de una característica o un conjunto de datos para tener una media cero y una varianza unitaria.
State space
Espacio de Estados; El conjunto de todos los estados posibles en un problema de aprendizaje por refuerzo.
State transition
Transición de estado; El movimiento del agente de un estado a otro estado en un problema de aprendizaje por refuerzo, basado en una acción y las probabilidades de transición del entorno.
Style transfer
Transferencia de estilo; El proceso de transferir el estilo de una imagen a otra imagen, conservando el contenido de la segunda imagen.
Super-resolution
Súper resolución; El proceso de aumentar la resolución de una imagen o un video completando los detalles que faltan.
Support vector machine
Máquinas de vectores soporte; Un algoritmo de aprendizaje automático utilizado para tareas de clasificación y regresión.
Temporal difference learning
Aprendizaje de diferencia temporal; Un algoritmo de aprendizaje por refuerzo que utiliza el error de diferencia temporal, la diferencia entre las recompensas futuras estimadas y reales, para actualizar la función de valor de acción.
Text-to-image model
Modelo de texto a imagen; Un sistema de aprendizaje automático que genera imágenes basadas en descripciones en lenguaje natural.
Training
Capacitación; El entrenamiento se refiere al proceso de aprender de los datos para mejorar el rendimiento de un modelo o sistema.
El entrenamiento es una parte fundamental del aprendizaje automático e implica alimentar un modelo con un conjunto de datos y ajustar sus parámetros o pesos para optimizar su rendimiento para una tarea específica.
Trajectory
Trayectoria; La secuencia de estados y acciones que sigue un agente en un problema de aprendizaje por refuerzo.
Transfer learning
Transferencia de aprendizaje; Una técnica de aprendizaje automático en la que un modelo entrenado en una tarea se ajusta o adapta para una tarea relacionada.
Underfitting
Subequipamiento; Una condición en la que un modelo de aprendizaje automático tiene un rendimiento deficiente tanto en el entrenamiento como en los datos nuevos e invisibles, debido a que es demasiado simple y no puede capturar los patrones subyacentes en los datos.
Value iteration
Iteración de valor; Un algoritmo de aprendizaje por refuerzo que implica mejorar iterativamente la función de valor hasta que converge a la función de valor óptima.
Variational autoencoder
Codificador automático variacional; Un tipo de modelo generativo que consta de una red codificadora que asigna los datos de entrada a una representación latente y una red decodificadora que asigna la representación latente al espacio de datos original.