Active Learning ó Aprendizaje Activo es una técnica de aprendizaje automático en la que el modelo se involucra activamente en el proceso de selección de datos para entrenarse.
En lugar de usar un conjunto de datos predefinido y etiquetado de manera uniforme, el modelo identifica las muestras más informativas y útiles para mejorar su desempeño.
Este enfoque es particularmente útil cuando el etiquetado de datos es costoso o requiere mucho tiempo.
Características Claves:
Selección Inteligente de Muestras
El modelo selecciona ejemplos específicos que le resultan más difíciles de clasificar.
Basándose en criterios como la incertidumbre, la diversidad o el impacto esperado en su precisión.
Reducción de Costos
Al enfocarse solo en las muestras más relevantes, se reduce la cantidad de datos necesarios.
Para lograr un rendimiento alto, lo que disminuye el esfuerzo y costo de etiquetado.
Aplicaciones Comunes
Se utiliza en tareas como la clasificación de textos, reconocimiento de imágenes y procesamiento del lenguaje natural.
Especialmente en contextos donde la anotación de datos es costosa o el conjunto de datos es grande pero tiene etiquetas limitadas.
Métodos de Selección
Algunos métodos comunes para seleccionar ejemplos incluyen la incertidumbre (donde el modelo tiene la menor confianza).
La maximización de la diversidad (cubrir el espacio de características de manera más completa) y la minimización del error esperado.
El aprendizaje activo es una estrategia poderosa para maximizar la eficiencia del entrenamiento del modelo, concentrando los esfuerzos de etiquetado en las áreas que más lo necesitan.







