Matriz de Confusión es una herramienta esencial.
En la evaluación de modelos de clasificación.
Es una tabla que permite visualizar el desempeño de un modelo,
Comparando las predicciones realizadas.
Con los valores reales en un conjunto.
De datos etiquetados.
Estructura de la Matriz de Confusión
Para un problema de clasificación binaria.
Dos clases: positiva y negativa.
La matriz de confusión se representa.
Predicción Positiva | Predicción Negativa | |
---|---|---|
Real Positiva | Verdaderos Positivos (TP) | Falsos Negativos (FN) |
Real Negativa | Falsos Positivos (FP) | Verdaderos Negativos (TN) |
Verdaderos Positivos (TP)
Predicciones correctas donde el modelo identificó.
Correctamente los ejemplos positivos.
Falsos Positivos (FP)
Predicciones incorrectas donde el modelo clasificó.
Como positivo algo que era negativo.
Falsos Negativos (FN)
Predicciones incorrectas donde el modelo clasificó.
Como negativo algo que era positivo.
Verdaderos Negativos (TN)
Predicciones correctas donde el modelo.
Identificó correctamente los ejemplos negativos.
Métricas Derivadas de la Matriz de Confusión
A partir de la matriz de confusión se calculan diversas métricas.
Para evaluar el desempeño del modelo.
- Precisión (Precision)
Proporción de predicciones positivas que son correctas.
Ejemplo Práctico
Supongamos que tenemos un modelo que predice
Si un correo es «spam» (positivo) o «no spam» (negativo).
Evaluando el modelo sobre 100 correos.
Obtenemos los siguientes resultados.
TP = 40 (correos spam identificados correctamente)
FP = 10 (correos no spam mal clasificados como spam)
FN = 5 (correos spam mal clasificados como no spam)
TN = 45 (correos no spam identificados correctamente)
La matriz de confusión sería:
Predicción Spam | Predicción No Spam | |
---|---|---|
Spam | 40 (TP) | 5 (FN) |
No Spam | 10 (FP) | 45 (TN) |
Cálculo de métricas:
Aplicaciones en IA
Sistemas de Diagnóstico Médico
Detectar enfermedades como cáncer o COVID-19
Donde los falsos negativos pueden tener graves consecuencias.
Sistemas de Detección de Fraude
Identificar transacciones fraudulentas.
Minimizando tanto falsos positivos como negativos.
Motores de Recomendación
Evaluar la precisión en la recomendación.
De productos o servicios.
Clasificación de Texto e Imágenes
Analizar el desempeño en tareas como detección de spam.
Análisis de sentimientos o clasificación de objetos.
Limitaciones de la Matriz de Confusión
Desbalance de Clases
En conjuntos de datos con clases desbalanceadas.
La exactitud puede ser engañosa.
Ejemplo:
Si el 95% de los datos pertenece a una clase.
Un modelo que siempre predice esa clase.
Tendrá alta exactitud pero bajo desempeño.
En la minoritaria.
Falta de Información Detallada
No proporciona una visión directa.
Sobre cómo mejorar el modelo.
Costos Diferenciales
No considera el impacto real de los falsos positivos.
Falsos negativos en contextos específicos.
La matriz de confusión es una herramienta clave.
Evaluar el desempeño de modelos de clasificación en IA.
Su interpretación y las métricas derivadas ayudan.
A comprender las fortalezas y debilidades del modelo.
Permitiendo ajustes para mejorar su efectividad.
En diversas aplicaciones.
Te puede interesar;