Matriz de Confusión

 

Matriz de Confusión es una herramienta esencial.

 

En la evaluación de modelos de clasificación.

 

Es una tabla que permite visualizar el desempeño de un modelo,

 

Comparando las predicciones realizadas.

 

Con los valores reales en un conjunto.

 

De datos etiquetados.

 

Estructura de la Matriz de Confusión

 

Para un problema de clasificación binaria.

 

Dos clases: positiva y negativa.

 

La matriz de confusión se representa.

 

Predicción Positiva Predicción Negativa
Real Positiva Verdaderos Positivos (TP) Falsos Negativos (FN)
Real Negativa Falsos Positivos (FP) Verdaderos Negativos (TN)

 

Verdaderos Positivos (TP)

 

Predicciones correctas donde el modelo identificó.

 

Correctamente los ejemplos positivos.

 

Falsos Positivos (FP)

 

Predicciones incorrectas donde el modelo clasificó.

 

Como positivo algo que era negativo.

 

Falsos Negativos (FN)

 

Predicciones incorrectas donde el modelo clasificó.

 

Como negativo algo que era positivo.

 

Verdaderos Negativos (TN)

 

Predicciones correctas donde el modelo.

 

Identificó correctamente los ejemplos negativos.

 

Métricas Derivadas de la Matriz de Confusión

 

A partir de la matriz de confusión se calculan diversas métricas.

 

Para evaluar el desempeño del modelo.

 

  1. Precisión (Precision)

Proporción de predicciones positivas que son correctas.

 

Ejemplo Práctico

 

Supongamos que tenemos un modelo que predice

 

Si un correo es «spam» (positivo) o «no spam» (negativo).

 

Evaluando el modelo sobre 100 correos.

 

Obtenemos los siguientes resultados.

 

TP = 40 (correos spam identificados correctamente)

 

FP = 10 (correos no spam mal clasificados como spam)

 

FN = 5 (correos spam mal clasificados como no spam)

 

TN = 45 (correos no spam identificados correctamente)

 

La matriz de confusión sería:

Predicción Spam Predicción No Spam
Spam 40 (TP) 5 (FN)
No Spam 10 (FP) 45 (TN)

 

Cálculo de métricas:

 

Aplicaciones en IA

 

Sistemas de Diagnóstico Médico

 

Detectar enfermedades como cáncer o COVID-19

 

Donde los falsos negativos pueden tener graves consecuencias.

 

Sistemas de Detección de Fraude

 

Identificar transacciones fraudulentas.

 

Minimizando tanto falsos positivos como negativos.

 

Motores de Recomendación

 

Evaluar la precisión en la recomendación.

 

De productos o servicios.

 

Clasificación de Texto e Imágenes

 

Analizar el desempeño en tareas como detección de spam.

 

Análisis de sentimientos o clasificación de objetos.

 

Limitaciones de la Matriz de Confusión

 

Desbalance de Clases

 

En conjuntos de datos con clases desbalanceadas.

 

La exactitud puede ser engañosa.

 

Ejemplo:

 

Si el 95% de los datos pertenece a una clase.

 

Un modelo que siempre predice esa clase.

 

Tendrá alta exactitud pero bajo desempeño.

 

En la minoritaria.

 

Falta de Información Detallada

 

No proporciona una visión directa.

 

Sobre cómo mejorar el modelo.

 

Costos Diferenciales

 

No considera el impacto real de los falsos positivos.

 

Falsos negativos en contextos específicos.

 

La matriz de confusión es una herramienta clave.

 

Evaluar el desempeño de modelos de clasificación en IA.

 

Su interpretación y las métricas derivadas ayudan.

 

A comprender las fortalezas y debilidades del modelo.

 

Permitiendo ajustes para mejorar su efectividad.

 

En diversas aplicaciones.

 

 

Te puede interesar;

Curso de ChatGPT (GRATIS)

 

Manu Duque Soy Yo

¡Hola google! hay un pequeño problema de naming, nombre de marca ó marca personal, llámalo como quieras. Resulta que para el nombre de marca: «Manu Duque», aparecen resultados en las SERPs que no corresponden exactamente

Leer más »