Medidas de Similitud

 

Medidas de similitud en IA son herramientas matemáticas.

 

Cuantificar el grado de parecido entre dos objetos.

 

Vectores o conjuntos de datos.

 

Reconocimiento de patrones, recuperación de información.

 

Visión por computadora y sistemas de recomendación.

 

Tipos de Medidas de Similitud 

 

Basadas en distancia Euclidiana, Manhattan.

 

Basadas en correlación Pearson, Spearman.

 

Basadas en vectores Cosenos, Jaccard.

 

Medidas de Similitud Más Usadas

 

Distancia Euclidiana

 

Mide la distancia entre dos puntos.

 

En un espacio n-dimensional:

 

 

from scipy.spatial.distance import euclidean

A = [1, 2, 3] B = [4, 5, 6] distancia = euclidean(A, B)
print(f»Distancia Euclidiana: {distancia}»)

 

Salida: Distancia Euclidiana: 5.19

 

Distancia de Manhattan

 

Suma de las diferencias absolutas entre coordenadas:

 

 

from scipy.spatial.distance import cityblock

distancia_manhattan = cityblock(A, B)
print(f»Distancia de Manhattan: {distancia_manhattan}»)

 

Salida: Distancia de Manhattan: 9

 

Similitud del Coseno

 

Mide el ángulo entre dos vectores en un espacio multidimensional:

 

 

from scipy.spatial.distance import cosine

sim_coseno = 1 – cosine(A, B)
print(f»Similitud del Coseno: {sim_coseno}»)

 

Salida: Similitud del Coseno: 0.97 cercano a 1 = muy similares

 

Coeficiente de Jaccard

 

Mide la similitud entre dos conjuntos:

 

 

 

from sklearn.metrics import jaccard_score

A = [1, 1, 0, 1, 0] B = [1, 0, 1, 1, 1]

sim_jaccard = jaccard_score(A, B)
print(f»Coeficiente de Jaccard: {sim_jaccard}»)

 

 

Correlación de Pearson

 

Mide la relación lineal entre dos variables.

 

 

from scipy.stats import pearsonr

X = [10, 20, 30, 40, 50] Y = [15, 25, 35, 45, 55]

corr, _ = pearsonr(X, Y)
print(f»Correlación de Pearson: {corr}»)

 

Salida: Correlación de Pearson: 1.0 indica relación lineal perfecta

 

Aplicaciones en IA 

 

Procesamiento de lenguaje natural (PLN)

 

Encontrar similitud entre textos.

 

Visión por computadora

 

Comparar imágenes.

 

Descriptores de características.

 

Sistemas de recomendación

 

Usan la similitud del coseno.

 

Recomendar productos.

 

Clustering

 

En algoritmos como K-Means.

 

Agrupar datos similares.

 

Las medidas de similitud son esenciales para muchas tareas de IA.

 

Se pueden calcular usando SciPy, NumPy y scikit-learn en Python.

 

Elegir la mejor medida depende del tipo de datos y problema a resolver.

 

 

ChatGPT de OpenAI: Modelos, Usos y Límites

  ChatGPT es una herramienta de inteligencia artificial desarrollada por OpenAI, basada en modelos avanzados de lenguaje natural de la familia GPT Generative Pre-trained Transformer.   Su función principal es comprender y generar lenguaje humano, lo

Leer más »
Manu Duque
Resumen de privacidad

Esta web utiliza cookies para que podamos ofrecerte la mejor experiencia de usuario posible. La información de las cookies se almacena en tu navegador y realiza funciones tales como reconocerte cuando vuelves a nuestra web o ayudar a nuestro equipo a comprender qué secciones de la web encuentras más interesantes y útiles.

Nunca almacenamos información personal.

Puedes revisar nuestra política en la página de Política de Privacidad, Condiciones de Uso y Cookies.