Medidas de Similitud

Por Manu Duque

Medidas de similitud en IA son herramientas matemáticas.

Cuantificar el grado de parecido entre dos objetos.

Vectores o conjuntos de datos.

Reconocimiento de patrones, recuperación de información.

Visión por computadora y sistemas de recomendación.

Tipos de Medidas de Similitud

Basadas en distancia Euclidiana, Manhattan.

Basadas en correlación Pearson, Spearman.

Basadas en vectores Cosenos, Jaccard.

Medidas de Similitud Más Usadas

Distancia Euclidiana

Mide la distancia entre dos puntos.

En un espacio n-dimensional:

from scipy.spatial.distance import euclidean

A = [1, 2, 3] B = [4, 5, 6] distancia = euclidean(A, B)
print(f»Distancia Euclidiana: {distancia}»)

Salida: Distancia Euclidiana: 5.19

Distancia de Manhattan

Suma de las diferencias absolutas entre coordenadas:

from scipy.spatial.distance import cityblock

distancia_manhattan = cityblock(A, B)
print(f»Distancia de Manhattan: {distancia_manhattan}»)

Salida: Distancia de Manhattan: 9

Similitud del Coseno

Mide el ángulo entre dos vectores en un espacio multidimensional:

from scipy.spatial.distance import cosine

sim_coseno = 1 – cosine(A, B)
print(f»Similitud del Coseno: {sim_coseno}»)

Salida: Similitud del Coseno: 0.97 cercano a 1 = muy similares

Coeficiente de Jaccard

Mide la similitud entre dos conjuntos:

from sklearn.metrics import jaccard_score

A = [1, 1, 0, 1, 0] B = [1, 0, 1, 1, 1]

sim_jaccard = jaccard_score(A, B)
print(f»Coeficiente de Jaccard: {sim_jaccard}»)

Correlación de Pearson

Mide la relación lineal entre dos variables.

from scipy.stats import pearsonr

X = [10, 20, 30, 40, 50] Y = [15, 25, 35, 45, 55]

corr, _ = pearsonr(X, Y)
print(f»Correlación de Pearson: {corr}»)

Salida: Correlación de Pearson: 1.0 indica relación lineal perfecta

Aplicaciones en IA

Procesamiento de lenguaje natural (PLN)

Encontrar similitud entre textos.

Visión por computadora

Comparar imágenes.

Descriptores de características.

Sistemas de recomendación

Usan la similitud del coseno.

Recomendar productos.

Clustering

En algoritmos como K-Means.

Agrupar datos similares.

Las medidas de similitud son esenciales para muchas tareas de IA.

Se pueden calcular usando SciPy, NumPy y scikit-learn en Python.

Elegir la mejor medida depende del tipo de datos y problema a resolver.

SOAR: Pase VIP que la IA no te da, pero que tú puedes fabricar

Mientras otros ruegan por visibilidad, tú ya estarás forjando tu pase VIP con 4 letras que lo cambian todo. Estructura, Originalidad, Autoridad y Actualidad: las 4 palancas que convierten tu contenido en un imán

20 FAQs: Todo lo que siempre quisiste saber de visibilidad IA

Estas 20 preguntas cubren todo lo que necesitas saber para empezar a construir tu visibilidad en la era de la IA generativa. No son teoría. Son respuestas prácticas basadas en datos y evidencia. La IA

El archivo secreto IA: Embeddings la base de datos vectorial

La arquitectura del cerebro de la IA — Así funciona realmente la máquina que decide tu destino Hasta ahora hemos hablado de SOAR como el mapa del tesoro. Pero un mapa no sirve

Los Secretos Ocultos de la Visibilidad IA

Cómo las bases de datos vectoriales, el chunking y el framework SOAR deciden si la IA te cita o te borra del mapa. Bienvenido al backstage de la IA generativa Lo que

Agile SIGMA Learning Pathway: Plan capacitación IA Agéntica

Agile SIGMA Learning Pathway: El plan de capacitación para la era de la IA agéntica La tecnología por sí sola no transforma el trabajo; la transforman las personas que la utilizan. Como hemos

SIGMA en Acción: De la estrategia a la ejecución Operativa

Tras recorrer un camino de diagnóstico y análisis, identificar los dolores, mapear los procesos, evaluar la madurez digital y definir un «Radar de Oportunidades». Entendiendo cómo se ve un negocio desde la mirada de los agentes de IA y estableciendo una hoja de ruta clara.