Medidas de Similitud

Por Manu Duque

Medidas de similitud en IA son herramientas matemáticas.

Cuantificar el grado de parecido entre dos objetos.

Vectores o conjuntos de datos.

Reconocimiento de patrones, recuperación de información.

Visión por computadora y sistemas de recomendación.

Tipos de Medidas de Similitud

Basadas en distancia Euclidiana, Manhattan.

Basadas en correlación Pearson, Spearman.

Basadas en vectores Cosenos, Jaccard.

Medidas de Similitud Más Usadas

Distancia Euclidiana

Mide la distancia entre dos puntos.

En un espacio n-dimensional:

from scipy.spatial.distance import euclidean

A = [1, 2, 3] B = [4, 5, 6] distancia = euclidean(A, B)
print(f»Distancia Euclidiana: {distancia}»)

Salida: Distancia Euclidiana: 5.19

Distancia de Manhattan

Suma de las diferencias absolutas entre coordenadas:

from scipy.spatial.distance import cityblock

distancia_manhattan = cityblock(A, B)
print(f»Distancia de Manhattan: {distancia_manhattan}»)

Salida: Distancia de Manhattan: 9

Similitud del Coseno

Mide el ángulo entre dos vectores en un espacio multidimensional:

from scipy.spatial.distance import cosine

sim_coseno = 1 – cosine(A, B)
print(f»Similitud del Coseno: {sim_coseno}»)

Salida: Similitud del Coseno: 0.97 cercano a 1 = muy similares

Coeficiente de Jaccard

Mide la similitud entre dos conjuntos:

from sklearn.metrics import jaccard_score

A = [1, 1, 0, 1, 0] B = [1, 0, 1, 1, 1]

sim_jaccard = jaccard_score(A, B)
print(f»Coeficiente de Jaccard: {sim_jaccard}»)

Correlación de Pearson

Mide la relación lineal entre dos variables.

from scipy.stats import pearsonr

X = [10, 20, 30, 40, 50] Y = [15, 25, 35, 45, 55]

corr, _ = pearsonr(X, Y)
print(f»Correlación de Pearson: {corr}»)

Salida: Correlación de Pearson: 1.0 indica relación lineal perfecta

Aplicaciones en IA

Procesamiento de lenguaje natural (PLN)

Encontrar similitud entre textos.

Visión por computadora

Comparar imágenes.

Descriptores de características.

Sistemas de recomendación

Usan la similitud del coseno.

Recomendar productos.

Clustering

En algoritmos como K-Means.

Agrupar datos similares.

Las medidas de similitud son esenciales para muchas tareas de IA.

Se pueden calcular usando SciPy, NumPy y scikit-learn en Python.

Elegir la mejor medida depende del tipo de datos y problema a resolver.

Guía SEO 2025: Rankings Orgánicos vs. Google AI Overviews

¿Por qué la reputación online (PR) es la nueva clave para influir en la IA? La reputación online (PR) es clave para influir en la IA porque los sistemas como Google AI Overviews

Guía SEO-IA paso a paso para Implementar SEO para IAs

El SEO para IAs no busca solo aparecer en resultados de búsqueda tradicionales como en Google, sino ser visible, legible y confiable para modelos de lenguaje que generan contenido, responden preguntas y citan fuentes.

Backlinks IAs: SEO Semántico LLMs, ChatGPT, Claude, Gemini

Una estrategia específica para conseguir backlinks con enfoque en SEO para IAs LLM SEO, incluyendo sitios web recomendados relacionados con inteligencia artificial que pueden ayudarte a obtener backlinks de calidad y visibilidad frente a modelos

SEO para ChatGPT vs SEO para Google: Técnicas y Estrategias

Los modelos de lenguaje como ChatGPT se están convirtiendo en canales clave de descubrimiento, consulta y recomendación de contenido, exponer tu información de forma estructurada y accesible ya no es opcional: es una ventaja

Marketing Inteligente: El Poder del Marketing al Servicio de la IA

IA Marketing Inteligencia Artificial aplicada al Marketing es el uso de tecnologías de inteligencia artificial para optimizar, automatizar y personalizar las estrategias, acciones y decisiones de marketing. Este enfoque combina la capacidad de

ChatGPT de OpenAI: Modelos, Usos y Límites

ChatGPT es una herramienta de inteligencia artificial desarrollada por OpenAI, basada en modelos avanzados de lenguaje natural de la familia GPT Generative Pre-trained Transformer. Su función principal es comprender y generar lenguaje humano, lo