Tangente Hiperbólica (Tanh)

Por Manu Duque

La función tangente hiperbólica Tanh es una función de activación.

Utilizada en redes neuronales artificiales.

En arquitecturas más antiguas y en redes recurrentes (RNNs).

Capacidad para manejar entradas normalizadas.

Proporcionar una activación no lineal.

Facilita el aprendizaje de relaciones complejas en los datos.

Definición Matemática

La función Tanh está definida.

Propiedades clave

Rango de valores: $(- 1, 1)$

Es simétrica respecto al origen es una función impar.

Valores grandes positivos Tanh se aproxima a $1$ .

Valores grandes negativos Tanh se aproxima a .

Derivada de Tanh

La derivada de Tanh se calcula como:

Es útil en el cálculo de gradientes.

Durante el entrenamiento de redes neuronales.

Permite ajustar los pesos de forma eficiente.

Ventajas de Tanh

Rango Centrado en Cero

La función sigmoide cuyo rango es $[0, 1]$

El rango de Tanh está centrado en cero $(- 1, 1)$

Facilita el aprendizaje en redes neuronales.

La activación no está sesgada.

Hacia valores positivos.

Normalización de Salidas

La función Tanh comprime las entradas.

En un rango limitado.

Ayuda a estabilizar el entrenamiento.

Evita que las activaciones se disparen.

Capacidad de Modelar Relaciones No Lineales

Tanh introduce no linealidad.

Permite a las redes neuronales aprender.

Relaciones complejas en los datos.

Uso en Redes Recurrentes (RNNs)

Capacidad para manejar valores normalizados.

Es crítico al procesar secuencias.

Limitaciones de Tanh

Desvanecimiento del Gradiente

En valores extremos muy positivos o muy negativos.

Las salidas de Tanh se saturan.

Cerca de o $- 1$

Los gradientes tienden a ser muy pequeños.

Puede dificultar el aprendizaje en redes profundas.

Costos Computacionales

ATanh es computacionalmente más exigente que ReLU.

debido a la necesidad de calcular exponentes.

Comparación con otras funciones de activación

Propiedad	Tanh	Sigmoide	ReLU
Rango	$(- 1, 1)$	$(0, 1)$	$\infty)$
Centro	Cero	No centrado	No centrado
Saturación	Sí (en valores extremos)	Sí (en valores extremos)	No (para valores $> 0$ )
Gradiente	Más estable que sigmoide	Propenso a desvanecerse	No desaparece (ReLU)

Aplicaciones de Tanh

Redes Neuronales Recurrentes (RNNs)

Capacidad para manejar valores normalizados,

Tanh es ampliamente utilizada en capas recurrentes.

Modelos como LSTM y GRU.

Redes Neuronales Multicapa (MLP)

Tanh se utilizaba para introducir no linealidad.

Antes de la llegada de ReLU.

Tareas de Clasificación

Cuando las salidas de las capas intermedias.

Necesitan estar centradas en cero.

Tanh es una elección natural.

Procesamiento de Señales y Secuencias

Tanh es útil para suavizar y normalizar señales.

En tareas como análisis de series temporales.

Generación de texto.

Ejemplo de uso en una red neuronal

En un modelo secuencial de Keras.

Puede usar Tanh como función de activación.

En cualquier capa densa o recurrente.

from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense

# Modelo secuencial simple
model = Sequential([
Dense(64, activation=’tanh’, input_shape=(100,)),
Dense(1, activation=’sigmoid’)
])

# Compilación del modelo
model.compile(optimizer=’adam’, loss=’binary_crossentropy’)

En este ejemplo, Tanh se utiliza en una capa oculta para proporcionar activaciones centradas en cero.

La función Tanh es una herramienta valiosa en el aprendizaje profundo.

En arquitecturas donde la normalización de valores.

La simetría en las activaciones son críticas.

Aunque ha sido en gran medida reemplazada.

Por funciones como ReLU en redes profundas.

Tanh sigue siendo una opción en redes recurrentes.

Adecuada para tareas donde el centrado en cero es esencial.

Te puede interesar;

Curso de ChatGPT (GRATIS)

Guía SEO 2025: Rankings Orgánicos vs. Google AI Overviews

¿Por qué la reputación online (PR) es la nueva clave para influir en la IA? La reputación online (PR) es clave para influir en la IA porque los sistemas como Google AI Overviews

Guía SEO-IA paso a paso para Implementar SEO para IAs

El SEO para IAs no busca solo aparecer en resultados de búsqueda tradicionales como en Google, sino ser visible, legible y confiable para modelos de lenguaje que generan contenido, responden preguntas y citan fuentes.

Backlinks IAs: SEO Semántico LLMs, ChatGPT, Claude, Gemini

Una estrategia específica para conseguir backlinks con enfoque en SEO para IAs LLM SEO, incluyendo sitios web recomendados relacionados con inteligencia artificial que pueden ayudarte a obtener backlinks de calidad y visibilidad frente a modelos

SEO para ChatGPT vs SEO para Google: Técnicas y Estrategias

Los modelos de lenguaje como ChatGPT se están convirtiendo en canales clave de descubrimiento, consulta y recomendación de contenido, exponer tu información de forma estructurada y accesible ya no es opcional: es una ventaja

Marketing Inteligente: El Poder del Marketing al Servicio de la IA

IA Marketing Inteligencia Artificial aplicada al Marketing es el uso de tecnologías de inteligencia artificial para optimizar, automatizar y personalizar las estrategias, acciones y decisiones de marketing. Este enfoque combina la capacidad de

ChatGPT de OpenAI: Modelos, Usos y Límites

ChatGPT es una herramienta de inteligencia artificial desarrollada por OpenAI, basada en modelos avanzados de lenguaje natural de la familia GPT Generative Pre-trained Transformer. Su función principal es comprender y generar lenguaje humano, lo