El cifrado por sustitución es una técnica clásica de criptografía en la que cada símbolo del mensaje original (habitualmente cada letra) se reemplaza por otro símbolo siguiendo una regla fija, llamada clave. Es un cifrado de tipo monoalfabético cuando cada letra del alfabeto siempre se sustituye por la misma letra cifrada.

En un cifrado por sustitución, se utiliza una regla para cambiar cada letra del mensaje, una a una. La regla indica qué letra del alfabeto sustituye a cada letra del mensaje original. La seguridad depende únicamente de la confidencialidad de esa regla (la clave).

Por ejemplo, esta tabla ofrece una regla para un cifrado de sustitución:

  • A → Q
  • B → W
  • C → E
  • D → R
  • E → T
  • F → Y
  • G → U
  • H → I
  • I → O
  • J → P
  • K → A
  • L → S
  • M → D
  • N → F
  • O → G
  • P → H
  • Q → J
  • R → K
  • S → L
  • T → Z
  • U → X
  • V → C
  • W → V
  • X → B
  • Y → N
  • Z → M

Utilizando esta regla, la frase "Jack y Jill subieron a la colina" se convierte en "Etar tzn Evmm gkzc dw cuk uvmm". El cifrado César es un ejemplo simple y conocido de cifrado por sustitución (un desplazamiento uniforme del alfabeto).

Ejemplo claro del cifrado César

El cifrado César desplaza todas las letras del alfabeto un número fijo de posiciones. Por ejemplo, con un desplazamiento de +3:

  • Alfabeto original: ABCDEFGHIJKLMNOPQRSTUVWXYZ
  • Alfabeto cifrado: DEFGHIJKLMNOPQRSTUVWXYZABC

Así, "HELLO" → "KHOOR" y "hola" → "krod" (si se aplica en minúsculas y se interpreta en un alfabeto latino simple). El cifrado César tiene solo 25 claves posibles (desplazamientos distintos en un alfabeto de 26 letras), por lo que es trivial de romper por fuerza bruta.

Análisis de frecuencia y por qué los cifrados de sustitución son inseguros

Los cifrados de sustitución monoalfabéticos conservan las frecuencias y patrones de las letras del mensaje original: la letra más frecuente del texto plano seguirá siendo la letra más frecuente en el texto cifrado (aunque representada por otro símbolo). Esto permite aplicar el análisis de frecuencia para inferir la clave.

Pasos básicos del análisis de frecuencia:

  • Contar la frecuencia de cada letra en el texto cifrado.
  • Comparar esas frecuencias con las distribuciones típicas del idioma objetivo. En inglés, las letras más comunes suelen ser E, T, A, O, I, N; en español, E, A, O, S, R, N.
  • Asignar hipótesis iniciales (por ejemplo, la letra cifrada más frecuente puede corresponder a la E en español) y probar si las sustituciones producen palabras coherentes.
  • Usar patrones: palabras de una letra (p. ej. "a", "I" en inglés), palabras comunes cortas (en inglés "the", "and"; en español "el", "la", "de", "que"), letras dobles (ll, ee, ss, tt), y dígrafos/tríadas frecuentes (en inglés "TH", "HE", "ER"; en español "DE", "EN", "ES").
  • Iterar: ajustar las hipótesis y rellenar más sustituciones hasta obtener el texto claro.

Además del análisis manual, hay herramientas automáticas y algoritmos (búsqueda heurística, análisis de n-gramas, métodos estadísticos) que resuelven estos cifrados rápidamente.

Consejos para resolver criptogramas (puzzles)

  • Empieza por letras muy frecuentes y por palabras de una letra para identificar posibles "a" o "I".
  • Busca patrones repetidos: la misma palabra cifrada que aparece varias veces suele ser la misma palabra en plano.
  • Prueba con palabras cortas comunes: "el", "la", "de", "en", "y" en español; "the", "and", "of", "to" en inglés.
  • Observa letras dobles y su posible correspondencia (por ejemplo, "ll" en español o "ee" en inglés).
  • Si te quedas atascado, prueba hipótesis y comprueba consistencia en todo el texto; una sustitución inválida dará palabras sin sentido.

Descifrar criptogramas (mensajes ocultos con un cifrado de sustitución) es un rompecabezas común que se encuentra a menudo en los periódicos y es una excelente práctica para aprender técnicas de criptoanálisis básicas.

Variantes y seguridad

  • Sustitución monoalfabética: cada letra se sustituye siempre por la misma; es la más simple y la más vulnerable.
  • Sustitución homofónica: una letra del texto plano puede mapear a varios símbolos distintos para ocultar frecuencias; complica el análisis de frecuencia pero no es invulnerable.
  • Sustitución polialfabética (p. ej. Vigenère): emplea varias alfabetos de sustitución alternados según una clave, y reduce la eficacia del análisis de frecuencia; estas son mucho más seguras que una sustitución simple si se usan correctamente.

En la práctica moderna, los cifrados por sustitución monoalfabética no se consideran seguros para proteger información sensible. Para comunicaciones reales se utilizan algoritmos criptográficos avanzados (AES, RSA, curvas elípticas, etc.) que resisten análisis estadísticos y ataques conocidos.

Resumen

El cifrado por sustitución es fácil de entender y útil para enseñanza y rompecabezas, pero es inseguro contra ataques basados en el análisis de frecuencias y patrones del idioma. El cifrado César es su forma más simple; los criptogramas y puzzles siguen aprovechando estas técnicas para entretenimiento y aprendizaje.