Un histograma es un concepto de la estadística. Es una representación gráfica que nos habla de la distribución de las muestras implicadas. Suelen ser una imagen hecha a partir de una tabla con muchas categorías. La tabla indica cuántas muestras hay en cada categoría.
La palabra histograma deriva de histos y gramma en griego. Histos significa red o mástil. Gramma significa dibujo, registro o escritura. Por tanto, un histograma de algo es, etimológicamente hablando, un dibujo de la red de ese algo.
Ampliando la definición: un histograma representa datos agrupando los valores en intervalos (llamados clases o bins) y mostrando, para cada intervalo, la frecuencia (el número de observaciones) o la frecuencia relativa (proporción) con barras contiguas. Es especialmente útil para variables cuantitativas continuas, aunque también puede usarse para variables discretas con muchos valores distintos.
Elementos básicos de un histograma:
• Eje horizontal (x): muestra los intervalos o clases en los que se agrupan los valores.• Eje vertical (y): muestra la frecuencia absoluta, la frecuencia relativa o la densidad (frecuencia dividida por el ancho del intervalo).
• Barras contiguas: a diferencia de los diagramas de barras para categorías cualitativas, las barras de un histograma están juntas porque representan continuidad entre intervalos adyacentes.
Cómo construir un histograma (pasos prácticos):
• Reunir los datos numéricos.• Elegir el número de intervalos (bins) o el ancho de cada intervalo.
• Contar cuántas observaciones caen en cada intervalo.
• Dibujar barras cuya altura corresponda a esas frecuencias (o densidades).
• Añadir etiquetas en los ejes y, si procede, una escala normalizada para comparar muestras de distinto tamaño.
Reglas y criterios para elegir el número de intervalos:
• Regla de Sturges: útil para muestras pequeñas a medias.• Regla de Scott y regla de Freedman–Diaconis: consideran la dispersión y el tamaño muestral para calcular el ancho óptimo del bin.
Estas reglas son guías; la elección final puede depender del objetivo: mostrar detalles finos (bins estrechos) o obtener una visión general (bins anchos).
Diferencias importantes entre histograma y diagrama de barras: en un histograma las barras representan intervalos de una variable numérica y están contiguas; en un diagrama de barras las barras representan categorías cualitativas y están separadas. Confundirlos puede inducir a errores de interpretación.
Interpretación de la forma de un histograma:
• Simetría: una distribución simétrica (por ejemplo, aproximadamente normal) sugiere que los valores se concentran alrededor de una media central.• Asimetría (skewness): si la cola es más larga hacia la derecha se dice que la distribución está sesgada a la derecha (positivamente); si la cola es más larga hacia la izquierda, está sesgada a la izquierda (negativamente).
• Modalidad: unimodal (un pico), bimodal (dos picos) o multimodal; varios picos pueden indicar subpoblaciones o mezclas de procesos distintos.
• Colas y outliers: barras aisladas en extremos pueden señalar valores atípicos o colas largas que afectan medidas de tendencia y dispersión.
• Ancho y variabilidad: histrogramas muy anchos indican mayor dispersión; barras concentradas en un intervalo indican baja variabilidad.
Relación con medidas estadísticas: el histograma ayuda a visualizar la media, mediana y moda (la(s) moda(s) coincidirán con el(los) pico(s) del histograma) y a comprobar la presencia de asimetría y curtosis. No sustituye el cálculo de medidas numéricas, pero es una herramienta complementaria esencial.
Variantes y complementos:
• Histograma acumulado: muestra la frecuencia acumulada y facilita ver percentiles y cuantiles.• Histograma normalizado (densidad): útil para comparar distribuciones con distinto tamaño muestral; el área total suma 1.
• Estimación por kernel (densidad suavizada): alternativa suave al histograma que puede mostrar la forma de la distribución sin depender tanto del ancho de los bins.
Errores y cuidados frecuentes:
• Elegir un número de bins inapropiado que oculte características importantes (bins demasiado anchos) o que muestre ruido (bins demasiado estrechos).• No distinguir entre frecuencia absoluta y densidad al comparar muestras de diferente tamaño.
• Interpretar picos pequeños sin considerar el tamaño muestral: con pocas observaciones, las irregularidades pueden ser aleatorias.
Aplicaciones prácticas: los histogramas se usan en economía (distribución de ingresos), en control de calidad (variación de medidas de producción), en biología (distribución de tamaños), en ciencias sociales (edad, puntuaciones) y en cualquier disciplina que requiera analizar la forma de una distribución.
Resumen práctico — Cómo leer un histograma rápidamente:
• Mirar la ubicación del pico para estimar la tendencia central.• Observar la simetría o el sesgo de las colas.
• Contar picos para detectar modalidades.
• Buscar barras atípicas que indiquen outliers.
• Considerar el ancho de los bins y el tamaño muestral antes de sacar conclusiones.

