Histograma: definición, origen y cómo interpretar distribuciones estadísticas
Un histograma es un concepto de la estadística. Es una representación gráfica que nos habla de la distribución de las muestras implicadas. Suelen ser una imagen hecha a partir de una tabla con muchas categorías. La tabla indica cuántas muestras hay en cada categoría.
La palabra histograma deriva de histos y gramma en griego. Histos significa red o mástil. Gramma significa dibujo, registro o escritura. Por tanto, un histograma de algo es, etimológicamente hablando, un dibujo de la red de ese algo.
Ampliando la definición: un histograma representa datos agrupando los valores en intervalos (llamados clases o bins) y mostrando, para cada intervalo, la frecuencia (el número de observaciones) o la frecuencia relativa (proporción) con barras contiguas. Es especialmente útil para variables cuantitativas continuas, aunque también puede usarse para variables discretas con muchos valores distintos.
Elementos básicos de un histograma:
• Eje horizontal (x): muestra los intervalos o clases en los que se agrupan los valores.• Eje vertical (y): muestra la frecuencia absoluta, la frecuencia relativa o la densidad (frecuencia dividida por el ancho del intervalo).
• Barras contiguas: a diferencia de los diagramas de barras para categorías cualitativas, las barras de un histograma están juntas porque representan continuidad entre intervalos adyacentes.
Cómo construir un histograma (pasos prácticos):
• Reunir los datos numéricos.• Elegir el número de intervalos (bins) o el ancho de cada intervalo.
• Contar cuántas observaciones caen en cada intervalo.
• Dibujar barras cuya altura corresponda a esas frecuencias (o densidades).
• Añadir etiquetas en los ejes y, si procede, una escala normalizada para comparar muestras de distinto tamaño.
Reglas y criterios para elegir el número de intervalos:
• Regla de Sturges: útil para muestras pequeñas a medias.• Regla de Scott y regla de Freedman–Diaconis: consideran la dispersión y el tamaño muestral para calcular el ancho óptimo del bin.
Estas reglas son guías; la elección final puede depender del objetivo: mostrar detalles finos (bins estrechos) o obtener una visión general (bins anchos).
Diferencias importantes entre histograma y diagrama de barras: en un histograma las barras representan intervalos de una variable numérica y están contiguas; en un diagrama de barras las barras representan categorías cualitativas y están separadas. Confundirlos puede inducir a errores de interpretación.
Interpretación de la forma de un histograma:
• Simetría: una distribución simétrica (por ejemplo, aproximadamente normal) sugiere que los valores se concentran alrededor de una media central.• Asimetría (skewness): si la cola es más larga hacia la derecha se dice que la distribución está sesgada a la derecha (positivamente); si la cola es más larga hacia la izquierda, está sesgada a la izquierda (negativamente).
• Modalidad: unimodal (un pico), bimodal (dos picos) o multimodal; varios picos pueden indicar subpoblaciones o mezclas de procesos distintos.
• Colas y outliers: barras aisladas en extremos pueden señalar valores atípicos o colas largas que afectan medidas de tendencia y dispersión.
• Ancho y variabilidad: histrogramas muy anchos indican mayor dispersión; barras concentradas en un intervalo indican baja variabilidad.
Relación con medidas estadísticas: el histograma ayuda a visualizar la media, mediana y moda (la(s) moda(s) coincidirán con el(los) pico(s) del histograma) y a comprobar la presencia de asimetría y curtosis. No sustituye el cálculo de medidas numéricas, pero es una herramienta complementaria esencial.
Variantes y complementos:
• Histograma acumulado: muestra la frecuencia acumulada y facilita ver percentiles y cuantiles.• Histograma normalizado (densidad): útil para comparar distribuciones con distinto tamaño muestral; el área total suma 1.
• Estimación por kernel (densidad suavizada): alternativa suave al histograma que puede mostrar la forma de la distribución sin depender tanto del ancho de los bins.
Errores y cuidados frecuentes:
• Elegir un número de bins inapropiado que oculte características importantes (bins demasiado anchos) o que muestre ruido (bins demasiado estrechos).• No distinguir entre frecuencia absoluta y densidad al comparar muestras de diferente tamaño.
• Interpretar picos pequeños sin considerar el tamaño muestral: con pocas observaciones, las irregularidades pueden ser aleatorias.
Aplicaciones prácticas: los histogramas se usan en economía (distribución de ingresos), en control de calidad (variación de medidas de producción), en biología (distribución de tamaños), en ciencias sociales (edad, puntuaciones) y en cualquier disciplina que requiera analizar la forma de una distribución.
Resumen práctico — Cómo leer un histograma rápidamente:
• Mirar la ubicación del pico para estimar la tendencia central.• Observar la simetría o el sesgo de las colas.
• Contar picos para detectar modalidades.
• Buscar barras atípicas que indiquen outliers.
• Considerar el ancho de los bins y el tamaño muestral antes de sacar conclusiones.


Ejemplo de un histograma de 100 valores aleatorios normalmente distribuidos
Ideas similares
El histograma es una de las siete herramientas básicas del control de calidad, entre las que también se encuentran el diagrama de Pareto, la hoja de comprobación, el gráfico de control, el diagrama de causa y efecto, el diagrama de flujo y el diagrama de dispersión.
Una generalización del histograma son las técnicas de suavización del kernel. Esto construirá una función de densidad de probabilidad suave a partir de los datos suministrados.
Preguntas y respuestas
P: ¿Qué es un histograma?
R: Un histograma es una representación gráfica que nos informa sobre la distribución de las muestras involucradas.
P: ¿Para qué sirve un histograma?
R: La finalidad de un histograma es mostrar la distribución de las muestras implicadas.
P: ¿Qué significa la palabra histograma?
R: La palabra histograma deriva de histos y gramma en griego. Histos significa red o mástil. Gramma significa dibujo, registro o escritura.
P: ¿Qué significa el término "histos" en griego?
R: El término "histos" significa red o mástil en griego.
P: ¿Qué significa el término "gramma" en griego?
R: El término "gramma" significa dibujo, registro o escritura en griego.
P: ¿Cuál es la característica común de un histograma?
R: Una característica común de un histograma es una imagen hecha a partir de una tabla con muchas categorías.
P: ¿Qué información proporciona una tabla de histograma?
R: Una tabla de histograma proporciona información sobre cuántas muestras hay en cada categoría.