En estadística, una distribución de frecuencias describe cómo se reparten los valores observados de una variable en una muestra. Presenta el número de observaciones que toma cada valor (o cada intervalo de valores) y sirve para resumir y visualizar la estructura de los datos.

Tipos principales

  • Distribución de frecuencias para variables discretas: lista cada valor posible y su frecuencia absoluta (cuántas veces aparece).
  • Distribución agrupada para variables continuas: divide el rango de valores en clases o intervalos y registra cuántas observaciones caen en cada clase.
  • Distribución acumulada: acumula frecuencias hasta cada valor o clase, útil para percentiles y cuantiles.

Elementos y conceptos clave

  • Frecuencia absoluta (f): número de observaciones en cada valor o clase.
  • Frecuencia relativa (fr): proporción f/n, donde n es el tamaño de la muestra.
  • Frecuencia porcentual: frecuencia relativa multiplicada por 100.
  • Frecuencia acumulada: suma progresiva de frecuencias absolutas o relativas.
  • Densidad de frecuencia: en distribuciones agrupadas, frecuencia por unidad de amplitud de la clase (útil si las clases tienen anchuras distintas).

Cómo construir una tabla de frecuencias

  1. Determinar el tipo de variable (discreta o continua) y el tamaño de la muestra.
  2. Para variables discretas, listar los valores observados y contar las ocurrencias.
  3. Para variables continuas:
    • Seleccionar el número de clases y la amplitud de cada clase.
    • Contar observaciones por clase y calcular frecuencias relativas y acumuladas.
  4. Comprobar que la suma de frecuencias coincide con el tamaño de la muestra y que las frecuencias relativas suman 1 (o 100% si son porcentajes).
  5. Presentar la tabla con columnas claras: valor/intervalo, frecuencia absoluta, frecuencia relativa, frecuencia acumulada.

Reglas prácticas para elegir clases

Hay varias reglas y criterios para decidir el número y la anchura de las clases; son orientativas y su conveniencia depende del conjunto de datos:

  • Regla de Sturges: sugiere un número de clases basado en logaritmos en función del tamaño de la muestra.
  • Regla de Freedman–Diaconis: usa la dispersión de los datos (IQR) para elegir la anchura de la clase; tiende a ser más robusta frente a valores extremos.
  • Regla de Scott: minimiza la varianza del histograma asumiendo normalidad aproximada.

Visualizaciones asociadas

  • Histograma: gráfico de barras contiguas que muestra frecuencias por clase; apropiado para variables continuas.
  • Diagrama de barras: para variables categóricas o discretas, con barras separadas para cada categoría o valor.
  • Polígono de frecuencias y ojiva (gráfico de la frecuencia acumulada): útiles para comparar distribuciones y ver la tendencia acumulada.

Ejemplos prácticos

Ejemplo 1 — escala Likert: si 100 personas responden en una escala de 1 a 5, una tabla de frecuencias discreta mostrará cuántas respuestas tuvo cada opción (frecuencia absoluta), su porcentaje y la frecuencia acumulada para estimar cuántos respondieron a favor o en contra.

Ejemplo 2 — alturas: al medir alturas en centímetros en una clase, es habitual agrupar en intervalos (por ejemplo, 150–154, 155–159 cm, etc.) y presentar la distribución agrupada con la densidad de frecuencia si las clases no son de igual anchura.

Usos y limitaciones

  • Las distribuciones de frecuencias permiten resumir y detectar patrones, sesgos, multimodalidad y valores atípicos.
  • Al agrupar datos continuos se pierde información fina; la elección de clases puede influir en la interpretación.
  • Para muestras pequeñas, las tablas pueden ser inestables; conviene complementar con medidas numéricas (media, mediana, desviación estándar) y gráficos.

Buenas prácticas

  • Mostrar tanto frecuencias absolutas como relativas para facilitar comparación entre muestras de distinto tamaño.
  • Indicar claramente los límites de las clases y la convención usada (por ejemplo, si los límites son inclusivos por la izquierda o por la derecha).
  • Si se presentan histogramas, comprobar que el área de las barras refleje correctamente la densidad cuando las anchuras difieren.