Distribución de frecuencias | una lista de los valores que toma una variable en una muestra

En estadística, una distribución de frecuencias es una lista de los valores que toma una variable en una muestra. Suele ser una lista ordenada por cantidad. Mostrará el número de veces que aparece cada valor. Por ejemplo, si 100 personas valoran una escala Likert de cinco puntos que evalúa su acuerdo con una afirmación en una escala en la que 1 denota un fuerte acuerdo y 5 un fuerte desacuerdo, la distribución de frecuencias de sus respuestas podría tener el siguiente aspecto

Esta sencilla tabla tiene dos inconvenientes. Cuando una variable puede tomar valores continuos en lugar de valores discretos o cuando el número de valores posibles es demasiado grande, la construcción de la tabla es difícil, si no imposible. En estos casos se utiliza un esquema ligeramente diferente basado en el rango de valores. Por ejemplo, si consideramos las alturas de los alumnos de una clase, la tabla de frecuencias podría tener el siguiente aspecto.



  Ejemplo de una distribución de frecuencia (absoluta). Esta es la pirámide de población de Angola, para el año 2005.  Zoom
Ejemplo de una distribución de frecuencia (absoluta). Esta es la pirámide de población de Angola, para el año 2005.  

Esta es la pirámide de población de China para el año 2005.   Zoom
Esta es la pirámide de población de China para el año 2005.  

Aplicaciones

Gestionar y operar con datos tabulados de frecuencia es mucho más sencillo que operar con datos brutos. Existen algoritmos sencillos para calcular la mediana, la media (estadística), la desviación estándar, etc. a partir de estas tablas.

La prueba de hipótesis estadística se basa en la evaluación de las diferencias y similitudes entre las distribuciones de frecuencia. Esta evaluación implica medidas de tendencia central o promedios, como la media y la mediana, y medidas de variabilidad o dispersión estadística, como la desviación estándar o la varianza.

Se dice que una distribución de frecuencias está sesgada cuando su media y su mediana son diferentes. La curtosis de una distribución de frecuencias es la concentración de puntuaciones en la media, o el grado de inclinación de la distribución si se representa gráficamente, por ejemplo, en un histograma. Si la distribución tiene más picos que la distribución normal se dice que es leptocúrtica; si tiene menos picos se dice que es platicúrtica.

Las distribuciones de frecuencias también se utilizan en el análisis de frecuencias para descifrar códigos y se refieren a la frecuencia relativa de las letras en diferentes idiomas.

  • Esquema
  • Índice

Estadísticas descriptivas

Datos continuos

Centro

  • Mediana
  • Modo

Dispersión

  • Varianza
  • Desviación estándar
  • Desviación media absoluta
  • Coeficiente de variación
  • Percentil
  • Gama
  • Rango intercuartil

Forma

    • Skewness
    • Kurtosis
    • L-momentos

Datos del recuento

  • Índice de dispersión

Cuadros resumen

  • Datos agrupados
  • Distribución de frecuencias
  • Tabla de contingencia

Dependencia

  • Correlación producto-momento de Pearson
  • Correlación de rango
  • Correlación parcial
  • Gráfico de dispersión

Gráficos

  • Gráfico de barras
  • Biplot
  • Diagrama de caja
  • Gráfico de control
  • Correlograma
  • Gráfico de abanico
  • Parcela forestal
  • Histograma
  • Gráfico circular
  • Gráfico Q-Q
  • Gráfico de la carrera
  • Gráfico de dispersión
  • Pantalla de tallo y hoja
  • Carta del radar
  • Parcela de violín

Recogida de datos

Diseño del estudio

  • Población
  • Estadística
  • Tamaño del efecto
  • Poder estadístico
  • Diseño óptimo
  • Determinación del tamaño de la muestra
  • Replicación
  • Datos que faltan

Metodología de la encuesta

    • estratificado
    • grupo

Experimentos controlados

  • Control científico
  • Experimento aleatorio
  • Ensayo controlado aleatorio
  • Asignación aleatoria
  • Bloqueo
  • Interacción
  • Experimento factorial

Diseños adaptativos

  • Ensayo clínico adaptativo
  • Diseños ascendentes y descendentes
  • Aproximación estocástica

Estudios de observación

  • Estudio transversal
  • Estudio de cohorte
  • Experimento natural
  • Cuasi-experimento

Inferencia estadística

Teoría estadística

  • Población
  • Estadística
  • Distribución de probabilidades
  • Distribución del muestreo
    • Estadística de pedidos
  • Distribución empírica
    • Estimación de la densidad
  • Modelo estadístico
    • Especificación del modelo
    • Lp espacio
  • Parámetro
    • ubicación
    • escala
    • forma
    • Probabilidad (monótona)
    • Familia a escala de ubicación
    • Familia exponencial
  • Integridad
  • Suficiencia
  • Estadística funcional
    • Bootstrap
    • U
    • V
  • Decisión óptima
    • función de pérdida
  • Eficiencia
  • Distancia estadística
    • divergencia
  • Asintótica
  • Robustez

Inferencia frecuencial

Estimación de puntos

  • Ecuaciones de estimación
    • Máxima probabilidad
    • Método de los momentos
    • Estimador M
    • Distancia mínima
  • Estimadores insesgados
    • Media-sin sesgo de mínima-varianza
      • Rao-Blackwellización
      • Teorema de Lehmann-Scheffé
    • Mediana no sesgada
  • Enchufe

Estimación de intervalos

  • Intervalo de confianza
  • Pivote
  • Intervalo de probabilidad
  • Intervalo de predicción
  • Intervalo de tolerancia
  • Remuestreo
    • Bootstrap
    • Jackknife

Comprobación de hipótesis

  • 1 y 2 colas
  • Potencia
    • La prueba más potente de manera uniforme
  • Prueba de permutación
    • Prueba de aleatorización
  • Comparaciones múltiples

Pruebas paramétricas

  • Relación de probabilidad
  • Puntuación/Multiplicador de rango
  • Wald

Pruebas específicas

  • Prueba Z (normal)
  • Prueba t de Student
  • Prueba F

Bondad de ajuste

  • Chi-cuadrado
  • Prueba G
  • Kolmogorov-Smirnov
  • Anderson-Darling
  • Lilliefors
  • Jarque-Bera
  • Normalidad (Shapiro-Wilk)
  • Prueba de razón de verosimilitud
  • Selección de modelos
    • Validación cruzada
    • AIC
    • BIC

Estadísticas de la clasificación

  • Firma
    • Mediana de la muestra
  • Rango firmado (Wilcoxon)
    • Estimador de Hodges-Lehmann
  • Suma de rangos (Mann-Whitney)
  • Anova no paramétrico
    • 1 vía (Kruskal-Wallis)
    • 2 vías (Friedman)
    • Alternativa ordenada (Jonckheere-Terpstra)

Inferencia bayesiana

  • Probabilidad bayesiana
    • antes
    • posterior
  • Intervalo creíble
  • Factor de Bayes
  • Estimador bayesiano
    • Estimador máximo posterior
  • Correlación
  • Análisis de regresión

Correlación

  • Producto-momento de Pearson
  • Correlación parcial
  • Variable de confusión
  • Coeficiente de determinación

Análisis de regresión

  • Errores y residuos
  • Validación de la regresión
  • Modelos de efectos mixtos
  • Modelos de ecuaciones simultáneas
  • Splines de regresión adaptativa multivariante (MARS)

Regresión lineal

Predictores no estándar

  • Regresión no lineal
  • No paramétrico
  • Semiparamétrico
  • Isotónico
  • Robusto
  • Heteroscedasticidad
  • Homocedasticidad

Modelo lineal generalizado

  • Familias exponenciales
  • Regresiones logísticas (Bernoulli) / Binomial / Poisson

Partición de la varianza

  • Análisis de la varianza (ANOVA, anova)
  • Análisis de covarianza
  • ANOVA multivariante
  • Grados de libertad

Categóricos / Multivariantes / Series temporales / Análisis de supervivencia

Categórico

  • Kappa de Cohen
  • Tabla de contingencia
  • Modelo gráfico
  • Modelo logarítmico-lineal
  • Prueba de McNemar
  • Estadísticas de Cochran-Mantel-Haenszel

Multivariante

  • Regresión
  • Manova
  • Componentes principales
  • Correlación canónica
  • Análisis discriminante
  • Análisis de conglomerados
  • Clasificación
  • Modelo de ecuaciones estructurales
    • Análisis de factores
  • Distribuciones multivariadas
    • Distribuciones elípticas
      • Normal

Series temporales

General

  • Descomposición
  • Tendencia
  • Estacionariedad
  • Ajuste estacional
  • Alisamiento exponencial
  • Cointegración
  • Rotura estructural
  • Causalidad de Granger

Pruebas específicas

  • Dickey-Fuller
  • Johansen
  • Estadística Q (Ljung-Box)
  • Durbin-Watson
  • Breusch-Godfrey

Dominio del tiempo

  • Autocorrelación (ACF)
    • parcial (PACF)
  • Correlación cruzada (XCF)
  • Modelo ARMA
  • Modelo ARIMA (Box-Jenkins)
  • Heteroscedasticidad condicional autorregresiva (ARCH)
  • Autoregresión vectorial (VAR)

Dominio de la frecuencia

  • Estimación de la densidad espectral
  • Análisis de Fourier
  • Wavelet
  • Probabilidad de Whittle

Supervivencia

Función de supervivencia

  • Estimador de Kaplan-Meier (límite del producto)
  • Modelos de riesgos proporcionales
  • Modelo de tiempo de fallo acelerado (AFT)
  • Primer tiempo de golpeo

Función de peligro

  • Estimador Nelson-Aalen

Prueba

  • Prueba de rango logarítmico

Aplicaciones

Bioestadística

Estadísticas de ingeniería

  • Quimiometría
  • Ingeniería de métodos
  • Diseño probabilístico
  • Proceso / control de calidad
  • Fiabilidad
  • Identificación del sistema

Estadísticas sociales

  • Ciencias actuariales
  • Censo
  • Estadísticas sobre la delincuencia
  • Demografía
  • Econometría
  • Jurimetría
  • Cuentas nacionales
  • Estadísticas oficiales
  • Estadísticas de población
  • Psicometría

Estadísticas espaciales

  • Cartografía
  • Estadísticas medioambientales
  • Sistema de información geográfica
  • Geoestadística
  • Kriging


 

Preguntas y respuestas

P: ¿Qué es una distribución de frecuencias?


R: Una distribución de frecuencias es una lista de los valores que toma una variable en una muestra, ordenados por cantidad. Muestra el número de veces que aparece cada valor.

P: ¿Qué aspecto puede tener la distribución de frecuencias de las respuestas a una escala Likert de cinco puntos?


R: La distribución de frecuencias de las respuestas a una escala Likert de cinco puntos podría tener el aspecto de una simple tabla que muestra el número de personas que han valorado cada punto de la escala.

P: ¿Cuáles son los dos inconvenientes de utilizar este tipo de tabla?


R: Dos inconvenientes de utilizar este tipo de tabla son que puede ser difícil o incluso imposible cuando se trata de valores continuos o cuando hay demasiados valores posibles.

P: ¿En qué se diferencia este esquema cuando se trata de valores continuos o de un gran número de valores posibles?


R: Cuando se trata de valores continuos o de un gran número de valores posibles, se puede utilizar un esquema ligeramente diferente basado en el rango de valores.

P: ¿Qué aspecto puede tener la tabla de frecuencias para las alturas de los alumnos?


R: La tabla de frecuencias para las alturas de los alumnos podría mostrar rangos y cuántos alumnos entran en cada rango.


P: ¿Qué información proporciona la distribución de frecuencias?


R: La distribución de frecuencias proporciona información sobre la frecuencia con la que aparecen ciertas variables en las muestras y cómo se distribuyen en ellas.

AlegsaOnline.com - 2020 / 2023 - License CC3