Ley de Zipf

La ley de Zipf es una ley empírica, formulada mediante la estadística matemática, que lleva el nombre del lingüista George Kingsley Zipf, quien la propuso por primera vez.

La ley de Zipf establece que, dada una gran muestra de palabras utilizadas, la frecuencia de cualquier palabra es inversamente proporcional a su rango en la tabla de frecuencias. Así, la palabra número n tiene una frecuencia proporcional a 1/n.

Así, la palabra más frecuente aparecerá aproximadamente dos veces más que la segunda palabra más frecuente, tres veces más que la tercera palabra más frecuente, etc. Por ejemplo, en una muestra de palabras del idioma inglés, la palabra más frecuente, "the", representa casi el 7% de todas las palabras (69.971 de algo más de un millón). Siguiendo la ley de Zipf, la palabra "of", que ocupa el segundo lugar, representa algo más del 3,5% de las palabras (36.411 apariciones), seguida de "and" (28.852). Sólo se necesitan unas 135 palabras para dar cuenta de la mitad de las palabras de una muestra grande.

La misma relación se da en muchas otras clasificaciones, no relacionadas con la lengua, como los rangos de población de las ciudades de varios países, el tamaño de las empresas, los rankings de ingresos, etc. La aparición de la distribución en los rankings de ciudades por población fue advertida por primera vez por Felix Auerbach en 1913.

No se sabe por qué la ley de Zipf se mantiene para la mayoría de las lenguas.

Preguntas y respuestas

P: ¿Qué es la ley de Zipf?


R: La ley de Zipf es una ley empírica que establece que la frecuencia de una palabra en una muestra grande es inversamente proporcional a su rango en la tabla de frecuencias.

P: ¿Quién propuso la ley de Zipf?


R: La ley de Zipf fue propuesta por primera vez por George Kingsley Zipf, lingüista.

P: ¿Cómo explica la ley de Zipf la frecuencia de las palabras en una muestra de palabras inglesas?


R: Según la ley de Zipf, la palabra más frecuente en una muestra de palabras inglesas aparece aproximadamente el doble de veces que la segunda palabra más frecuente, el triple que la tercera palabra más frecuente, etc. Esta tendencia se mantiene a medida que disminuye el rango de la palabra.

P: ¿Qué porcentaje de todas las palabras representa la palabra más frecuente en una muestra de palabras inglesas?


R: En una muestra de palabras inglesas, la palabra que aparece con más frecuencia ("the") representa casi el 7% de todas las palabras.

P: ¿Cuál es la relación entre el número de palabras necesarias para dar cuenta de la mitad de la muestra y la frecuencia de esas palabras?


R: Según la ley de Zipf, sólo se necesitan unas 135 palabras para dar cuenta de la mitad de las palabras de una muestra grande.

P: ¿Qué otras clasificaciones presentan la ley de Zipf?


R: La misma relación que describe la ley de Zipf en la frecuencia de las palabras se da en otras clasificaciones no relacionadas con el lenguaje, como los rangos de población de las ciudades de varios países, el tamaño de las empresas y los rankings de ingresos.

P: ¿Quién se dio cuenta de la aparición de la distribución en las clasificaciones de ciudades por población?


R: La aparición de la distribución en los rankings de ciudades por población fue advertida por primera vez por Felix Auerbach en 1913.

AlegsaOnline.com - 2020 / 2023 - License CC3