top of page
< Back

Distribución de Frecuencias

Limites, fronteras, anchuras, huecos.

Tabla de ganadoras del Oscar por rangos de edades.

Tabla de ganadoras del Oscar por rangos de edades.

Definición

Una distribución de frecuencias (o tabla de frecuencias) lista valores de los datos (ya sea de manera individual o por grupos de intervalos), junto con sus frecuencias (o conteos) correspondientes.

  • Cuando trabajamos con grandes conjuntos de datos, a menudo es útil organizarlos y resumirlos al construir una tabla llamada distribución de frecuencias.

  • Una distribución de frecuencias nos ayuda a entender la naturaleza de la distribución de un conjunto de datos.

Ejemplos de usos

1. Power BI

Al abrir Power Query dentro de Power BI se puede elegir una opción para visualizar cada una distribución de frecuencias dentro de cada columna. De esta manera se puede observar la naturaleza de los datos contenidos en cada columna como también aspectos tales como la contención de errores, la real necesidad de cada columna, la utilidad como clave para el conjunto de datos, etc.

2. Investigación de autoría

En su libro de Estadistica, Mario Triola cita un ejemplo de análisis o investigación hecho en base a distribución de frecuencias, en este caso de las palabras que usan los escritores en sus textos. Entre 1787 y 1788, Alexander Hamilton, John Jay y James Madison publicaron, de forma anónima, el famoso diario  Federalist Papers, en un intento por convencer a los neoyorquinos de que deberían ratificar la Constitución.  Se conoció la identidad de la mayoría de los autores de los artículos, pero la autoría de 12 de éstos siguió siendo motivo de discusión. Mediante el análisis estadístico de las frecuencias de varias palabras, se puede  concluir que  probablemente James Madison era el autor de esos 12 documentos. En muchos de los artículos disputados, la evidencia en favor de la autoría de Madison es abrumadora, al grado de que es casi  seguro de que esta arirmación es correcta.


De que se trata

La tabla de la imágen es una distribución de frecuencias que resume las edades de las actrices ganadoras del premio Óscar. (Estadística-Mario Triola). 

La frecuencia de una clase en particular es el número de valores originales que caen en esa clase. Por ejemplo, la primera clase de la tabla tiene una frecuencia de 28, que indica que 28 de las edades originales están entre los 21 y los 30 años inclusive.

Tabla de ganadoras del Oscar

Edad    Frecuencia

21-30     28

31-40     30

41-50     12

51-60     02

61-70     02

71-80     02


Construcción de una distribución de frecuencias

  1. Probar con un numero de clases tentativos para dividir la muestra. Este debe estar entre 5 y 20. El número que elija puede verse afectado por la comodidad de usar cifras enteras.

  2. Calcular Anchura de clase, como la diferencia entre el valor más alto y el valor más bajo sobre el número de clases. Redondear este resultado para obtener un número más adecuado. (Generalmente se redondea hacia arriba). Es probable que necesite cambiar el número de clases, pero la prioridad debe ser utilizar valores que sean fáciles de comprender.

  3. Punto de partida: Comenzar por elegir un número para el límite inferior de la primera clase. Elija el valor del dato más bajo o un valor conveniente que sea un poco más pequeño.

  4. Usando el límite inferior de la primera clase y la anchura de clase, listar los demás límites de clase inferiores. (Sumar la anchura de clase al punto de partida para obtener el segundo límite de clase inferior. Después sumar la anchura de clase al segundo límite de clase inferior para obtener el tercero, y así sucesivamente).

  5. Anotar los límites inferiores de clase en una columna vertical y luego proceda a anotar los límites superiores de clase, que son fáciles de identificar.

  6. Poner una marca en la clase adecuada para cada dato. Utilizar las marcas para obtener la frecuencia total de cada clase.

Distribución de frecuencias relativas

Una variante importante de la distribución básica de frecuencias utiliza las frecuencias

relativas, que se obtienen fácilmente dividiendo cada frecuencia de clase entre el total de frecuencias.

Una distribución de frecuencias relativas incluye los mismos límites de clase que una distribución de frecuencias, pero utiliza las frecuencias relativas en vez de las frecuencias reales. Las frecuencias relativas en

ocasiones se expresan como porcentajes.


Distribución de frecuencias acumulativas

Otra variante de la distribución de frecuencias estándar se utiliza cuando se buscan totales acumulativos.

La frecuencia acumulativa de una clase es la suma de las frecuencias para esa clase y todas las clases anteriores. 


Huecos en distribuciones de frecuencia

En el contexto de las distribuciones de frecuencia, los "huecos" se refieren a intervalos o rangos en los que no se encuentran datos, es decir, no hay observaciones o frecuencias correspondientes a esos valores específicos. Estos huecos pueden proporcionar información valiosa sobre la naturaleza de los datos y las características subyacentes de la distribución.


El significado y causas de los huecos, se pueden resumir en:

  1. Anomalías o Rarezas en los Datos: La presencia de huecos puede indicar anomalías en los datos. Por ejemplo, si se está analizando la distribución de edades en una población y hay un hueco entre los 30 y 35 años, podría sugerir una situación particular que afectó a esa cohorte específica.

  2. Segmentación Natural: Algunos huecos pueden reflejar segmentaciones naturales o estructurales en los datos. Por ejemplo, en el caso de una distribución de ingresos, puede haber huecos debido a niveles salariales estandarizados (salarios mínimos, escalas salariales fijas, etc.).

  3. Errores en la Recolección de Datos: Los huecos también pueden surgir debido a errores en la recolección de datos. Pueden faltar datos debido a problemas técnicos, errores humanos, o porque ciertos valores no se registraron.

  4. Preferencias o Restricciones: En algunos contextos, ciertos valores pueden ser preferidos o evitados por diversas razones, creando huecos en la distribución. Por ejemplo, los precios de los productos pueden tener huecos si ciertos puntos de precio no son utilizados por razones de estrategia de mercado.

Identificación y Representación de Huecos

Los huecos pueden ser identificados y visualizados de varias maneras en una distribución de frecuencia:

  • Histogramas: En un histograma, los huecos aparecen como barras ausentes o de altura cero en los intervalos correspondientes.

  • Tablas de Frecuencia: En una tabla de frecuencia, los huecos se observan como intervalos con frecuencia igual a cero.

  • Gráficos de Línea o de Área: En estos gráficos, los huecos aparecen como segmentos planos o caídas abruptas a lo largo del eje de las frecuencias.

Ejemplos de huecos posibles

  1. Distribución de Calificaciones: Supongamos una distribución de calificaciones en un examen donde las calificaciones posibles van de 0 a 100. Si ningún estudiante obtuvo una calificación entre 50 y 60, habrá un hueco en ese rango.

  2. Distribución de Tiempos de Viaje: En un análisis de tiempos de viaje, puede haber huecos debido a ciertos horarios de transporte que no están disponibles, como periodos sin servicio de autobuses o trenes.

  3. Distribución de Edades en un Evento: En un evento dirigido a adolescentes y adultos jóvenes, puede haber un hueco en las edades de 30 a 40 años si ese grupo demográfico no está representado.

Implicaciones de los Huecos

  • Análisis e Interpretación: Los huecos deben ser analizados cuidadosamente para entender su causa. Pueden proporcionar pistas sobre tendencias subyacentes, comportamientos o problemas en los datos.

  • Decisiones Informadas: En algunos casos, los huecos pueden influir en la toma de decisiones. Por ejemplo, en marketing, identificar huecos en la distribución de preferencias de los consumidores puede ayudar a descubrir nichos de mercado desatendidos.

bottom of page