top of page

Sesgo

Tipos. Simetría. Sesgos Positivo y Negativo

Distribuciones normal y sesgadas

Distribuciones normal y sesgadas

Sesgo

En estadística, el sesgo se refiere a un error sistemático que conduce a estimaciones que no son representativas de la población que se está estudiando. El sesgo puede introducirse en cualquier etapa del proceso de investigación y puede provenir de diversas fuentes, tales como el diseño del estudio, la selección de la muestra, la recopilación de datos o el análisis de datos. Es importante identificar y minimizar el sesgo para asegurar que los resultados sean válidos y confiables.


Tipos de sesgos

En el cuadro correspondiente pueden verse los distintos tipo de riesgo con sus causas. Es así que los sesgos más comunes o frecuentes son los sesgos de:

  1. Selección: debido a la forma en que se seleccionan parcicipantes o muestras.

  2. Información: consecuencia de la recolección, registro o manejo incorrecto de los datos.

  3. Observación: causado por la forma en que se observan o registran los datos.

  4. Publicación: cuando se publican solo estudios con resultados positivos o significativos.

  5. Respuesta: causado por respuestas inexactas o deshonestas de los participantes.

  6. Confusión: debido a la influencia de una tercera variable no considerada en el análisis.

  7. Atribución: por a la forma en que se registran los resultados dependiendo de factores no relacionados al tratamiento en estudio.

  8. Recuerdo: debido a la falta de precisión en la memoria de los participantes sobre eventos pasados.

  9. Sobrestimación: donde los métodos de medición tienden a sobrestimar los valores reales.

  10. Subestimación: cuando los métodos de medición tienden a subestimar los valores reales.

En un archivo jupyter notebook en github está compartido el código en donde se muestran las graficas de algunos tipos de sesgo como los que se ven en la figura corresondientes (sesgos de selección, información, confución).


Distribución sesgada

Una distribución de datos está sesgada si no es simétrica y se extiende más hacia un lado que hacia el otro. 

  • Una distribución de datos es simétrica si la mitad izquierda de su histograma es aproximadamente una imagen en espejo de su mitad derecha.

Una comparación de la media, la mediana y la moda puede revelar información acerca de las características de sesgo,

  • Los datos sesgados a la izquierda (lo que también se conoce como sesgo negativo poseen una cola izquierda más larga, y la media y la mediana se encuentran a la izquierda de la moda. 

  • Aunque no siempre es posible predecirlo, los datos sesgados a la izquierda suelen tener una media menor a la mediana, como sucede en la figura. 

  • Los datos sesgados a la derecha (lo que también se denomina sesgo positivo) poseen una cola derecha más larga, y la media y la mediana se encuentran a la derecha de la moda. 

  • Aunque no siempre es posible predecirlo, en los datos sesgados a la derecha la media suele estar a la derecha de la mediana, como ocurre en la figura.

En la práctica, muchas distribuciones de datos son simétricas y carecen de sesgo. Las distribuciones sesgadas hacia la derecha son más comunes que las sesgadas hacia la izquierda, ya que con frecuencia es más fácil obtener valores excepcionalmente grandes que valores excepcionalmente pequeños. 


Por ejemplo, en el caso de los ingresos anuales, es imposible obtener valores por debajo del límite inferior de cero, pero hay algunas personas que ganan millones de dólares en un

año. Por lo tanto, el ingreso anual tiende a mostrar un sesgo hacia la derecha.


En la grafica se observan distribuciones centradas, sesgadas y sus definiciones como también se observan ejemplos continuos y discretos de tales distribuciones. Estas graficas y sus ejemplos se comparten en un jupyter notebook en github.


Referencias:

Estadística - Mario Triola

bottom of page