top of page
< Back

Estadística inferencial

Criterios y proceso de inferencia

Proceso de estadística inferencial

Proceso de estadística inferencial

Las dos actividades principales de la estadística inerencial son:

  1. estimar un parametro poblacional

  2. probar una hipótesis o afirmación con respecto a un parametro poblacional.

La estadistica inferencial nos permite sacar cocluciones o inferencias sobre una población en base a los datos de una muestra de la misma.

  • La población es el grupo completo en el cual estamos interesados.

  • La muestra es un grupo más pequeño que es parte de la población objeto de estudio.

Las muestras se usan para hacer inferencias (estimaciones) sobre una población. Así es  como es estiman los parametros poblacionales.

Las muestras suelen usarse porque la población completa suele ser imposible de estudiar.


Hipótesis y Prueba de Hipótesis

  • hipótesis, es una aseveración o afirmación acerca de una propiedad de una población.

  • prueba de hipótesis o prueba de sifnificancia, es un procedimiento para probar una aseveración o afirmación acerca de una propiedad de una población.

Ejemplos

Mario Triola, en su libro Estadística cita algunos ejemplos de estudios estadísticos con pruebas de hipotesis:

  • Laboral: Una nota periodistica afirma que la mayoría de los empleados consiguen trabajo por medio de redes de contactos.

  • Medicina: Investigadores médicos aseveran que la temperatura corporal media de los adultos sanos no es igual a 98.6°F.

  • Aviación: La FAA afirma que el peso promedio de un pasajero de aeronave (incluido equipaje de mano) es 185libras mayor que hace 20 años.

Proceso y métodos de inferencia

Hipostesis

Para inferir algo, lo primero es definir una hipotesis o supuesto que se desea comprobar o testear.

Por ejemplo se desea comprobar que una droga tiene un efecto en la presión sanguinea como para luego usarla en las prescripciones médicas, sie comprueba que este efecto es positivo. En cualquier caso lo primero que hay que comprobar es: La droga tiene un efecto en la presión sanguinea.

Población y muestra

Para probar algo, lo segundo es definir la población y obtener una muestra representativa de la misma.

Por ejemplo si se desea comprobar que una droga tiene un efecto positivo (o negativo) en la presión sanguinea de la población mundial entonces se trabaja para obtener una muestra representativa de esta población.

Tamaño de la muestra

Por supuesto que cuanto más pequeña sea la muestra mas impreciso puede resultar el resultado del análisis. Sin embargo, hay metodos de prueba de hipotesis que permiten trabajar con muestrs relativamente pequeñas.

Metodos de Inferencia

Los problemas de inferencias estadísticas suelen agruparse en problemas de estimación, intervalos o sets de confianza o pruebas de hipotesis. Usamos estos métodos para determinar el valor de cantidades que en realidad no podemos observar totalmente yhacer declaraciones sobre ellos.

Para entender mejor las inferencias menciono a continuación ejemplos de DJ Hand en su libro "Statistics"-Ed.Oxford.:

  • Para determinar la velocidad de la luz se realizan distintos procedimientos de medición, pero ninguno es perfecto y si epitieramos el ejercicio, probablemente obtendríamos valores ligeramente diferentes cada vez. La puntería se afina cuanto mayor es la cantidad de mediciones y cuanto mayor es el tamaño de la muestra.

  • En un ensayo clínico aleatorio simple, podríamos dar una nueva droga (farmaco) a un gupo de pacientes y un farmaco estandar a otra muestra. Basado en observaciones de los efectos en estos dos grupos de pacientes podremos hacer  conclusiones o inferencias sobre la eficacia relativa del nuevo fármaco. En otras palabras podremos estimar la efectividad de los dos medicamentos que podríamos esperar si perscribiéramos cada uno de los fármacos a la población general de pacientes. Y también podremos estimar con que grado de confianza podemos sostener las conclusiones que saquemos.

  • Un antropólogo podría estimar las alturas de las personas de un grupo en su estudio. Para esto podría basarse en distribuciones de probabilidad con base en sus muestras. Con una istribución de probabilidad como la normal por ejemplo podría caracterizar la distribución de las alturs y necesitará encontrar la media y la desviación estandar de esta deistribución.

Test o prueba de Hipotesis

Existen una gran cantidad de problemas en los cuales, en vez de estimar el valor de un parámetro, debemos decidir si una afirmación relativa a un parametro es verdadera o falsa.  Miller y Freund, en "Probabilidad y Estadística para Ingenieros", propone el siguiente ejemplo:

En un trabajo de control de calidad una muestra aleatoria puede servir para determinar el hecho de que la medida del proceso ha permaneido inalterada o bien si ha cambiado a tal grado que el proceso esté fuera de control y tengan que hacerse ajustes.

Test de hipotesis es un metodo que se elije y se usa para probar un supuesto que se desea comprobar (hipotesis) sobre una población usando una muestra.

Hay una gran cantidad de test de hipotesis así como también hay guias en base a experiencias para elegir el o los metodos correctos para cada estudio. Entre estas pruebas las más conocidas son t-Test, Binomial Test, Chi-square test. También hay metodos de prueba de hipotesis para probar la correlación de variables, como los métodos de correlación y regresión.


Contraste de Hipotesis

El contraste de hipotesis es una prueba que sirve para decidir, con cierta probabilidad si una afirmación es cierta o falsa. El contraste de hipotesis se hace definiendo las hipotesis nula y alternativa que se desean estudiar. 

  • La hipotesis nula (H0) es la eque se asume como verdadera hasta que se demuestre lo contrario.

  • La hipotesis alternativa (H1) es la que se asume con opuesto o contrario a la hipotesis nula.

En otras palabras:

  • La hipotesis nula es la que asumimos como cierta por defecto, 

  • La hipotesis alternativa es la que pretende refutar la hipotesis nula.

Ejemplos: 

En una partida de envases de leche se desea probar si el contenido es exactamente 1 litro tal y como dice el envase. Entonces:

  • La hipotesis nula es que la media de el contenido de los envases de leches es igual a 1 litro.  Ho: µ =1.

  • La hipotesis alternativa es que la media del contenido de los envases de leches es igual a 1 litro. H1: µ<>1.

Es conocido cuan dañino es el contenido de sal en el pan para la hipertensión arterial. Para esto en muchos países se controla que el contenido sea bajo. Por ejemplo se inspecciona que el contenido de sal en las muestras de sal sea como máximo 1,5%. Entonces:

  • La hipotesis nula es que la muestra tenga como máximo una proporción de 1.5% de sal. Ho: p <= 1,5%:

  • La hipotesis alternativa es que la muestra tenga una proporción mayor al 1,5% de sal. H1: p > 1,5%.

Hipotesis Nula

El término hipotesis nula se utiliza principalmente para designar cualquier hipótesis formulada para ver si puede ser rechazada.

Por ejemplo, si queremos demostrar que un sistema cloud es más costoso que otro, entonces planteamos la hipótesis nula de que los dos sistemas cloud cuestan exactamente lo mismo.

La idea de formular una hipotesis nula no carece de sentido, aun en un pensamiento no estadístico. Esto es lo que ocurre en los tribunales donde un acusado se le considera inocente mientras no se demuestre que es culpable "más allá de toda duda".  En este caso la hipótesis nula establece que el acusado NO es culpable y la probabilidad se expresa subjetivamente por la frase "más allá de toda duda". En importante destacar que la obligación de probar está siempre en la parte acusadora.

De manera análoga en hipótesis estadísticas el planteo de una hipótesis lleva consigo la necesidad de probar esta hipotesis frente a la probabilidad que se pruebe una hipótesis nula, siendo esta ultima lo contrario u opuesto a lo que se quiere probar.

En el uso de la hipótesis nula, por ejemplo si se desea comprobar que una droga tiene un efecto positivo (o negativo) en la presión sanguinea de la población mundial entonces se plantea la "hipotesis nula": esta droga no tiene efecto en la población. Entonces consideramos que la gente que toma la droga y la gente que no toma la droga tienen la misma presión sanguínea en general. Ahora bien si tomamos una muestra y comprobamos que la droga sí tiene un efecto notable en la presión sanguínea entonces podemos plantearnos la pregunta ¿Qué probabilidad hay de extraer una muestra así o una que se desvíe aún más si la droga realmente no tiene efecto? Si la probabilidad es muy baja entonces debemos preguntarnos si realmente la droga no tiene efecto o si en realidad si lo tiene. Y si tenemos suficiente evidencia de que esta probabilidad es muy baja entonces terminaremos rechazando la hipotesis nula.

En resumen el test de hipótesis, tiene tres pasos que son:

Construimos un criterio para probar lahipótesis nula contra la alternativa determinadas, definiendo un valor p de probabilidad a partir del cual se rechaza la hipotesis nula.

Definición de Hipotesis Nula y Alternativa

Elegir adecuadamente las hipotesis nula y alternativas es importante porque puede dar lugar a malas interpretaciones y conclusiones. Frecuentemente se utilizan dos criterios el de la demostración por defecto  el de la facilidad de análisis.

Pretensión de demostración

  • La hipotesis alternativa es aquello que se pretende demostrar, mientras que la nula es lo que se quiere refutar.

  • La hipótesis nula es aquello que se pretende refutar.

Por ejemplo, frente a una denuncia a una panadería, si quiero demostrar que una muestra de pan tiene más sal que la permitida entonces:

  • H1: p > 1,5% . El pan tiene mas sal que la proporción permitida.

  • H0: p <=1.5%.  El pan está bien y no tiene mas sal que la proporción permitida.

Facilidad de anlálisis

Muchas veces la información disponible hace que sea más sencillo plantear la hipotesis nula con la expresion más fácil.

Por ejemplo, Si quiero contrastar que tan bien llenos están los envases de 1 litro de leche de una partida de una fabrica entonces puedo plantear:

H0: µ = 1, El promedio del contenido de los envases es exantamente igual a 1 litro y están bien llenadas.

H1: µ <> 1. El promedio del contenido de los envases es distinto de 1 litro si se llenan mal en promedio.

En su gran mayoría la facilidad de interpretación y de cálculo hace que ambos criterios mencionados coincidan. 

En estos casos la hipototesis nula es la que damos por cierta por defecto y la hipotesis alternativa es la que pretende refutar la hipotesis por defecto. 

Por ejemplo, y para los ejemplos mencionados que ve que Ho es la opción o hipotesis buena o cierta por defecto. Esto es así porque, cuando se realiza una prueba de hipótesis se pone a prueba la afirmación de la hipotesis nula. Se le dá a la hipotesis nula el beneficio de la duda y si hay suficientes pruebas se la rechaza.

Es lenguaje común la hipotesis nula es la hipotesis buena y no pasa nada, mientras que la hipotesis alternativa es que la buena es mentira y si pasan cosas. Es un poco como llevar el prisionero ante un jurado, y sentenciar al prisionaro si hay suficientes pruebas porque sino sale suelto y no pasa nada.

Exahustividad de las hipotesis nula y alternativas

Las hipotesis nula y su alternativa no tienen porque se exahustivas, es decir no tienen porqué cubrir todo el espectro de resultados posibles. 

Por ejemplo, un doctor duda de un remedio que dice que cura el 90% de pacientes con enfermedad. En este caso:

Ho: p = 90%. Hipótesis nula: El remedio cura al 90% de los pacientes.

H1: p < 90%. Hipótesis alternativa. El remedio cura a menos del 90% de los pacientes.

Como se ve en este caso, las hipotesis no son exahustivas porque en ningún caso se contempla la hipótesis de que la proporción de pacientes que se curan sea mayor al 90%. Es decir no se incluye que p > 90%.

Grado certeza y efectividad de las pruebas de hipótesis

Las pruebas de hipótesis no dan una prueba absoluta. Es decir que no tiene un grado absoluto y total de certeza. 

Sin embargo las pruebas de hipótesis permiten ver qué tan raros son realmente los resultados observados, bajo el supuesto de que su hipótesis nula es verdad. Si es extremadamente improbable que sus resultados le den sustento, entonces eso cuenta como evidencia de que la hipotesis nula es falsa.

Cuando se prueba una hipótesis, se asume que la hipótesis nula, es verdad. Si hay pruebas suficientes en su contra, se rechaza. y se dicide si aceptar la hipótesis alternativa. 

Por eso se dice que la hipotesis nula es la verdad comunmente aceptada o la verdad por defecto. La hipotesis alternativa desafía el estatus quo, y por ello en ella recae la carga de la prueba. 

En un contraste o prueba de hipotesis, la prueba aparece si la muestra contiene datos extremos, que no parecen haberse encontrado por simple casualidad. Es decir, lo que se observa en la muestra es significativamente diferente de lo que se esperaría ver si la hipótesis nula fuera cierta.

Nivel de Significancia

Para que una hipotesis pueda ser aceptada como cierta o rechazada como falsa, es necesario definir un criterio de aceptación y rechazo.

Esto estadísticamente significa definir dónde empiezan y acaban las regiones de aceptación y rechazo, que a su vez dependen de la  distribución de probabilildad del problema y de si se trata de una prueba de hipotesis unilateral o bi-lateral. 

En cualquier caso es importante definir un rago en el cual la prueba de la hipótesis nula es cierta y un rago donde la prueba es falsa. Así podremos definir el criterio exacto para determinar si una muestra está cerca o lejos de ser aceptable, es decir, si es ordinaria o extraordinaria. Para esto se utiliza el nivel de significación alpha y que sirve para definir el rango de aceptación de la prueba.

Alpha (α), es el área de la región de rechazo en un constraste. Es un valor de probabilidad y por lo tanto debe estar entre 0 y 1. Alpha (α o Alfa) siempre es un valor pequeño, frecuente se le asigna un valor de 5%. 

Algunas veces α puede ser menor. Cuanto más pequeña es α, más pequeña es la región de rechazo más facil es aceptar la hipótesis nula y se exige una prueba más extrema para rechazarla aceptando la alternativa. 

Así mismo cuanto más pequeña es α más grande es 1-α y por lo tanto cuanto más pequeña es α más pequeño el rango de rechazo y más grande el rango de aceptación.

En una prueba unilateral, α es una sola área de rechazo, en una prueba bilateral alfa se divide en dos sub-áreas de rechazo. En ambos casos alfa define un valor límite de aceptación o rechazo de la muestra que se denomina Zalfa (). es un valor que se encuentra sobre el eje de una distribución en el limite entre el área de rechazo y de aceptación y sirve para definir el rango de aceptación y rechazo.

Por ejemplo, en una prueba unilateral derecha con una distribución normal, si el área α de rechazo es del 5%, entonces le corresponde un valor de Zα=1,645. De esta manera a la derecha de este valor α estará una cola del 5% de la distribución normal. Con esto tomamos una mustra y calculamos el estadístico de la muestra que queremos probar (z) y vemos si cae a la derecha o a la izquierda de

Valor p

Hasta aquí ya se puede saber si la muestra podría ser aceptada o rechazada. Pero antes de decidir y para darle más rigor a la decisión, se suele calcular el valor p de la muestra.

El valor p es la probabilidad de encontrar una observacón que sea igual o más extrema que la de la muestra suponiendo que la hipótesis nula sea cierta.

Cuando una observación es extraña, muy alejada de lo esperado el valor p se hace muy pequeño. Entonces, 

  • si el valor p es menor que el nivel de significación α se rechaza la hipotesis nula.

  • si el valor p es mayor que el nivel de significación α se acepta la hipotesis nula.

En resumen, cuanto más pequeño es el valor p más improbable es que se repita la muestra observada o algo más extremo, por lo que podemos rechazar la hipotesis nula y podríamos aceptar entonces la hipotesis alternativa que es la que se desea probar.

Si el valor p es muy bajo signigica que el resultado de la muestra es poco probable que haya ocurrido por casualidad unicamente.


Regla del suceso infrecuente para la estadística inferencial

El valor p, se sostiene en una regla experimental de la estadística que se denomina regla del suceso infrecuente.  Esta regla afirma que:

Si, bajo un supuesto dado, la probabilidad de un suceso observado particular es excepcionalmente pequeña, concluimos que el supuesto probablemente es incorrecto.

Siguiendo esta regla, probamos una aseveración analizando datos muestrales en un intento por distinguir entre resultados que pueden ocurrir fácilmente por azar y resultados cuya ocurrencia es extremadamente improbable debido al azar.

Podemos explicar la ocurrencia de resultados extremadamente improbables al decir que en realidad ha ocurrido un suceso infrecuente o que el supuesto subyacente no es verdadero.

Se suele entender mejor este concepto con un ejemplo como el de la selección de sexo al concebir un bebé.


Cometer un error

Siempre existe la posibilidad de cometer un error. Los casos en los que se puede acertar y cometer errores son los siguientes.

Si en realidad la hipotesis nula si es cierta:

  • Si la decisión es aceptarla:, la decisión es correcta y no hay error.

  • Si la decisión es rechazarla, la decisión es incorrecta y el error es de tipo 1.

Si en realidad la hipotesis nula no es cierta :

  • Si la decisión es aceptarla, la decisión es incorrecta y el error es de tipo 2. 

  • Si la decisión es rechazarla, la decisión es correcta y no hay error.

Entonces

  1. Error tipo 1: Es cuando la hipotesis nula si es cierta y es rechazada.

  2. Error tipo 2: Es cuando la hipotesis nula no es cierta y es aceptada.

Resumen de los pasos para realizar una prueba de hipotesis

  1. Estudiar la población y definir sus estadísticos.

  2. Definir las hipotesis de contraste, nula y alternativa, H0 y H1.

  3. Elegir un nivel de significación alpha y debijar las regiones de aceptación y rechazo en función de las hipotesis de contraste.

  4. Tomar una muestra nueva y calcular los estadisticos de prueba y su valor p.

  5. Tomar la decisión.

Referencias

Estadística: Mario Triola.

DataTab https://datatab.net/statistics-book

bottom of page