Distribución Binomial
P(x éxitos en n pruebas)
Distribución de probabilidad binomial
Distribución de Probabilidad Binomial
Las distribuciones de probabilidad binomial nos permiten enfrentar circunstancias en las que los resultados pertenecen a dos categorías relevantes, tales como:
exito/fracaso
aceptable/defectuoso
sobrevivió/murió.
La descripción de la probabilidad binomial se amplía con la distribución de proporciones en un apartado correspondiente.
Definición
La distribución binomial describe la probabilidad de obtener un número fijo de éxitos en una serie de ensayos independientes, cada uno de los cuales tiene exactamente dos posibles resultados: éxito o fracaso. Los ensayos se denominan ensayos de Bernoulli.
La función de masa de probabilidad de la distribución binomial es:
P(X=k) = C(n,k) p^k (1−p)^[n-k]
donde:
n es el número de ensayos.
p denota la probabilidad de éxito en cada ensayo.
1-p es el complemento de p y es la probabilidad de fracaso en cada ensayo.
y tambien:
k es el número de éxitos (0, 1, 2, ..., n).
q denota la probabilidad de fracaso en uno de n ensayos.
X, denota un número específico de éxitos en n ensayos, de manera que x o k puede ser cualquier número entero entre 0 y n inclusive.
P(x) denota la probabilidad de lograr exactamente x éxitos en los n ensayos.
C(n,k) es el coeficiente binomial., Son las combinaciones de n tomadas de a k. Se ve también que son las formas en las que se pueden agrupar n ensayos con k de ellos.
Una distribución de probabilidad binomial resulta de un procedimiento que cumple con todos los siguientes requisitos:
1. El procedimiento tiene un número fijo de ensayos (n).
2. Los ensayos deben ser independientes. (El resultado de cualquier ensayo individual no afecta las probabilidades de los demás ensayos).
3. Todos los resultados de cada ensayo deben estar clasificados en dos categorías (generalmente llamadas éxito y fracaso).
4. La probabilidad de un éxito permanece igual en todos los ensayos (p).
Si un procedimiento satisface estos cuatro requisitos, la distribución de la variable aleatoria x (número de éxitos) se denomina distribución de probabilidad binomial (o distribución binomial).
El término éxito que se utiliza aquí es arbitrario y no necesariamente tiene una connotación positiva. Cualquiera de las dos categorías posibles puede denominarse el éxito E, siempre y cuando su probabilidad se identifique como p. Una vez que se designa una categoría como éxito E, debe aseerugarse de que p es la probabilidad de un éxito y que x es el número de éxitos.
Propiedades
Esperanza (Media) = E[X]=np
Varianza: Var(X) = np(1−p)
Desviación Estándar: σ = sqrt{np(1 - p)}
Aproximación Binomial para sucesos dependientes
Cuando seleccionamos una muestra (como una encuesta) para algún análisis estadístico, por lo general realizamos el muestreo sin reemplazo, y el muestreo sin reemplazo implica sucesos dependientes, lo cual viola el segundo requisito de la definición anterior. Sin embargo, a menudo se utiliza la siguiente regla práctica (porque los errores son insignificantes): cuando se hace un muestreo sin reemplazo, los sucesos pueden tratarse como si fueran independientes, si el tamaño de la muestra no es mayor que el 5% del tamaño de la población.
Ejemplo
Supongamos que lanzamos una moneda 10 veces y queremos saber la probabilidad de obtener exactamente 4 caras. Aquí, el número de ensayos n=10 y la probabilidad de éxito p=0.5 (ya que una moneda equilibrada tiene una probabilidad de 0.5 de salir cara).
La probabilidad se calcula usando la función de masa de probabilidad binomial:
P(X=4 )=C(10,4) (0.5)^4 ( 0.5)^[10−4]
P(X=4) = 10! / 4!(10−4)! (0.5)^4 (0.5)^6
P(X=4) = 210×0.0625×0.015625
P(X=4) = 0.205078125
Aplicaciones y Uso
1. Control de Calidad en Manufactura
Una fábrica de automóviles puede utilizar la distribución binomial para asegurarse de que el número de defectos en una muestra de 100 autos no exceda un cierto límite. Si la probabilidad de que un auto sea defectuoso es 0.01, la empresa puede calcular la probabilidad de encontrar más de 5 autos defectuosos en la muestra, lo cual podría indicar un problema en el proceso de producción.
2. Ensayos Clínicos
Un nuevo tratamiento para la diabetes tiene una tasa de éxito del 70%. En un ensayo con 20 pacientes, la distribución binomial puede ser utilizada para calcular la probabilidad de que al menos 15 pacientes respondan favorablemente al tratamiento, ayudando a evaluar la efectividad del mismo.
3. Marketing
Una empresa de software envía una campaña de marketing a 500 clientes potenciales, sabiendo que la tasa de conversión es del 3%. Utilizando la distribución binomial, la empresa puede calcular la probabilidad de obtener al menos 20 nuevas suscripciones, lo que ayuda en la planificación y evaluación de la campaña.
4. Finanzas y Seguros
En finanzas, los analistas usan la distribución binomial para modelar la probabilidad de ciertos eventos, como incumplimientos de préstamos. En seguros, la distribución binomial puede ayudar a modelar el número de reclamos que una compañía de seguros puede esperar en un período determinado, basado en la probabilidad histórica de que un cliente presente un reclamo.
5. Deportes
En deportes, la distribución binomial se utiliza para modelar el rendimiento de los jugadores. Por ejemplo, en béisbol, la probabilidad de que un jugador consiga un hit en un determinado número de turnos al bate puede ser modelada con una distribución binomial.
6. Legales
Se ha usado este modelo para analizar la probabilidad de que al constituir un jurado haya habido o no discriminación.
Ejemplo. Seleccion de miembros de un jurado y discriminación:
En el caso de Castaneda contra Partida se señaló que, aunque el 80% de la población de un condado en Texas es méxico-estadounidense, sólo el 39% de quienes fueron llamados para integrar el jurado pertenecían a este grupo. Supongamos que necesitamos seleccionar a 12 jueces de una población integrada en un 80% por méxico-stadounidenses, y que deseamos calcular la probabilidad de que, de 12 jueces elegidos al azar, exactamente 7 sean méxico-estadounidenses.
a. ¿Este proceso dará por resultado una distribución binomial?
b. Si este proceso da por resultado una distribución binomial, identifique los valores de n, x, p y q.
Interpretación:
a. Este procedimiento sí satisface los requisitos de una distribución binomial, como se indica a continuación.
El número de ensayos (12) es fijo.
Los 12ensayos son independientes. (Técnicamente, los 12ensayos implican una selección sin reemplazo y no son independientes, pero podemos suponer independencia porque estamos seleccionando al azar sólo a 12 miembros de una población muy grande.
Cada uno de los 12 ensayos tiene dos categorías de resultados posibles: el miembro del jurado elegido es méxico-estadounidense o no lo es.
Para cada miembro del jurado elegido, la probabilidad de que sea méxico-estadounidense es de 0.8 (porque el 80% de la población es méxico- estadounidense). Esa probabilidad de 0.8 es la misma para cada uno de los miembros del jurado.
b. Una vez que concluimos que el procedimiento dado sí da por resultado una distribución binomial, ahora procedemos a identificar los valores de n, x, p y q.
Con 12 jueces elegidos, tenemos que n 12.
Buscamos la probabilidad de exactamente 7 méxico-estadounidenses, entonces x 7.
La probabilidad de éxito (elegir a un méxico-estadounidense) en una selección es 0.8, por lo tanto, p 0.8.
La probabilidad de fracaso (no elegir a un méxico-estadounidense) es 0.2, por lo tanto, q 0.2.
La solución de este problema, que tiene gran trascendencia en la vida social y en la estadística está hecha en python, está documentada en mi blog y los cálculos están en jupiter notebook.
La distirbución de probabilidad binomial es también la distribución de proporciones y se encuentra explicada y estudiada en python en un jupyter notebook en mi github.
La distribución de probabilidad binomial es un concepto que se amplía con la distribución de proporciones que esta desarrollada en otro apartado.