Cuestión de Rachas
Aspectos a considerar en rachas

Aleatoriedad o tendencia no aleatoria
Cálculo de números críticos de rachas
Al utilizar los elementos A, A, B y B, ¿cuál es el número mínimo posible de rachas que pueden acomodarse? ¿Cuál es el número máximo de rachas? ¿Qué concluye usted acerca de este caso? ¿Es posible que la hipótesis nula nunca pueda ser rechazada? ¿porqué?
Número Mínimo de Rachas
La configuración que genera el mínimo número de rachas es cuando los elementos son agrupados. Por ejemplo:AA BB (2 rachas: "AA" y "BB")
Por lo tanto, el número mínimo de rachas es 2.
Número Máximo de Rachas
La configuración que genera el máximo número de rachas es cuando se alternan los elementos. Por ejemplo: ABAB (4 rachas: "A", "B", "A", "B")
Por lo tanto, el número máximo de rachas es 4.
3. Conclusiones
Con dos A y dos B, el número de rachas puede variar entre 2 y 4.
Esto ilustra que el número de rachas depende en gran medida de la disposición de los elementos en la secuencia. Un arreglo agrupado (como "AA BB") produce menos rachas que un arreglo alternado (como "ABAB").
4. En el caso específico de una secuencia con un número igual de elementos A y B (como A, A, B, B), la hipótesis nula de aleatoriedad puede ser difícil de rechazar, y aquí te explico por qué:
Razones:
Simetría en la Distribución: Al tener dos A y dos B, la distribución es simétrica. Esto significa que, independientemente de cómo se distribuyan, siempre hay configuraciones que pueden parecer aleatorias. Las configuraciones posibles (AA BB, ABAB, AABB, etc.) generan tanto rachas cortas como largas, lo que puede dar lugar a interpretaciones ambiguas sobre la aleatoriedad.
Tamaño de la Muestra: Con solo cuatro elementos, la muestra es pequeña, lo que limita la capacidad de los análisis estadísticos para detectar patrones significativos. En muestras pequeñas, es más difícil obtener resultados concluyentes que justifiquen el rechazo de la hipótesis nula.
Rachas Esperadas:En este caso, el número esperado de rachas, calculado a partir de la teoría de rachas, será relativamente cercano a las rachas observadas. Esto significa que cualquier desviación de las rachas observadas respecto a las esperadas no será lo suficientemente grande como para ser estadísticamente significativa.
Configuraciones Aleatorias:Todas las configuraciones posibles de A y B (dada su cantidad igual) pueden ser razonablemente interpretadas como secuencias aleatorias. Esto implica que no hay una clara preferencia por una configuración sobre otra, dificultando el rechazo de la hipótesis de aleatoriedad.
Conclusión:
En este tipo de configuraciones equilibradas y con muestras pequeñas, es probable que la hipótesis nula de aleatoriedad no pueda ser rechazada, ya que no hay suficiente evidencia para concluir que existe un patrón no aleatorio. Esto subraya la importancia de considerar tanto el tamaño de la muestra como la estructura de los datos al realizar pruebas de aleatoriedad.
Prueba de la aleatoriedad de las victorias en las series mundiales de béisbol.
Pruebe la aseveración de que la secuencia de triunfos en las series mundiales de los equipos de la American League y la National League es aleatoria.
Abajo se dan los resultados de los equipos de las ligas Americana y Nacional representados por A y N, respectivamente.
N A A A N N A A N N N N A A A N A N A N A A A N A N A A A N A N A
+ ¿Qué sugieren los resultados acerca de las habilidades de las dos ligas?
Para proceder a calcular con statsmodels hago la traduccion de N y A a 1 y 0.
N A A A N N A A N N N N A A A N A N A N A A A N A N A A A N A N A
1 0 0 0 1 1 0 0 1 1 1 1 0 0 0 1 0 1 0 1 0 0 0 1 0 1 0 0 0 1 0 1 0
En un archivo de jupyter notebook compartido en github, se realizan los calculos de este ensayo tanto por formulas como por statsmodels, con resultados análogos:
a. Resultado e interpretaciones de los cálculos por fórmulas
Cantidad de 1's (n1): 14
Cantidad de 0's (n2): 19
Cantidad de rachas (R): 22
E(R) = 17.12121212121212, Var(R) = 7.617883379247016, Z = 1.767643889280957
Interpretación: ∣Z∣ ≤ 1.96, no se rechaza H₀, indicando que no hay evidencia para concluir que la secuencia no es aleatoria.
b. Resultado en interpretaciones de los cálculos por statsmodels:
Analisis de Z y p
∣Z∣ ≤ 1.96, no se rechaza H₀, indicando que no hay evidencia para concluir que la secuencia no es aleatoria.
𝑝 > 0.05, no tenemos suficiente evidencia para rechazar la aleatoriedad.
Tanto por Z como por p se concluye que la aleatoriedad de la secuencia es posible
Es posible que la secuencia sea aleatoria y esto es una hipótesis que no se puede rechazar
Parece que las ligas ganan en una secuencia aleatoria
Salas de cine: Prueba de aleatoriedad por arriba y por debajo de la mediana.
Las tendencias en los negocios y la economía a menudo se analizan con la prueba de rachas. A continuación se incluye el número de salas de cine, listadas en orden por ren- glón para cada año, comenzando en 1987 (según datos de la National Association of Theater Owners). Primero calcule la mediana, luego reemplace cada valor por A si es- tá por arriba de la mediana y por D si está por debajo de la mediana. Después aplique la prueba de rachas a la secuencia resultante de A y D. ¿Qué sugiere el resultado sobre la tendencia en el número de salas de cine?
20,595 21,632 21,907 22,904 23,740 24,344 24,789 25,830 26,995
28,905 31,050 33,418 36,448 35,567 34,490 35,170 35,361
Los cálculos se realizan en jupyter notebook en github con python.
Interpretación de los Resultados
Mediana: Calculamos la mediana de los datos originales.
Secuencia "A" y "D": La secuencia muestra los valores por encima ("A") o por debajo ("D") de la mediana.
Prueba de rachas:Si el valor absoluto de
Z
es menor o igual a 1.96 (para un nivel de significancia del 5%), no hay evidencia suficiente para rechazar la hipótesis nula de aleatoriedad.
Sip
es mayor que 0.05, no hay evidencia para rechazar la aleatoriedad.
El resultado de la prueba nos indica si la secuencia de datos muestra una tendencia significativa o si los cambios son aleatorios. Esto puede sugerir si hay una tendencia en el número de salas de cine o no. Y los resultados son:
Mediana: 26995.0
Secuencia: ['D','D','D','D','D','D','D','D','D','A','A','A','A','A','A','A','A']
Número de rachas (R): 2
Valor Z: -3.7564758898615485
Valor p: 0.00017232286469859304
∣Z∣ > 1.96, se rechaza la hipótesis nula (H₀), lo que sugiere que la secuencia no es aleatoria.
El valor p << 0.05 y esto sugiere que si tenemos suficiente evidencia para rechazar la aleatoriedad.
Podemos aceptar como un hecho que el numero de salas de cine desde 1987 en adelante ha variado de manera no aleatoria.
Además observando los datos y la grafica correspondiente se deduce que las salas han crecido en número con tendencia creciente.



