top of page

Prueba del signo

Prueba no paramétrica

Ejemplo de prueba del signo aplicado al peso de los pacientes antes y después.

Ejemplo de prueba del signo aplicado al peso de los pacientes antes y después.

La prueba del signo es una prueba no paramétrica utilizada para evaluar si la mediana de una distribución es igual a un valor hipotético o para comparar dos muestras relacionadas. Esta prueba no hace suposiciones sobre la forma de la distribución de los datos, por lo que es adecuada para datos ordinales o aquellos que no siguen una distribución normal.

En la prueba del signo para datos apareados (también conocida como prueba del signo para dos muestras relacionadas), se evalúan las diferencias entre dos conjuntos de datos emparejados y se cuentan las veces que la diferencia entre las parejas es positiva o negativa, ignorando los casos en que la diferencia es cero. La hipótesis nula es que la mediana de las diferencias es cero, lo que implicaría que no hay una diferencia significativa entre los dos conjuntos de datos.


Pasos en la prueba del signo

  1. Calcular las diferencias entre los valores pareados.

  2. Contar los signos de las diferencias (positivas y negativas).

  3. Aplicar la prueba binomial para ver si las diferencias positivas y negativas se distribuyen de manera aproximadamente equitativa.


Hipótesis

  1. Hipótesis nula (H₀): La mediana de las diferencias es cero (es decir, no hay diferencia entre los grupos).

  2. Hipótesis alternativa (H₁): La mediana de las diferencias no es cero (existe una diferencia significativa entre los grupos).


Ejemplo

Supongamos que un grupo de pacientes antes y después de un tratamiento y deseas saber si hubo una mejora significativa en su salud. Compararías los valores antes y después, contando cuántos pacientes mejoraron y cuántos empeoraron.


Equivalente paramétrico

La prueba del signo es una versión no paramétrica de la prueba t de muestras relacionadas (o prueba t para datos apareados). Sin embargo, a diferencia de la prueba t, que evalúa si la media de las diferencias entre las parejas es significativamente diferente de cero, la prueba del signo evalúa si la mediana de las diferencias es significativamente diferente de cero.

  • La prueba t para datos apareados asume que las diferencias entre los pares siguen una distribución normal.

  • La prueba del signo no hace ninguna suposición sobre la distribución de las diferencias y es más adecuada cuando los datos no son normales o cuando se tienen datos ordinales.


Uso y aplicación de la prueba del signo

  • Cuando no se puede suponer la normalidad de los datos.

  • Cuando los datos son ordinales o se basan en rangos.

  • Cuando hay una pequeña cantidad de datos y la prueba t no sería adecuada debido a la violación de los supuestos paramétricos.


Limitaciones

La prueba del signo no toma en cuenta la magnitud de las diferencias, solo si son positivas o negativas, por lo que es menos poderosa que otras pruebas como la prueba de rangos con signo de Wilcoxon, que también considera los tamaños de las diferencias.


Ejemplo del peso de los pacientes

Un grupo de 8 pacientes se somete a una dieta y se mide su peso antes y después de la intervención. Queremos saber si hubo una disminución significativa en el peso tras la dieta. Los datos se ven en la tabla.


Calculo de las diferencias entre los pesos antes y después para cada paciente.

Paciente 1: 75 - 73 = 2 → positivo (+)
Paciente 2: 80 - 78 = 2 → positivo (+)
Paciente 3: 82 - 82 = 0 → ignorar (0)
Paciente 4: 90 - 85 = 5 → positivo (+)
Paciente 5: 70 - 70 = 0 → ignorar (0)
Paciente 6: 85 - 80 = 5 → positivo (+)
Paciente 7: 78 - 78 = 0 → ignorar (0)
Paciente 8: 88 - 85 = 3 → positivo (+)

De las 8 observaciones, tenemos 5 diferencias que son positivas y 3 que son cero, por lo que se ignoran.

Conteo de los signos

Positivos (+): 5
Negativos (-): 0

Prueba binomial para determinar si la cantidad de diferencias positivas es significativa. Bajo la hipótesis nula, se espera que la cantidad de diferencias positivas y negativas sea aproximadamente igual.

  • El número total de diferencias no nulas es 5.

  • La probabilidad de obtener una diferencia positiva bajo la hipótesis nula es 0.5.

  • Usamos la distribución binomial para calcular la probabilidad de obtener 5 o más diferencias positivas bajo la hipótesis de que la mediana de las diferencias es cero.

La probabilidad de obtener 5 diferencias positivas bajo la hipótesis nula es:

P(5 o más positivos)=C(5,5) × (0.5)⁵= 1×(0.5)⁵=0.03125

Dado que 0.03125 es menor que el nivel de significancia típico (0.05), rechazamos la hipótesis nula y concluimos que existe una disminución significativa en el peso tras la dieta.


Código python


Este código esta contenido en un jupyter notebooik compartido en github.


import numpy as np

from scipy.stats import binomtest


# Datos

peso_antes = np.array([75, 80, 82, 90, 70, 85, 78, 88])

peso_despues = np.array([73, 78, 82, 85, 70, 80, 78, 85])


# Calcular las diferencias

diferencias = peso_antes - peso_despues


# Contar diferencias positivas y negativas

positivos = np.sum(diferencias > 0)

negativos = np.sum(diferencias < 0)


# Realizar la prueba binomial

resultado = binomtest(positivos, n=positivos+negativos, p=0.5, alternative='greater')


print(f"Positivos: {positivos}, Negativos: {negativos}")

print(f"P-valor: {resultado}")


Interpretación del resultado:

El valor p es 0.03125, que es menor que 0.05 (nivel de significancia típico). Esto nos lleva a rechazar la hipótesis nula. En consecuencia, concluimos que los pacientes en promedio perdieron peso tras la dieta, lo que sugiere que la dieta fue efectiva.


Comparación entre la Prueba del Signo y las Pruebas de Wilcoxon

¿Es siempre mejor usar Wilcoxon que la Prueba del Signo?

No siempre. Aunque las pruebas de Wilcoxon (especialmente la de rangos con signo) son generalmente más potentes, hay situaciones donde la prueba del signo podría ser suficiente o preferible:

  1. Simplicidad y rapidez: Si solo necesitas saber si hay más diferencias positivas que negativas y no te interesa la magnitud de las diferencias, la prueba del signo es más rápida y fácil de calcular.

  2. Datos ordinales muy básicos: Si los datos solo están categorizados como mayores o menores sin una medición precisa de magnitud, la prueba del signo podría ser más apropiada, ya que Wilcoxon necesita los rangos.

  3. Cuando la potencia no es crítica: En situaciones donde no se requiere alta precisión o la muestra es pequeña, la prueba del signo puede ser suficiente.

Por otro lado Wilcoxon es preferible en los siguientes casos:

  1. Cuando la magnitud de las diferencias es importante.

  2. Si se quiere una prueba más poderosa para detectar diferencias.

  3. Para datos que no siguen una distribución normal pero son al menos ordinales y tienen cierta magnitud que puede ser clasificada o ranqueada.

En resumen, Wilcoxon generalmente es más robusta y potente, pero la prueba del signo puede ser útil en situaciones específicas de simplicidad o donde no se requiere mucha precisión.


Conclusión

La prueba del signo es una prueba no paramétrica simple, ideal para situaciones en las que los datos no cumplen con los supuestos paramétricos necesarios para una prueba t apareada. Aunque no tiene en cuenta la magnitud de las diferencias, es útil cuando se desea hacer una prueba de diferencias de mediana sin hacer suposiciones sobre la forma de la distribución.

bottom of page