top of page

Cuestiones de correlación

Aspectos a considerar en correlaciones

Ejemplos de cuestiones relativas a correlaciones

Ejemplos de cuestiones relativas a correlaciones

Correlación lineal. Un investigador del gobierno desea realizar un estudio para determinar si existe una correlación entre los números del seguro social y el ingreso. El investigador reúne los datos apareados de una muestra aleatoria de 100 personas. ¿Deberá emplear correlación lineal? ¿Por qué?

  • No, porque los números del seguro social no satisfacen los requisitos necesarios. Debido a que funcionan como etiquetas de identificación que no miden ni cuentan algo, no son datos cuantitativos.


Causa y efecto. Se realizó un estudio clínico para investigar la eficacia del fármaco Dozenol para tratar el insomnio. Se descubrió que existe una correlación entre la cantidad ingerida de Dozenol y la duración del sueño. Con base en este análisis estadístico, ¿podemos concluir que el Dozenol es la causa del sueño? ¿Por qué?

  • No, porque un indice de correlación indica el grado y sentido de la relación entre dos variables. No obstante, el hecho de que la correlación sea alta, esto no implica que una variable sea causa de la otra. Pueden haber otros factores que incidan siendo la causa del comportamiento de las variables correlacionadas.


Variable interventora. ¿Que es una variable interventora y cual sería un ejemplo?

Una variable interventora, también conocida como variable mediadora o variable intermedia, es una variable que se encuentra en medio de una cadena causal entre una variable independiente (causa) y una variable dependiente (efecto). Esta variable explica parte o toda la relación entre la variable independiente y la dependiente, actuando como un mecanismo a través del cual la variable independiente influye en la variable dependiente.

Ejemplo Simple. Imaginemos el estudiando la relación entre el nivel educativo (variable independiente) y el ingreso anual (variable dependiente). Es posible suponer que a mayor nivel educativo, mayor será el ingreso anual. Sin embargo, la experiencia laboral podría ser una variable interventora en esta relación:

  • Variable independiente (X): Nivel educativo

  • Variable interventora (M): Experiencia laboral

  • Variable dependiente (Y): Ingreso anual

  • Aquí, el nivel educativo puede llevar a una mayor experiencia laboral (porque personas más educadas pueden acceder a mejores oportunidades laborales), y esta mayor experiencia laboral puede, a su vez, llevar a un mayor ingreso anual. Entonces, la experiencia laboral es una variable que interviene en la relación entre la educación y el ingreso.

Las variables interventoras son importantes porque:

  1. Desempaquetan Relaciones: Ayudan a descomponer y entender relaciones complejas, revelando el mecanismo a través del cual una variable afecta a otra.

  2. Mejora la Precisión del Modelo: Al incluir variables interventoras en un análisis, el modelo puede ofrecer una explicación más precisa y detallada del fenómeno que se está estudiando.

  3. Diferencia entre Correlación y Causalidad: Las variables interventoras pueden ayudar a identificar cómo y por qué existe una relación entre dos variables, ayudando a evitar falsas interpretaciones de causalidad.


Correlación y variación. Mientras ocho osos se encontraban anestesiados, unos investigadores midieron las distancias (en pulgadas) alrededor del pecho de los osos y los pesaron (en libras). Se calculó el valor del coeficiente de correlación lineal, que resultó ser r   0.993.

a. ¿Existe una correlación lineal significativa entre tamaño del pecho y el peso? Explique.

b. ¿Qué proporción de la variación del peso puede explicarse por la relación lineal entre el peso y el tamaño del pecho?

  • Existe una correlación lineal significativa entre el tamaño del pecho y el peso de los osos. Esto significa que, en general, a mayor tamaño del pecho, mayor es el peso, y esta relación es estadísticamente significativa.

  • La proporción de la variación de la variable dependiente (peso) que puede explicarse por la relación lineal con la variable independiente (tamaño del pecho) se calcula utilizando el coeficiente de determinación r^2. Y esto es igual a 0.986. En coclusión, El 98.6% de la variación en el peso de los osos puede ser explicada por la relación lineal con el tamaño del pecho, lo que indica una fuerte relación lineal entre estas dos variables.


Correlación y variación. Con datos reunidos del FBI y de la Oficina de alcohol, tabaco y armas de fuego, se obtuvo el número de armas automáticas registradas y la tasa de homicidios (en asesinatos por 10,000 individuos) de cada uno de ocho estados seleccionados al azar. Se calculó el valor del coeficiente de correlación lineal r   0.885.

  1. ¿Existe una correlación lineal entre el número de armas automáticas registradas y la tasa de homicidios? Explique.

  2. ¿Qué proporción de la variación de la tasa de homicidios puede explicarse por la relación lineal entre la tasa de homicidios y el número de armas automáticas registradas?

  • Existe una correlación lineal significativa entre el número de armas automáticas registradas y la tasa de homicidios. Esto indica que, en general, a mayor número de armas automáticas registradas, mayor es la tasa de homicidios, y esta relación es estadísticamente significativa.

  • La proporción de la variación en la tasa de homicidios que puede explicarse por la relación lineal con el número de armas automáticas registradas se calcula usando el coeficiente de determinación r^2. Esto da como resultado 0.783. En conclusión, el 78.3% de la variación en la tasa de homicidios puede ser explicada por la relación lineal con el número de armas automáticas registradas, lo que indica una fuerte relación lineal entre estas dos variables.


Correlación edades y nivel de razonamiento. Dado que, Los datos muestrales apareados de las edades de sujetos y sus puntuaciones en una prueba de razonamiento dan como resultado un coeficiente de correlación lineal muy cercano a 0. Alguén supone como "conclusión": Las personas más jóvenes tienden a obtener puntuaciones más altas.

  • Falso: Interpretación mal hecha: Con un coeficiente de correlación lineal muy cercano a 0, debemos conclir que no existe relación entre la edad y la puntuación, como sugiere la conclusión de manera incorrecta.


Correlación ingresos y estudios: Existe una correlación lineal significativa entre los ingresos personales y los años de escolaridad. Conclusión: Una mayor escolaridad causa que se incrementen los ingresos de una persona.

  • Verdadero: Interpretación correcta. Si existe una correlación lineal significativa entre los ingresos personales y la escolaridad, entonces están relacionados. Esto, además tiene lógica.



Correlación altura y tiempo. La relación entre la altura de la erupción de un volcan y los intervalos de tiempo posteriores a las erupciones del géiser Olf Fatihful.

Altura               140  110 125 120 140 120 125 150

Intervalo posterior   92  65  72  94  83  94  101 87

¿Existe una correlación lineal entre la altura de una erupción y el intervalo de tiempo posterior a la erupción?

Coeficiente de correlación de Pearson: 0.27, valor p: 0.52 

Coeficiente de correlación de Spearman: 0.01, valor p: 0.98

  • Por la grafica no se aprecia una correlación significativa.

  • Por Pearson, se observa un indice de correlación bajo con un p_value alto en favor de la H0 que los valores No están dorrelacionados.

  • Por Spearman se observa un indice de correlación muy bajo con un valor p que nos dice que su calculo puedo o no ser aplicable en este caso porque la relación entre las variables no es monótona.

  • Conclusión: Alturas y tiempos, en este caso no están correlacionados.



Correlación. Oyentes y ventas de canciones. En la siguiente tabla se listan los números de impresiones de oyentes (en cientos de millones) de canciones y los números correspondientes de álbumes vendidos  (en cientos de miles). El número de impresiones de oyentes es un conteo del número de veces que la gente ha escuchado la canción. La tabla se basa en datos de USA Today. 

Impresiones   de oyentes  28  13  14  24  20  18  14  24  17

Álbumes vendidos      19  7   7   20  6   4   5   25  12

¿Parece que las ventas del álbum están muy afectadas por el número de impresiones de oyentes?

Coeficiente de correlación de Pearson: 0.80, valor p: 0.01 

Coeficiente de correlación de Spearman: 0.56, valor p: 0.12

  • Coeficiente de Correlación de Pearson. r=0.80 indica una correlación positiva fuerte. A medida que aumentan las impresiones de oyentes, las ventas de álbumes tienden a aumentar. Un valor p de 0.01 es muy pequeño, lo que sugiere que la correlación es estadísticamente significativa. Esto implica que es poco probable que la relación observada entre las impresiones de oyentes y las ventas de álbumes se deba al azar.

  • Coeficiente de Correlación de Spearman. ρ=0.56 indica una correlación positiva moderada, pero no tan fuerte como la relación lineal. Un valor p de 0.12 no es suficientemente pequeño (generalmente necesitamos 𝑝 < 0.05 para significancia), lo que sugiere que la correlación no es estadísticamente significativa. Esto significa que no podemos descartar la posibilidad de que la relación observada se deba al azar. Pero en este ejemplo, desempata la gráfica.

  • Diferencia entre Pearson y Spearman. Pearson mide la correlación lineal, mientras que Spearman mide la correlación monótona. La diferencia en los coeficientes sugiere que, aunque existe una relación lineal fuerte entre las impresiones de oyentes y las ventas de álbumes, la relación puede no ser perfectamente monótona. La diferencia en los valores p también indica que la relación lineal es más robusta (estadísticamente significativa) que una relación monótona general. 

  • Conclusión. En resumen, el análisis sugiere que las ventas de álbumes están significativamente afectadas por el número de impresiones de oyentes, especialmente si la relación es lineal. La relación monótona, sin embargo, es menos clara y menos significativa.


Presupuestos e ingresos brutos de películas. En la siguiente tabla se muestran los presupuestos (en millones de dólares) y los ingresos brutos (en millones de dólares) de películas seleccionadas al azar (según datos de la Motion Picture Association of America).

Presupuesto   62  90  50  35  200 100 90

Ingresos  65  64  48  57  601 146 47

  • ¿Parece existir una correlación lineal entre el dinero gastado para filmar la película y la cantidad recuperada en las salas de cine?

  • Además del monto del presupuesto, identifique otro factor importante que puede afectar la cantidad de dinero que obtiene la película.

Coeficiente de correlación de Pearson: 0.93, valor p: 0.0028 

Coeficiente de correlación de Spearman: 0.63, valor p: 0.13

  • Se observa una muy alta correlación entre ambas variables. Esta correlación está apoyada por:

    • Un alto índice de correlaicón de Pearson.

    • Un bajo valor p < 0.01 que desestima la posibilidad de la H0 que ambas variables no estén correlacionadas.

    • El coeficiente de correlación de Spearman arroja evidencia (observada) que la correlación existe (> 0.5 pero no es monótona)

  • Conclusión

    • Existe correlación entre el presupuesto y los ingresos que la película genera.

    • Existen también otros factores que inciden en los ingresos que genra la pelicula:

    • Las criticas del avant premiere,

    • La calidad de los actores,

    • El género y la trama.


Pesos de automóvil y consumo de combustible. A continuación se presentan los pesos (en libras) y las cantidades de combustible consumidas en carretera (en millas/galón) de automóviles elegidos al azar (Chrysler, Sebring, Ford Mustang, BMW Series 3, Ford Crown Victoria, Honda Civic, Mazda Protégé, Hyundai Accent). 

Peso    3175 3450 3225 3985 2440 2500 2290

Consumo 27 29 27 24 37 34 37

¿Existe una correlación lineal entre el peso y el consumo de combustible en carretera? ¿Qué sugiere el resultado sobre un programa nacional para reducir el consumo de petróleo importado?

  • Coeficiente de Correlación de Pearson. El coeficiente de correlación de Pearson mide la fuerza y dirección de una relación lineal entre dos variables.

  1. r=-0.94 indica una correlación **negativa** fuerte. A medida que el peso del vehículo aumenta el consumo disminuye.

  2. Un valor p de 0.0014 es muy pequeño, lo que sugiere que la correlación es estadísticamente significativa.

  3. Esto implica que es poco probable que la relación observada entre los pesos de los oyentes y el consumo se atribuible unicamente al azar..

  • Coeficiente de Correlación de Spearman. El coeficiente de correlación de Spearman mide la fuerza y dirección de la relación **monótona** (no necesariamente lineal) entre dos variables.

  1. ρ=-0.87 indica una correlación negativa fuerte, pero no tan fuerte como la relación lineal.

  2. Un valor p de 0.01 si es suficientemente pequeño, lo que sugiere que la correlación si es estadísticamente significativa y **monótona**.

  3. Esto significa que podemos descartar la posibilidad de que la relación observada se deba al azar.

  • Conclusión. En resumen, el análisis sugiere que los pesos de los vehículos y el consumo si están correlacionadas, al menos en este ensayo y con esta muestra. Esto resulta contraintuitivo ya que uno tiende a pensar que la correlación entre el peso del vehículo y el consumo debería ser positiva. Por eso, este resultado sugiere que deben haber otras causas para la correlación sea negativa, por ejemplo: Quizás, cuanto menor sea el peso del vaículo mayor sea el motor y menor el resto del vehículo (carrocería). Y el mayor motor implicaría mayor consumo. Todo esto sugiere la convenienza de profundizar el estudio del caso con otras variables.


Homicidios y tamaño de población. En la siguiente tabla se listan los números de homicidios y los tamaños poblacionales (en cientos de miles) de ciudades grandes de Estados Unidos durante un año reciente (según datos del New York Times).

`

Homicidios    258 264 402 253 111 648 288 654 256 60 590

Población 4 6 9 6 3 29 15 38 20 6 81


¿Qué concluye usted?¿Existe correlación?

Coeficiente de correlación de Pearson: 0.73, valor p: 0.011 

Coeficiente de correlación de Spearman: 0.77, valor p: 0.0055

  • Coeficiente de Correlación de Pearson. El coeficiente de correlación de Pearson mide la fuerza y dirección de una relación lineal entre dos variables.

  1. r=+0.73 indica una correlación **positiva** fuerte. A medida que la población aumenta la cantidad de homicidios también.

  2. Un valor p de 0.011 es pequeño, lo que sugiere que la correlación es estadísticamente significativa.

  3. Esto implica que es poco probable que la relación observada entre la población y los homicidios sea atribuible unicamente al azar.

  • Coeficiente de Correlación de Spearman. El coeficiente de correlación de Spearman mide la fuerza y dirección de la relación monótona (no necesariamente lineal) entre dos variables.

  1. ρ=0.77 indica una correlación positiva fuerte y mayor a la lineal.

  2. Un valor p de 0.0055 es suficientemente pequeño, lo que sugiere que la correlación si es estadísticamente significativa y monótona.

  3. Esto significa que podemos descartar la posibilidad de que la relación observada se deba al azar.

  • Conclusión. En resumen, el análisis sugiere que la cantidad de homicidios y la población si están correlacionadas. Esto resulta razonable ya que es observable que en grandes ciudades suele haber mayor cantidad de homicidios que en pueblos pequeños.

Cigarrillos, Alquitrán y Nicotina

a. En el archivo Cigarrillos.xlsx, están los datos de nicotina y alquitrán por marca.

Utilice los datos apareados referentes a alquitrán y nicotina. Con base en el resultado,

¿parece existir una correlación lineal entre el alquitrán y la nicotina del cigarrillo? Si es así, ¿podrán los investigadores reducir sus gastos de laboratorio midiendo única- mente una de estas dos variables?

b. Utilice los datos apareados referentes a monóxido de carbono y nicotina. Con base en el resultado, ¿parece existir una correlación lineal entre el monóxido de carbono y la nicotina de los cigarrillos? Si es así, ¿podrán los investigadores reducir sus gastos de laboratorio midiendo únicamente una de estas dos variables?

c.  Suponga que investigadores desean diseñar un método para predecir la cantidad de nicotina y sólo desean medir alguna otra variable. ¿Cuál será una mejor elección, el alquitrán o el monóxido de carbono? ¿Por qué?

Primer punto: Alquitrán y nicotina 

Coeficiente de correlación de Pearson: 0.96, valor p: 1.2e-16 

Coeficiente de correlación de Spearman: 0.92, valor p: 2.4e-12

  • Coeficiente de Correlación de Pearson

  1. r=+0.96 indica una correlación positiva fuerte. A medida que el alquitrán aumenta la cantidad de nicotina también.

  2. Un valor p = 1.2e-16 es muy pequeño, lo que sugiere que la correlación es estadísticamente significativa.

  3. Esto implica que es poco probable que la relación observada entre nicotina y alquitrán sea atribuible unicamente al azar.

  • Coeficiente de Correlación de Spearman

  1. ρ=0.92 indica una correlación positiva fuerte y menor a la lineal.

  2. Un valor p = 2.4e-12 es muy pequeño, lo que sugiere que la correlación si es estadísticamente significativa y monótona.

  3. Esto significa que podemos descartar la posibilidad de que la relación observada se deba al azar.

  • Primera conclusión: Nicotina y Alquitrán: En resumen, el análisis sugiere que la cantidad de nicotina y alquitrán si están correlacionadas.

Segundo punto: Carbono y nicotina 

Coeficiente de correlación de Pearson: 0.86, valor p: 1.7e-09 

Coeficiente de correlación de Spearman: 0.74, valor p: 4.7e-06

  • Coeficiente de Correlación de Pearson

  1. r=+0.86 indica una correlación positiva fuerte.

  2. A medida que el carbono aumenta la cantidad de nicotina también. Un valor p = 1.7e-09 es muy pequeño, lo que sugiere que la correlación es estadísticamente significativa.

  3. Esto implica que es poco probable que la relación observada entre nicotina y carbono sea atribuible unicamente al azar.

  • Coeficiente de Correlación de Spearman

  1. ρ=0.74 indica una correlación positiva fuerte y menor a la lineal.

  2. Un valor p = 4.7e-06 es muy pequeño, lo que sugiere que la correlación si es estadísticamente significativa y monótona.

  3. Esto significa que podemos descartar la posibilidad de que la relación observada se deba al azar.

  • Segunda Conclusión:  Carbono y Nicotina: En resumen, el análisis sugiere que la cantidad de nicotina y carbono si están correlacionadas.

Tercer punto: Nicotina y Carbono o Alquitrán

Comparación de correlaciones por coeficiente de Pearson

Nicotina y Alquitrán    vs    Nicotina y Carbono

0.96, valor p: 1.2e-16       vs        0.86, valor p: 1.7e-09

  • En el primer y segundo punto se realizaron los analisis de correlaciones de la nicotina con el alquitrán por un lado y con el carbono por el otro. Si tomamos el más representativo en este caso, que es el coeficiente de Pearson, se observa que la correlación de la nicotina con el alqutrán es mayor que con el carbono. 

  • Tercera Conclusión: Alquitrán o Carbono: Si los investigadores desean diseñar un método para predecir la cantidad de nicotina y sólo desean medir alguna otra variable, la mejor elección, es el alquitrán, porque tiene mayor correlación con la nicotina.



bottom of page