Kategóriák: Minden - asociación - correlación - variables - regresión

a Ajelet Garfias 1 éve

124

REGRESIÓN Y CORRELACIÓN LÍNEAL

La relación entre dos variables cuantitativas puede estudiarse mediante gráficos de dispersión, que permiten observar patrones y evaluar la existencia de asociaciones entre las variables.

REGRESIÓN Y CORRELACIÓN LÍNEAL

REGRESIÓN Y CORRELACIÓN LÍNEAL

Gráfico de dispersión (Scatter Plot)

Modelos
Modelo estadístico

Permite incorporar un componente aleatorio en la relación.

Modelo determinístico

En condiciones ideales el modelo permite predecir sin error el valor de la variable dependiente.

Modelo matemático

Función matemática que propone la forma de relación entre la variable dependiente (Y) y la o las variables independientes.

La función más simple para la relación entre dos variables es la función lineal

Intereses al estudiar la relación entre dos variables cuantitativas
Predecir una variable a partir de la otra usando el modelo propuesto(REGRESIÓN)
Fuerza de la asociación
Estudio de la forma de la relación
Existencia de asociación entre las mismas
Para interpretar un gráfico de dispersión debe mirarse el patrón general que siguen los puntos.
La nube resultante de puntos permite evaluar si existe relación entre las dos variables o si no hay relación aparente
Se dibuja un sistema de coordenadas cartesianas en el que se representan los valores que toman las dos variables para cada sujeto
Gráfico muy simple y útil para estudiar relaciones entre dos variables cuantitativas

Coeficiente de correlación

Coeficiente de correlación de Spearman
¿Cuándo usarlo?

Cuando la forma de la nube de puntos no es elipsoidal.

Cuando hay datos influyentes.

Cuando las variables tienen una relación creciente o decreciente pero no necesariamente lineal.

Características

No hace supuestos sobre la forma de la relación entre las dos variables.

Mide la fuerza de la correlación entre las dos variables.

Como el coeficiente de correlación de Spearman varía entre −1 y 1.

¿Cómo se calcula el coeficiente?

Se ordenan los valores de cada variable por separado y se reemplaza cada observación por la posición (rango) que ésta ocupa en la muestra ordenada.

Disponemos de n pares de observaciones (X1, Y1), ..., (Xn, Yn). Las variables pueden ser numéricas o categóricas ordinales.
Coeficiente de correlación de Pearson
¿Qué mide?

Que cercanos se encuentran los puntos alrededor de una línea recta que indique la tendencia general.

Propiedades

El valor de r no depende de las unidades de medición

Mientras mayor el valor absoluto de r mayor la fuerza de la asociación

r = + 1 implica que todos los puntos caen sobre una recta de pendiente positiva

r = 0 implica que no hay relación lineal entre las variables

r mide la fuerza de la asociación LINEAL entre X e Y

r toma valores entre –1 y 1 (–1 ≤ r ≤ 1)

Definición

Sean (Xi, Yi) las observaciones realizadas en cada uno de los n sujetos de una muestra de tamaño n.

Mide el grado de asociación lineal entre dos variables y posteriormente un estadístico basado en rangos que estima la correlación
¿Qué es?
El grado de asociación entre dos variables numéricas puede resumido en un estadístico