viernes, 15 de junio de 2012

Método de Correlación, Pearson


El coeficiente de correlación es una medida de asociación entre dos variables y se simboliza con la literal r.
Los valores de la correlación van de + 1 a - 1, pasando por el cero, el cual corresponde a ausencia de correlación. Los primeros dan a entender que existe una correlación directamente proporcional e inversamente proporcional, respectivamente.
De lo anterior referimos que:
  • +1 ó -1 = Correlación perfecta.
  • 0.95 = Correlación fuerte.
  • 80% = Correlación significativa.
  • 70% = Correlación moderada.
  • 50% = Existe una relación parcial.
Las 3 gráficas en coordenadas cartesianas posteriores, se muestra la variable independiente (X) se ubica en las abscisas y la dependiente (Y) en el eje de las ordenadas. Los coeficientes de correlación significan esa asociación entre los cambios que se observan en la variable dependiente con respecto a la variable independiente.
La gráfica (a) representa una correlación positiva, es decir, conforme los valores de X aumentan, también aumentan los valores de Y. A su vez, la gráfica (b) muestra una correlación negativa, de modo que al incrementarse los valores de la variable independiente, los valores de la dependiente disminuyen. La gráfica (c) no indica correlación.
El coeficiente de correlación lineal de Pearson se define matemáticamente con la ecuación siguiente:


Donde:
r = coeficiente de correlación de Pearson.
Sxy = sumatoria de los productos de ambas variables.
Sx = sumatoria de los valores de la variable independiente.
Sy = sumatoria de los valores de la variable dependiente.
Sx2 = sumatoria de los valores al cuadrado de la variable independiente.
Sy2 = sumatoria de los valores al cuadrado de la variable dependiente.
N = tamaño de la muestra en función de parejas.
Este procedimiento estadístico es aplicable cuando las observaciones se miden según una escala de intervalo, por otra parte, el fenómeno debe ser lineal.
Al igual que las otras pruebas paramétricas, la varianza de las variables X y Y deben guardar homogeneidad.

Pasos.
  1. Ordenar los valores de la variable dependiente (Y) con respecto a los valores de la variable independiente (X).
  2. Elevar al cuadrado cada valor X y de Y.
  3. Obtener los productos de X y Y, para lo cual se deben multiplicar independientemente ambos valores.
  4. Efectuar las sumatorias Sx, Sy, Sx2Sy2, y Sxy.
  5. Calcular el tamaño de la muestra en función de parejas de X y Y.
  6. Aplicar la ecuación.
  7. Calcular los grados de libertad (gl): gl = N parejas -1.
  8. Comparar el valor de r calculado en la tabla de valores críticos de t de Kendall en función de la probabilidad.
  9. Decidir si se acepta o rechaza la hipótesis.

Ejemplo:
Elección de la prueba estadística para medir la asociación o correlación. Las edades en días están en escala de tipo intervalo, tenemos dos variables, entonces aplicamos esta prueba.
Objetivo: Conocer que grado de asociación existe entre la edad y peso corporal de niños de edades desde el nacimiento hasta los 6 meses.
Hipótesis.
Ha. Entre las observaciones de edad de los niños y peso corporal existe correlación significativa.
Ho. Entre las observaciones de edad de los niños y pero corporal no existe correlación significativa.



gl = 21 - 2 = 19
a = 0.05

rc = 0.91
rt = 0.444
rc > rt se rechaza Ho. Entre las variables edad del niño y el peso corporal existe una correlación muy significativa. Elevando r al cuadrado obtenemos el error existente r2 = 0.8281 = 0.83, donde el 83% de los cambios observados en el peso de los niños se debe a los incrementos de la edad, sin embargo, el 17% se ignora.
Creamos ahora una gráfica (hecha con el programa estadístico SPSS) para representar la correlación obtenida. Encontramos entonces una correlación positiva, es decir, conforme la edad aumenta, también aumenta el peso corporal de los niños.

No hay comentarios:

Publicar un comentario en la entrada