Analisis de regresióN



Descargar 16.39 Mb.
Página3/59
Fecha de conversión02.11.2019
Tamaño16.39 Mb.
1   2   3   4   5   6   7   8   9   ...   59
Ejemplo 1.1 Se realizaron 25 observaciones de la variable Y y X como sigue:


Y

X

10.98

35.3

11.13

29.7

12.51

30.8

8.4

58.8

9.27

61.4

8.73

71.3

6.36

74.4

8.5

76.7

7.82

70.7

9.14

57.5

8.24

46.4

12.19

28.9

11.88

28.1

9.57

39.1

10.94

46.8

9.58

48.5

10.09

59.3

8.11

70

6.83

70

8.88

74.5

7.68

72.1

8.47

58.1

8.86

44.6

10.36

33.4

11.08

28.6

Haciendo cálculos con el paquete Minitab con X en la columna C2 y Y en la columna C1 se tiene:



Regression Analysis: C1 versus C2

The regression equation is

C1 = 13.6 - 0.0798 C2
Predictor Coef SE Coef T P

Constant 13.6230 0.5815 23.43 0.000

C2 -0.07983 0.01052 -7.59 0.000
S = 0.8901 R-Sq = 71.4% R-Sq(adj) = 70.2%

Por lo anterior la ecuación de regresión obtenida es:



(1.6)
Después de obtener esta ecuación, surgen algunas preguntas:

  • ¿qué tan bien ajusta los datos esta ecuación?

  • ¿el útil el modelo para hacer predicciones?

  • ¿se viola alguna condición como varianza constante y no correlación en los errores, de ser así que tan seria es?

Todo esto debe ser aclarado antes de usar el modelo.

1.2.2 Análisis de Varianza

El análisis de varianza es una herramienta que sirve para probar la adecuación del modelo de regresión, para lo cual es necesario calcular las sumas de cuadrados correspondientes.


La desviación estándar S corresponde a la raíz cuadrada del valor de MSE o cuadrado medio residual.
(1.7)
Donde:
(1.8)

(1.9)
La expresión es el residuo que expresa la diferencia entre el valor observado y el valor estimado por la ecuación de predicción.
Donde:
(1.10)

Y

Yi


^

Yi

_

Y

línea ajustada





X

Xi
Fig. 1.2 Errores involucrados en la recta de ajuste


La cantidad es la desviación de la observación i-ésima respecto a la media. Por otra parte:
(1.11)
Suma de cuadrados = Suma de cuadrados + Suma de cuadrados

respecto a la media de la regresión del error o residuos


De tal forma que la tabla de análisis de varianza queda como:
Tabla de Análisis de Varianza .

Fuente df SS MS = SS/df Fc


Regresión 1 MSreg/s2 =MSreg/MSE

Residual n-2 S2=MSE=SSE/n-2

__________________________________________________________.



Total corregido n-1

donde:
(1.12)
(1.13)
Obteniéndose con el Minitab
Source DF SS MS F P

Regression 1 45.592 45.592 57.54 0.000

Residual Error 23 18.223 0.792

Total corrected 24 63.816


El estadístico F se calcula como F = MSEREG / S2 y se compara con la F de tablas con (1, n-2) grados de libertad y área en 100(1-)%, para determinar si el parámetro 1 es significativo que es el caso de Fcalc. > Ftablas.
En este caso Fc = 45.5924 / 0.7923 = 57.24 y F de tablas F(1, 23, 0.95) es igual a 4.28, por tanto se rechaza H0 aceptando que existe una ecuación de regresión.
El área de la cola de Fc está descrita por el valor de p que debe ser menor o igual al valor de , en este caso es casi cero.

1.2.3 Intervalos de confianza para
En base al error estándar para los parámetros se tiene:
(1.14)

(1.15)
Del ejemplo, como s = 0.7963 y SXX = 7154.42


El intervalo de confianza 100 (1 - )% para ,, considerando que las observaciones y los errores siguen un comportamiento normal, es:
Y Para el coeficiente o se tiene:

(1.16)

(1.16a)
Para el caso del coeficiente Beta 1:
El error estándar es:



(1.17ª)

(1.17)

Suponiendo  = 0.05, t(23,0.975) = 2.069, los límites de confianza para el parámetro son:
-0.798  (2.069)(0.0105) o sea -0.798  0.0217

y se encuentra en el intervalo (-0.1015, -0.0581).
Para el caso de sigma, si los errores están distribuidos normalmente y son independientes, la distribución del estadístico,

es Chi-cuadrada con n – 2 grados de libertad y de esta forma:

Por consecuencia un intervalo de confianza 100 (1 -  ) % en 2 es:
(1.18)
1.2.4 Estimación del intervalo para la media de la respuesta
Una aplicación mayor del análisis de regresión es la estimación de la media de la respuesta E(Y) para un valor particular de la variable regresora X. El valor esperado de la respuesta Y media para un cierto valor de X = X0 es:
(1.19)
Para obtener un intervalo de confianza con 100(1 -  )% para el coeficiente 1 se aplica la fórmula siguiente:
(1.20b)
Ver gráfica anterior del ejemplo.
1.2.5 Predicción de nuevas observaciones

Esta es otra de las aplicaciones del modelo de regresión, predecir nuevas observaciones Y correspondientes a un nivel específico de la variable regresora X. La banda de predicción es más ancha dado que depende tanto del error del modelo de ajuste y el error asociado con observaciones futuras . El intervalo es mínimo en y se amplia conforme se incrementa la diferencia entre

La variable aleatoria,



Está normalmente distribuida con media cero y varianza:

Si se usa para predecir a entonces el error estándar de  = - , es el estadístico apropiado para establecer un intervalo de predicción probabilístico, en el caso de un intervalo 100 (1 -  ) % sobre una observación futura en se tiene:

(1.21

Se puede generalizar para encontrar un intervalo de predicción del 100(1-) porciento para la media de m observaciones futuras en X = Xo. Sea Ymedia la media de las observaciones futuras en X = Xo. El intervalo de predicción estimado es:



1.2.6 Pruebas de hipótesis para la pendiente e intersección
Prueba de Hipótesis para Ho:0 = 10 contra H1:0  10

Calculando el estadístico t, considerando que = 0, se tiene:
(1.22)
Probar la hipótesis para b0 no tiene interés práctico.

Ahora para probar la significancia de b1 se tiene:


para grados de libertad (1.23)
Si se rechaza la hipótesis nula, indicando que 1 es significativo y se tiene regresión lineal.
Del ejemplo:


Como excede el valor crítico de t = 2.069, se rechaza Ho (o sea el valor de p << 0.05) .Por tanto este coeficiente es significativo.
Es importante notar que el valor de F = t2.

La salida del Minitab es como sigue:




Predictor Coef SE Coef T P

Constant = b0 13.6230 0.5815 23.43 0.000

C2 = b1 -0.07983 0.01052 -7.59 0.000





Compartir con tus amigos:
1   2   3   4   5   6   7   8   9   ...   59


La base de datos está protegida por derechos de autor ©odont.info 2019
enviar mensaje

    Página principal