Analisis de regresióN



Descargar 16.39 Mb.
Página33/59
Fecha de conversión02.11.2019
Tamaño16.39 Mb.
1   ...   29   30   31   32   33   34   35   36   ...   59
Residuos PRESS – Suma de cuadrados del error de predicción
La suma de cuadrados del error de predicción (PRESS) propuesto por Allen (1971) proporciona un escalamiento útil para los residuos. Para calcular PRESS, seleccione una observación, por ejemplo (i), Ajuste el modelo de regresión a las observaciones remanentes (N – 1), usando la ecuación para predecir la observación retenida (Yi). Denotando el error de predicción como:

(3.60)
El error de predicción es normalmente denominado el residuo i-ésimo PRESS, el procedimiento se repite para cada una de las observaciones i = 1, 2, ....., N, produciendo los residuos PRESS correspondientes. Así el estadístico PRESS se define como la suma de cuadrados de los N residuos PRESS, como:
(3.61)
Así PRESS utiliza cada uno de los posibles subconjuntos de N – 1 observaciones como el conjunto de datos de estimación, y cada observación en turno es usada para formar el conjunto de datos de predicción.
Como:

(3.62)
Entonces:
PRESS = (3.63)
De esta forma se observa que los residuos asociados con valores altos de hii serán puntos de alta influencia, donde si se excluyen mostrarán un ajuste pobre del modelo.
La varizanza del residuo i-ésimo PRESS es:
(3.64)
Y el residuo PRESS estandarizado es:
(3.65)
Donde si utilizamos MSE para estimar la varianza 2 se convierte en el residuo estudentizado discutido previamente.
R- STUDENT

Otro método para diagnosticar la presencia de outliers o puntos de alta influencia es el residuo estudentizado R – Student donde la estimación de la varianza se hace excluyendo la j-ésima observación, como sigue:
i = 1, 2, ..........., n (3.66)

y el residuo estudentizado externamente R – Student, está dado por:


i = 1, 2, ..........., n (3.67)

En muchas situaciones este residuo puede diferir del residuo estudentizado ri . Si la observación i-ésima tiene influencia, entonces y el estadístico R-student será más sensible a este punto. También ofrece una prueba más formal de prueba de hipótesis de outliers, ya que se puede comparar todos los n valores de .
El estadístico PRESS puede usarse para calcular una R2 aproximada para predicción, o sea:
(3.68)
Para el ejemplo de las bebidas se tiene:4

Por lo que esperaríamos que este modelo explicara aproximadamente el 92% de la variabilidad al predecir nuevas observaciones, que se compara con el 95.96% de la variabilidad en los datos originales explicados por el ajuste de mínimos cuadrados.


Tabla de residuos































Compartir con tus amigos:
1   ...   29   30   31   32   33   34   35   36   ...   59


La base de datos está protegida por derechos de autor ©odont.info 2019
enviar mensaje

    Página principal