Analisis de regresióN


Otras gráficas de residuos



Descargar 16.39 Mb.
Página14/59
Fecha de conversión02.11.2019
Tamaño16.39 Mb.
1   ...   10   11   12   13   14   15   16   17   ...   59
2.2.5 Otras gráficas de residuos

Se pueden obtener gráficas de los residuales vs el tiempo de ocurrencia u orden:



En este caso se puede identificar si existe autocorrelación positiva o negativa de los residuos como sigue:





Residuos vs tiempo: Autocorrelación positiva Autocorrelación negativa


2.2.6 Pruebas estadísticas en los residuos

Las pruebas estadísticas en los residuos son menos prácticas que la observación de su comportamiento donde se obtiene más información.


2.3 DETECCIÓN Y TRATAMIENTO DE OUTLIERS

Un Outilier es una observación extrema, donde el residuo es considerablemente grande, por decir con tres o cuatro desviaciones estándar de la media. Estos puntos no son puntos típicos de los datos y pueden ocasionar defectos severos en el modelo de regresión. Las gráficas de Y estimada vs residuos ya sea estandarizados o estudentizados permiten identificar Outliers (puntos aberrantes).


Los outliers deben ser investigados para ver si se puede hallar la razón de su comportamiento anormal (medición incorrecta, equipo dañado, error de anotación). Si se encuentra que se debe a un error se debe descartar de los datos. En otros casos donde se encuentra una razón se debe mantener en la estimación del modelo.
En general se espera que la ecuación de regresión encontrada sea insensible a algunos puntos particulares, para que sea un modelo robusto. Puede no ser aceptable que un pequeño porcentaje de los datos tenga un efecto significativo en el modelo.

Con los datos del ejemplo 1.2 si omitimos los puntos 5 y 6 que indican Outliers y compramos nuevo modelo con el modelo anterior se tiene:


Con el modelo original:

The regression equation is

Y = 2628 - 37.2 X
Predictor Coef SE Coef T P

Constant 2627.82 44.18 59.47 0.000

X -37.154 2.889 -12.86 0.000
S = 96.1061 R-Sq = 90.2% R-Sq(adj) = 89.6%

Y con el modelo donde se excluyen los puntos 5 y 6 se tiene:

The regression equation is

Y_1 = 2659 - 37.7 X_1


Predictor Coef SE Coef T P

Constant 2658.97 30.53 87.08 0.000



X_1 -37.694 1.979 -19.05 0.000
S = 62.9653 R-Sq = 95.8% R-Sq(adj) = 95.5%



Casi no hubo efecto en la estimación de los coeficientes de la regresión. La MSE se redujo mucho, se incrementó R^2 en 5% y se redujo en 30% el error estándar de 1.

En General a pesar de que los puntos 5 y 6 no afectan la estimación y aplicación del modelo, y el quitarlos mejoraría el error de estimación aunque no hay una razón de peso.





Compartir con tus amigos:
1   ...   10   11   12   13   14   15   16   17   ...   59


La base de datos está protegida por derechos de autor ©odont.info 2019
enviar mensaje

    Página principal