Analisis de regresióN



Descargar 16.39 Mb.
Página35/59
Fecha de conversión02.11.2019
Tamaño16.39 Mb.
1   ...   31   32   33   34   35   36   37   38   ...   59
Observ

D2ii

Delta

Sigma acum

1

15-23

7.7906E-05

5.2788

4.6770168

2

5-17

0.04869121

0.8808

2.7287028

3

4-25

0.09543477

5.137

3.336262533

4

21-12

0.10955522

2.0212

2.9498927

5

18-8

0.11849492

 

 

6

 

0.21472823

 

 

7

 

0.24772152

 

 

8

 

0.25208425

 

 

9

 

0.26963257

 

 

10

 

0.28046136

 

 

11

 

0.28046136

 

 

12

 

0.28348034

 

 

13

 

0.31588921

 

 

14

 

0.33583313

 

 

15

 

0.34120864

 

 

16

 

0.3524271

 

 

17

 

0.35532909

 

 

18

 

0.37673375

 

 

19

 

0.38649146

 

 

20

 

0.43282602

 

 

21

 

0.48143932

 

 

22

 

0.49889025

 

 

23

 

0.57492644

 

 

24

 

0.58513212

 

 

25

 

0.5964673

 

 

26

 

0.62751294

 

 

27

 

0.64404848

 

 

28

 

0.65939581

 

 

29

 

0.76355604

 

 

30

 

0.87681193

 

 

31

 

0.91235651

 

 

32

 

0.92684701

 

 

33

 

0.94887491

 

 

34

 

0.98309549

 

 

35

 

1.00062433

 

 

36

 

1.01425787

 

 

37

 

1.02253537

 

 

38

 

1.0317867

 

 

39

 

1.04201186

0.5907

1.983

40

 

1.19782372

1.4714

1.966

Desviación estándar

Diagnóstico de influyentes

A veces un pequeño grupo de puntos ejerce una influencia desproporcionada en el modelo de regresión, se deben revisar con cuidado, si son valores “mal” tomados, se deben eliminar, de otra forma se debe estudiar el porqué de su ocurrencia.


Puntos influyentes

Son observaciones remotas que tienen un apalancamiento desproporcionado potencial en los parámetros estimados, valores de predicción, y estadísticas en general.


Hoaglin y Welsch discuten el papel de la matriz sombrero H donde sus elementos de la diagonal principal (hij) puede ser interpretado como la cantidad de influencia ejercida por Yj en . Así, enfocando la atención en los elementos de la diagonal de la matriz H, como , el tamaño medio de un elemento en la diagonal principal es p/n. Por tanto si un elemento de la diagonal principal , la observación (i) es un punto con apalancamiento alto.

Medidas de influencia: la D de Cook

Cook sugirió un diagnóstico de eliminación, es decir, mide la infuencia de la pésima observación si se eliminara de la muestra. Sugiere medir la distancia cuadrada entre el estimado de mínimos cuadrados basado en todos los n puntos b y el estimado obtenido al borrar el i-ésimo punto b(i) , esta distancia se expresa como:
(3.71)
Donde M = X’X y c = pMSe, obteniéndose:
(3.72)
Los puntos con valores grandes de Di tienen una influencia considerable en los estimadores de mínimos cuadrados b. La magnitud de Di puede evaluarse comparándola con Si , entonces al borrar el punto i moverá a b al límite del intervalo de confianza del 50% para  con base en el conjunto de datos completo. Como normalmente se considera que los puntos donde tendrán influencia. Idealmente cada deberá permanecer dentro de la banda del 10 a 20% de la región de confianza.
Otra forma de escribir el estadístico Di es:




(3.73)
Así Di está formado por un componente que refleja que tan bien se ajusta el modelo a la i-ésima observación Yi y un componente que mide que tan lejos se encuentra el punto del resto de los datos. Uno o ambos componentes pueden contribuir a un valor grande de Di .

Por ejemplo para el caso de tiempos de entrega para la primera observación se tiene:



En la tabla mostrada abajo el valor máximo de Di = D9 = 3.41835, indicando que el punto 9 tiene una alta influencia en el estimado de los coeficientes Beta, se consideran como influyentes los puntos mayores a 1. También es la distancia euclidiana al cuadrado que se mueve el vector de los valores estimados cuando elimina la i-ésima observación.


Influencia en los valores estimados (DFFITS) y en los parámetros estimados (DFBETAS)
También se puede investigar la influencia de la observación i-ésima en la predicción de un valor. Un diagnóstico razonable es:
(3.74)

Donde es el valor estimado de obtenido sin el uso de la iésima observación, el denominador es una estandartización, por tanto DFFITS es el número de desviaciones estándar que el valor estimado cambia si la observación i-ésima es removida. Computacionalmente se tiene:
(3.75)
Donde ti es la R-student.
Por lo general merece atención cualquier observación donde
(3.76)
Para el caso de DFBETAS, indica cuánto cambia el coeficiente de regresión Beta(j) en unidades de desviación estándar, si se omitiera la i-ésima observación.


es el j-ésimo elemento diagonal de la matriz (X’X)-1

es el j-ésimo coeficiente de regresión, calculado sin usar la i-ésima observación. Un valor grande de DFBETAS indica que la i-ésima observación tiene grana influencia sobre el j-ésimo coeficiente de regresión.
De R = (X’X)-1X’, los n elementos del renglón k-ésimo de R producen el balanceo que las n observaciones de la muestra tienen sobre Beta. Si r’j es el j-ésimo renglón de R, se tiene:

Ejemplo de cálculo:


Renglón

R = (X'X)-1X'







n elementos
















j=1

0.035217

0.081461

0.07142

0.088726

0.073971

0.054461

0.095113

0.064501

-0.14241

0.04035

-0.01553

j=2

-0.01204

-0.00675

-0.01249

0.002698

0.004835

-0.00104

-0.00423

0.004707

0.00799

-0.01968

0.006525

j=3

0.000269

4.3E-05

0.00019

-0.00018

-0.00019

-1.3E-05

-4.4E-05

-0.00016

0.000274

0.00042

-4.5E-06




1

2

3

4

5

6

7

8

9

10

11




0.050736

0.074083

0.047866

0.03569

0.003797

0.069787

0.071028

0.096856

-0.02684

0.057011

-0.07023

0.035523

0.024493

0.082869

0.0127

-0.00568

-0.0101

-0.0012

-0.01415

0.002442

0.00844

0.00206

0.005344

0.016289

0.028124

-0.00129

-0.01289

-0.00065

-0.0003

3.81E-05

0.000197

3.58E-05

0.000391

-0.00013

-0.00026

-0.00018

4.84E-05

-0.00039

-0.00033

3.83E-05

0.000314

-9.1E-05

12

13

14

15

16

17

18

19

20

21

22

23

24

25




R'







0.03522

-0.012

0.00027

0.08146

-0.0067

4.3E-05

0.07142

-0.0125

0.00019

0.08873

0.0027

-0.0002

0.07397

0.00484

-0.0002

0.05446

-0.001

-1E-05

0.09511

-0.0042

-4E-05

0.0645

0.00471

-0.0002

-0.1424

0.00799

0.00027

0.04035

-0.0197

0.00042

-0.0155

0.00652

-5E-06

0.05074

0.0127

-0.0003

0.07408

-0.0057

3.8E-05

0.04787

-0.0101

0.0002

0.03569

-0.0012

3.6E-05

0.0038

-0.0141

0.00039

0.06979

0.00244

-0.0001

0.07103

0.00844

-0.0003

0.09686

0.00206

-0.0002

-0.0268

0.00534

4.8E-05

0.05701

0.01629

-0.0004

-0.0702

0.02812

-0.0003

0.03552

-0.0013

3.8E-05

0.02449

-0.0129

0.00031

0.08287

-0.0007

-9E-05




C







0.11322

-0.0044

-8E-05

-0.0044

0.00274

-5E-05

-8E-05

-5E-05

1.2E-06





Calculo de Bo,i




r(0,1) =

0.035217

raiz(Cjj)

0.3364746

t1 =

-1.8878

raiz(1-h11) =

0.9477341

-0.20848235

 













r(0,2)

0.0814608

raiz(Cjj) =

0.3364746

t2 =

0.3847

raiz(1-hii) =

0.9640021

0.09661409

 













r(0,3) =

0.0714204

raiz(Cjj) =

0.3364746

t3 =

-0.0174

raiz(1-hii) =

0.9493471

-0.0038904

 












Compartir con tus amigos:
1   ...   31   32   33   34   35   36   37   38   ...   59


La base de datos está protegida por derechos de autor ©odont.info 2019
enviar mensaje

    Página principal