Analisis de regresióN



Descargar 16.39 Mb.
Página19/59
Fecha de conversión02.11.2019
Tamaño16.39 Mb.
1   ...   15   16   17   18   19   20   21   22   ...   59
Obs

X

Y

Fit

SE Fit

Residual

St Resid

1

5

1.582

1.3366

0.0519

0.2454

1.07

2

6

1.822

1.5778

0.0473

0.2442

1.06

3

3.4

1.057

0.9508

0.0703

0.1062

0.47

4

2.7

0.5

0.782

0.0806

-0.282

-1.27

5

10

2.236

2.5424

0.0875

-0.3064

-1.4

6

9.7

2.386

2.47

0.0828

-0.084

-0.38

7

9.6

2.294

2.4338

0.0804

-0.1398

-0.63

8

3.1

0.558

0.8664

0.0753

-0.3084

-1.38

9

8.2

2.166

2.0962

0.0609

0.0698

0.31

10

6.2

1.866

1.626

0.0472

0.24

1.04

11

2.9

0.653

0.8302

0.0776

-0.1772

-0.79

12

6.4

1.93

1.6622

0.0474

0.2678

1.16

13

4.6

1.562

1.2402

0.0555

0.3218

1.4

14

5.8

1.737

1.5295

0.0476

0.2075

0.9

15

7.4

2.088

1.9154

0.053

0.1726

0.75

16

3.6

1.137

0.999

0.0675

0.138

0.61

17

7.9

2.179

2.0239

0.0574

0.1551

0.68

18

8.8

2.112

2.253

0.0694

-0.141

-0.62

19

7

1.8

1.8189

0.05

-0.0189

-0.08

20

5.5

1.501

1.4451

0.049

0.0559

0.24

21

9.1

2.303

2.3253

0.0737

-0.0223

-0.1

22

10.2

2.31

2.5906

0.0907

-0.2806

-1.29

23

4.1

1.194

1.1196

0.0611

0.0744

0.33

24

4

1.144

1.0834

0.0629

0.0606

0.27

25

2.5

0.123

0.7217

0.0845

-0.5987

-2.72R

R denotes an observation with a large standardized residual


Durbin-Watson statistic = 1.21
El valor del estadístico indica que no podemos llegar a conclusiones:
Regression Analysis: Y versus X
The regression equation is

Y = 0.131 + 0.241 X


Predictor Coef SE Coef T P

Constant 0.1309 0.1260 1.04 0.310

X 0.24115 0.01905 12.66 0.000
S = 0.2361 R-Sq = 87.4% R-Sq(adj) = 86.9%

Ajustando el modelo con una recta se tiene:



The regression equation is

Y = 0.1269 + 0.2412 X
S = 0.237095 R-Sq = 87.3% R-Sq(adj) = 86.8%
Analysis of Variance

Source DF SS MS F P

Regression 1 8.9183 8.91827 158.65 0.000

Error 23 1.2929 0.05621

Total 24 10.2112
El tratar de ajustar los datos, una recta no fue la mejor opción, por lo que se intenta

un modelo cuadrático, el cual se muestra a continuación.






Polynomial Regression Analysis: Y versus X
The regression equation is

Y = - 1.166 + 0.7236 X - 0.03808 X**2


S = 0.127171 R-Sq = 96.5% R-Sq(adj) = 96.2%
Analysis of Variance

Source DF SS MS F P

Regression 2 9.8554 4.92770 304.70 0.000

Error 22 0.3558 0.01617

Total 24 10.2112

Sequential Analysis of Variance


Source DF SS F P

Linear 1 8.91827 158.65 0.000

Quadratic 1 0.93713 57.95 0.000

A pesar de que la R2 es adecuada, los residuos muestran un comportamiento anormal, por lo que será necesario transformar la variable X. Se observa que los residuos no siguen una distribución normal por lo que es necesario transformar la variable regresora:


Transformando la variable X’ = 1/X se tiene, utilizando Minitab:



Obs

1/X

Y

Fit

SE Fit

Residual

St Resid

1

0.2

1.582

1.592

0.0188

-0.01

-0.11

2

0.167

1.822

1.8231

0.0199

-0.0011

-0.01

3

0.294

1.057

0.9393

0.0274

0.1177

1.31

4

0.37

0.5

0.4105

0.0404

0.0895

1.05

5

0.1

2.236

2.2854

0.0276

-0.0494

-0.55

6

0.103

2.386

2.264

0.0271

0.122

1.35

7

0.105

2.294

2.2527

0.0269

0.0413

0.46

8

0.328

0.558

0.7052

0.0329

-0.1472

-1.67

9

0.123

2.166

2.128

0.0243

0.038

0.42

10

0.161

1.866

1.8604

0.0203

0.0056

0.06

11

0.345

0.653

0.5876

0.0358

0.0654

0.75

12

0.157

1.93

1.8868

0.0206

0.0432

0.47

13

0.217

1.562

1.4713

0.0193

0.0907

0.98

14

0.172

1.737

1.7832

0.0195

-0.0462

-0.5

15

0.135

2.088

2.0418

0.0228

0.0462

0.51

16

0.278

1.137

1.0526

0.0251

0.0844

0.93

17

0.127

2.179

2.0955

0.0237

0.0835

0.92

18

0.114

2.112

2.1908

0.0256

-0.0788

-0.87

19

0.143

1.8

1.9882

0.0219

-0.1882

-2.06R

20

0.183

1.501

1.7065

0.0191

-0.2055

-2.23R

21

0.11

2.303

2.2168

0.0261

0.0862

0.95

22

0.098

2.31

2.299

0.0279

0.011

0.12

23

0.244

1.194

1.2875

0.0211

-0.0935

-1.02

24

0.253

1.144

1.2233

0.0221

-0.0793

-0.87

25

0.408

0.123

0.1484

0.0474

-0.0254

-0.31 X

El modelo queda como:




Regression Analysis: Y versus 1/X
The regression equation is

Y = 2.99 - 7.00 1/X


Predictor Coef SE Coef T P

Constant 2.98664 0.04763 62.71 0.000

1/X -7.0046 0.2202 -31.81 0.000
S = 0.0993273 R-Sq = 97.8% R-Sq(adj) = 97.7%
Analysis of Variance

Source DF SS MS F P

Regression 1 9.9843 9.9843 1012.00 0.000

Residual Error 23 0.2269 0.0099

Total 24 10.2112
Unusual Observations
Obs 1/X Y Fit SE Fit Residual St Resid

20 0.182 1.5010 1.7131 0.0201 -0.2121 -2.18R

25 0.400 0.1230 0.1848 0.0490 -0.0618 -0.72 X
R denotes an observation with a large standardized residual.

X denotes an observation whose X value gives it large influence.


Durbin-Watson statistic = 1.52151
Como se observa ahora los residuos muestran un comportamiento normal, indicando que el modelo es adecuado.





2.5 TRANSFORMACIONES PARA ESTABILIZAR LA VARIANZA
La suposición de varianza constante es un requerimiento básico del análisis de regresión, una razón común de violación a de este supuesto es cuando la variable de respuesta Y sigue una distribución de probabilidad en la cual la varianza esta relacionada con la media. Para estos casos se utiliza transformaciones estabilizadoras de la varianza.
Si la distribución de Y es de Poisson, podemos relacionar contra X ya que la varianza de Y’ es independiente de la media. Si la variable de respuesta Y es una proporción con valores entre [0,1] y la gráfica de residuos tiene el patrón de doble cresta, entonces se usa la transformación .
Otras transformaciones se muestran abajo en la tabla 2.2:
Tabla 2.2 Relaciones para transformar la varianza

Relación de 2 a E(Y) Transformación



Datos de Poisson

Proporciones binomiales




La magnitud de la transformación, depende del grado de curvatura que induce.

La selección de la transformación se hace en base a la experiencia o de forma empírica. A continuación se presenta un ejemplo para este análisis.


Ejemplo 2.4 Se hizo un estudio entre la demanda (Y) y la energía eléctrica utilizada (X) durante un cierto periodo de tiempo, procesando los datos con Minitab se obtuvo lo siguiente:

Obs

X

Y

Fit

SE Fit

Residual

St Resid

1

679

0.79

1.649

0.351

-0.859

-0.61

2

292

0.44

0.308

0.49

0.132

0.1

3

1012

0.56

2.802

0.293

-2.242

-1.57

4

493

0.79

1.004

0.412

-0.214

-0.15

5

582

2.7

1.312

0.381

1.388

0.98

6

1156

3.64

3.301

0.297

0.339

0.24

7

997

4.73

2.75

0.294

1.98

1.38

8

2189

9.5

6.88

0.651

2.62

2.00R

9

1097

5.34

3.097

0.293

2.243

1.57

10

2078

6.85

6.495

0.6

0.355

0.27

11

1818

5.84

5.595

0.488

0.245

0.18

12

1700

5.21

5.186

0.441

0.024

0.02

13

747

3.25

1.884

0.333

1.366

0.96

14

2030

4.43

6.329

0.579

-1.899

-1.42

15

1643

3.16

4.988

0.42

-1.828

-1.31

16

414

0.5

0.73

0.441

-0.23

-0.17

17

354

0.17

0.523

0.465

-0.353

-0.25

18

1276

1.88

3.717

0.313

-1.837

-1.29

19

745

0.77

1.877

0.333

-1.107

-0.78

20

435

1.39

0.803

0.433

0.587

0.42

21

540

0.56

1.167

0.395

-0.607

-0.43

22

874

1.56

2.324

0.307

-0.764

-0.53

23

1543

5.28

4.642

0.384

0.638

0.45

24

1029

0.64

2.861

0.293

-2.221

-1.55

25

710

4

1.756

0.343

2.244

1.58

The regression equation is


Y = - 0.7038 + 0.003464 X
S = 1.46163 R-Sq = 66.4% R-Sq(adj) = 64.9%
Analysis of Variance
Source DF SS MS F P

Regression 1 97.094 97.0943 45.45 0.000

Error 23 49.136 2.1364

Total 24 146.231


Unusual Observations

Obs X Y Fit SE Fit Residual St Resid

8 2189 9.500 6.880 0.651 2.620 2.00R


R denotes an observation with a large standardized residual.
Durbin-Watson statistic = 1.49454
Fitted Line: Y versus X



Notar que “y” es la cuenta de kilowatts utilizados por un cliente en cierta hora, se observa que la varianza aumenta conforme aumenta la media de los datos indicando que sigue el modelo de Poisson, por tanto se puede transformar con la raiz cuadrada de Y. como sigue:





Raiz(Y)

X

SRES1

TRES1

RESI1

FITS1

0.88882

679

-0.63599

-0.62755

-0.280548

1.16937

0.66333

292

-0.25322

-0.248

-0.108411

0.77174

0.74833

1012

-1.7143

-1.79523

-0.763184

1.51152

0.88882

493

-0.20513

-0.2008

-0.089439

0.97826

1.64317

582

1.30713

1.3287

0.573465

1.0697

1.90788

1156

0.55826

0.54973

0.248407

1.65947

2.17486

997

1.52481

1.57291

0.678753

1.4961

3.08221

2189

0.88812

0.88389

0.361359

2.72085

2.31084

1097

1.59927

1.65908

0.711994

1.59885

2.61725

2078

0.02523

0.02467

0.010451

2.6068

2.41661

1818

0.17965

0.17583

0.076952

2.33966

2.28254

1700

0.14802

0.14483

0.064127

2.21841

1.80278

747

1.27361

1.29201

0.563541

1.23924

2.10476

2030

-1.08504

-1.08943

-0.452723

2.55748

1.77764

1643

-0.87804

-0.8735

-0.38221

2.15985

0.70711

414

-0.43853

-0.4307

-0.189981

0.89709

0.41231

354

-0.98212

-0.98133

-0.423129

0.83544

1.37113

1276

-0.92738

-0.92444

-0.411636

1.78277

0.8775

745

-0.81296

-0.80676

-0.359685

1.23718

1.17898

435

0.59981

0.59127

0.260318

0.91866

0.74833

540

-0.63592

-0.62748

-0.278218

1.02655

1.249

874

-0.27173

-0.26618

-0.120724

1.36972

2.29783

1543

0.54906

0.54054

0.240723

2.0571

0.8

1029

-1.63735

-1.70373

-0.728982

1.52898

2

710

1.80812

1.90928

0.798781

1.20122



Regression Analysis: Raiz(Y) versus X
The regression equation is

Raiz(Y) = 0.4717 + 0.001027 X

S = 0.454426 R-Sq = 64.3% R-Sq(adj) = 62.7%

Durbin-Watson statistic = 1.65249






Se observa una mejor distribución normal de los residuos por lo que el modelo es adecuado. A continuación se muestra el análisis de varianza para el modelo:


Analysis of Variance
Source DF SS MS F P

Regression 1 8.5401 8.54008 41.36 0.000

Error 23 4.7496 0.20650

Total 24 13.2897


3. REGRESIÓN LINEAL MÚLTIPLE
3.1 Modelos de Regresión Múltiple
Asumiendo que N observaciones de la respuesta se puedan expresar por medio de un modelo de primer orden
(3.1)
En la ecuación 3.1 Yu denota la respuesta observada en el intento u; Xui representa el nivel del factor i en el intento u; las betas son parámetros desconocidos y u representa el error aleatorio en Yu. Se asume que los errores u tienen las características siguientes:


  1. Tienen media cero y varianza común 2.

  2. Son estadísticamente independientes.

  3. Están distribuidos en forma normal.


3.2 Estimación de los parámetros del modelo

El método de mínimos cuadrados selecciona como estimados para los parámetros desconocidos beta, los valores b0, b1, ...., bk respectivamente, los cuales minimizan la cantidad:



Y son las soluciones a un conjunto de (k +1) ecuaciones normales.
Sobre N observaciones el modelo de primer orden puede expresarse en forma matricial como:




Compartir con tus amigos:
1   ...   15   16   17   18   19   20   21   22   ...   59


La base de datos está protegida por derechos de autor ©odont.info 2019
enviar mensaje

    Página principal