Analisis de regresióN



Descargar 16.39 Mb.
Página49/59
Fecha de conversión02.11.2019
Tamaño16.39 Mb.
1   ...   45   46   47   48   49   50   51   52   ...   59

Un investigador está interesado en comprender el efecto de fumar y el peso en la tasa de pulso en reposo. Dado que se ha categorizado la tasa de respuesta del puso en baja y alta, el análisis de regresión logística es adecuado para comprender los efectos de fumar y peso en la tasa de pulso.





DATOS MINITAB. Exh_Regr

Y

X1

X2

Pulso en reposo

Fuma

Peso

Bajo

No

140

Bajo

No

145

Bajo

Si

160

Bajo

Si

190

Bajo

No

155

Bajo

No

165

Alto

No

150

Bajo

No

190

Bajo

No

195

Bajo

No

138

Alto

Si

160

Bajo

No

155

Alto

Si

153

Bajo

No

145

Bajo

No

170

Bajo

No

175

Bajo

Si

175

Bajo

Si

170

Bajo

Si

180

Bajo

No

135

Bajo

No

170

Bajo

No

157

Bajo

No

130

Bajo

Si

185

Alto

No

140

Bajo

No

120

Bajo

Si

130

Alto

No

138

Alto

Si

121

Bajo

No

125

Alto

No

116

Bajo

No

145

Alto

Si

150

Bajo

Si

112

Bajo

No

125

Bajo

No

190

Bajo

No

155

Bajo

Si

170

Bajo

No

155

Bajo

No

215

Bajo

Si

150

Bajo

Si

145

Bajo

No

155

Bajo

No

155

Bajo

No

150

Bajo

Si

155

Bajo

No

150

Alto

Si

180

Bajo

No

160

Bajo

No

135

Bajo

No

160

Bajo

Si

130

Bajo

Si

155

Bajo

Si

150

Bajo

No

148

Alto

No

155

Bajo

No

150

Alto

Si

140

Bajo

No

180

Bajo

Si

190

Alto

No

145

Alto

Si

150

Bajo

Si

164

Bajo

No

140

Bajo

No

142

Alto

No

136

Bajo

No

123

Bajo

No

155

Alto

No

130

Bajo

No

120

Bajo

No

130

Alto

Si

131

Bajo

No

120

Bajo

No

118

Bajo

No

125

Alto

Si

135

Bajo

No

125

Alto

No

118

Bajo

No

122

Bajo

No

115

Bajo

No

102

Bajo

No

115

Bajo

No

150

Bajo

No

110

Alto

No

116

Bajo

Si

108

Alto

No

95

Alto

Si

125

Bajo

No

133

Bajo

No

110

Alto

No

150

Bajo

No

108

Corrida en Minitab:


1    Abrir la hoja de trabajo EXH_REGR.MTW o tomar datos de esta tabla.

2    Seleccionar Stat > Regression > Binary Logistic Regression.

3    En Response, seleccionar RestingPulse. En Model, seleccionar Smokes Weight. En Factors (optional), seleccionar Smokes.

4    Click Graphs. Seleccionar Delta chi-square vs probability y Delta chi-square vs leverage. Click OK.

5    Click Results. Seleccionar In addition, list of factor level values, tests for terms with more than 1 degree of freedom, and 2 additional goodness-of-fit tests. Click OK en cada uno de las ventanas de diálogo.

Model: Especificar los términos a ser incluidos en el modelo.

Factors (optional): Especificar cuales de los predictores son factores, Minitab asume que todas las variables en el modelo con covariados a menos que se especifique cuales predictors son factores. Los predoctores continuos deben ser modelados como covariados; y los predictores categóricos deben ser modelados como factores.
Los resultados se muestran a continuación:
Results for: Exh_regr.MTW

Binary Logistic Regression: RestingPulse versus Smokes, Weight
Link Function: Logit
Información de la respuesta: - muestra el número de valores no considerados y el número de observaciones que caen dentro de cada una de las dos categorías de respuesta. El valor de la respuesta que se ha designado como el evento de referencia es la primera entrada en Valor y se etiqueta como evento. En este caso, el evento de referencia es tasa de pulso baja.

Response Information

Variable Value Count

Pulso en reposo Bajo 70 (Event)

Alto 22

Total 92
Información de los factores: muestra todos los factores del modelo, el número de niveles para cada factor, y los valores de nivel de los factores. El nivel del factor que se ha designado como nivel de referencia es la primera entrada en Values, el sujeto no fuma.

Factor Information

Factor Levels Values

Fuma 2 No, Si

Tabla de regression logística – muestra los coeficientes estimados, error estándar de los coeficientes, su valor Z y p. Cuando se usa la función de enlace logia, se puede también obtener la tasa de posibilidades y un intervalo de confianza del 95% para esta tasa.


  • De la salida, se puede ver que los coeficientes estimados para ambos Fuma (z=-2.16, p =0.031) y Peso (z= 2.04, p = 0.041), tienen valores p menores a 0.05 indicando que hay suficiente evidencia de que los coeficientes no sean cero utilizando un alfa de 0.05.

  • El coeficiente estimado de -1.193 para Fuma, representa el cambio en el logaritmo de P(pulso bajo/P(pulso alto) cuando el sujeto fuma comparado a cuando no lo hace, con el covariado peso mantenido constante.

  • El coeficiente estimado de 0.025 para Peso representa el cambio en el logaritmo de P(pulso bajo/P(pulso alto) con un incremento en peso de 1 libra, con el factor Fuma mantenido constante.

  • A pesar de que hay evidencia de que el coeficiente estimado para el peso no es cero, la tasa de posibilidades es cercana a uno (1.03), indicando que un incremento de una libra en peso afecta de forma mínima a la tasa de pulso en reposo de la persona. Se puede observar una diferencia más significativa si se comparan sujetos con una diferencia más grande en peso, (por ejemplo, si la unidad de peso es de 10 libras, la tasa de posibilidades pasa a ser 1.28, indicando que las posibilidades de un sujeto para que tenga un pulso bajo se incrementan 1.28 veces con cada 10 libras de incremento en peso).

  • Para Fuma, el coeficiente negativo de -1.193 y la tasa de posibilidades de 0.30, indica que quien fuma, tiende a tener una tasa de pulso más alta que los sujetos que no fuman. Si los sujetos tienen el mismo peso, la tasa de posibilidades se puede interpretar como las posibilidades de que los fumadores en la muestra tengan un pulso bajo sea sólo del 30% de las posibilidades de que los no fumadores tengan un pulso bajo.

Logistic Regression Table

Odds 95% CI

Predictor Coef SE Coef Z P Ratio Lower Upper

Constant -1.98717 1.67930 -1.18 0.237

Fuma

Si -1.19297 0.552980 -2.16 0.031 0.30 0.10 0.90



Peso 0.0250226 0.0122551 2.04 0.041 1.03 1.00 1.05

Se muestra el último valor de verosimilitud logarítmica de las iteraciones de máxima verosimilitud, junto con el estadístico G. Este estadístico prueba la hipótesis nula de que todos los coeficientes asociados con los predictores son iguales a cero versus que sean diferentes de cero. En este caso, G = 7.54, con un valor P de 0.023, indica que suficiente evidencia de uno de los coeficientes es diferente de cero, para alfa de 0.05.
Log-Likelihood = -46.820

Test that all slopes are zero: G = 7.574, DF = 2, P-Value = 0.023



Las pruebas de bondad de ajuste muestran las pruebas de – Pearson, desviación, y Hosmer-Lemeshow. Como se seleccionó el enlace a la función Logia y las opciones en la ventana de resultados, además se muestran las pruebas de Brown de alternativa general y simétrica. Las pruebas de bondad de ajuste, con valor p de 0.312 y 0.724, indican que no hay suficiente evidencia para afirmar que el modelo no ajusta los datos adecuadamente, si los valores p fueran menores a alfa, el modelo no ajustaría a los datos.
Goodness-of-Fit Tests

Method Chi-Square DF P

Pearson 40.8477 47 0.724

Deviance 51.2008 47 0.312

Hosmer-Lemeshow 4.7451 8 0.784

Brown:


General Alternative 0.9051 2 0.636

Symmetric Alternative 0.4627 1 0.496



La tabla de valores observados y frecuencias esperadas – permite ver que tan bien el modelo ajusta los datos, al comparar las frecuencias observadas y esperadas. Hay evidencia insuficiente de que el modelo no ajuste a los datos bien, ya que ambas frecuencias son similares. Esto soporta las conclusiones hechas en las pruebas de bondad de ajuste.
Table of Observed and Expected Frequencies:

(See Hosmer-Lemeshow Test for the Pearson Chi-Square Statistic)

Group

Value 1 2 3 4 5 6 7 8 9 10 Total



Bajo

Obs 4 6 6 8 8 6 8 12 10 2 70

Exp 4.4 6.4 6.3 6.6 6.9 7.2 8.3 12.9 9.1 1.9

Alto


Obs 5 4 3 1 1 3 2 3 0 0 22

Exp 4.6 3.6 2.7 2.4 2.1 1.8 1.7 2.1 0.9 0.1

Total 9 10 9 9 9 9 10 15 10 2 92

Medidas de asociación – muestran una tabla del número y porcentaje de pares de datos concordantes, discordantes y apareados, así como las estadísticas de correlaciones comunes de rangos. Estos valores miden la asociación entre las respuestas observadas y las probabilidades estimadas.


  • La tabla de pares de datos concordantes, discordantes y apareados se calcula con valores de respuesta diferentes. En este caso, se tienen 70 individuos con pulso bajo y 22 con pulso alto, resultando en 70*22 = 1540 pares con diferentes valores de respuesta. Con base en el modelo, un par es concordante si el individuo con pulso bajo tiene una probabilidad más alta de tener un pulso bajo; es discordante si ocurre lo opuesto; y pareado si las probabilidades son iguales.




  • En este ejemplo, el 67.9% es concordante y 29.9% son discordantes. Se pueden usar estos valores como una medición comparativa de predicción, por ejemplo al comparar valores estimados con diferentes conjuntos de predictores o con diferentes funciones de enlace.




  • Se presentan resúmenes pares concordantes y discordantes de Sommers, Goodman-Krsukal Gamma y Kendall Tau-a. Estas medidas tienden a encontrarse entre 0 y 1, donde los valores más grandes indican que le modelo tien una mejor habilidad predictiva. En este ejemplo, el rango de medición de 0.14 a 0.39 implica una predictibilidad menor a la deseable.

Measures of Association:

(Between the Response Variable and Predicted Probabilities)

Pairs Number Percent Summary Measures

Concordant 1045 67.9 Somers' D 0.38

Discordant 461 29.9 Goodman-Kruskal Gamma 0.39

Ties 34 2.2 Kendall's Tau-a 0.14

Total 1540 100.0



Gráficas: - En el ejemplo, se seleccionaron dos gráficas para diagnóstico, Delta Chi cuadrada de Pearson versus la probabilidad estimada del evento y Delta Pearson versus los valores influyentes.
La Delta Chi cuadrada de Pearson para el j-ésimo patrón de factor/covariado es el cambio en la Chi cuadrada de Pearson cuando se omiten todas las observaciones con ese patrón de factor/covariado.
Las gráficas indican que dos observaciones no ajustan bien en el modelo (alto Delta Chi cuadrado). Puede ser causado por un valor influeyente grande y/o un residuo alto de Pearson, que fue el caso ya que los valores influyentes fueron menores 0.1.
Hosmer y Lemeshow indican que Delta Chi cuadrado o Delta Deviance mayores a 3.84 son grandes.








Compartir con tus amigos:
1   ...   45   46   47   48   49   50   51   52   ...   59


La base de datos está protegida por derechos de autor ©odont.info 2019
enviar mensaje

    Página principal