Analisis de regresióN


Este problema puede ser abordado con la Regresión Logística, donde la respuesta es binaria (0,1) y no sigue una distribución normal con varianza constante



Descargar 16.39 Mb.
Página53/59
Fecha de conversión02.11.2019
Tamaño16.39 Mb.
1   ...   49   50   51   52   53   54   55   56   ...   59

Este problema puede ser abordado con la Regresión Logística, donde la respuesta es binaria (0,1) y no sigue una distribución normal con varianza constante.

En el modelo general:


El valor esperado es la probabilidad de que la variable tome el valor de uno (1 = supervivencia). Para poder utilizar un modelo más general se hace una transformación logística (por ejemplo ln(p/(1-p)), lo que nos lleva al modelo de regresión logística:



Los parámetros en la regresión logística se estiman por el método de máxima verosimilitud, en términos de p, el modelo de regresión se puede escribir como:

En el ejemplo, “1” equivale a sobrevivió y “0” a no sobrevivió, y las cinco características de los pasajeros son:




  • Pclass es la clase “1” es primera, “2” es segunda y “3” es tercera.

  • Age es la edad del pasajero.

  • Sex es “1” para mujeres y “1” para hombres.

  • Parch, número de familiares directos padres e hijos.

  • Sibsp, número de hermanos o esposa.

Las tablas de contingencia para las diferentes variables son las siguientes (comando Crosstabs…):


Las proporciones de supervivencia decrecen para boletos en primera clase.



Las proporciones de supervivencia son mayores en las mujeres que en los hombres.

Las proporciones de supervivencia son mayores para pasajeros con un hermano o esposa o tres familiares directos (padres / hijos) con ellos.


Para examinar la asociación entre la edad y la supervivencia, se puede observar una gráfica de dispersión de dos variables, con la opción de Lowess curve. La cuál proporciona una representación informal del cambio en la proporción de “1” con la edad.

___________________________________________________________________.



Por ejemplo al examinar las edades de las parejas que contraen matrimonio se observa que hay cierta concentración en los jóvenes, como sigue:

La curva Lowess (locally weighted regresión fit) permite revelar la relación entre las dos edades en vez de asumir que es lineal




________________________________________________________________.

Para el caso que se está tratando de encontrar la relación entre edad y supervivencia se tiene:


A pesar de que las tablas de contingencia y gráficas de dispersión son útiles para los análisis iniciales, no describen las posibles confusiones o interacciones entre las variables consideradas.


Haciendo un análisis de tablas de contingencia adicionales con las variables se encuentra que:


  • Los hombres tienden a tener un boleto de tercera clase que las mujeres.

  • Los hombres llevan menos hermanos que las mujeres.

  • La mediana de edad es decreciente con la clase baja de pasajeros.

  • El número de hermanos o esposa decrece con la edad.

  • El número de familiares directos se incrementa con la edad.

Para clarificar la presentación de los datos, se puede hacer una clasificación múltiple de supervivencia de pasajeros dentro de estratos definidos por variables explicativas. Para lo cual se categorizar las variables edad, parch y sibsp, formando nuevas variables:




  • Age_cat para categorizar a los pasajeros en niños (<21 años) y adultos (>21 años).

  • Marital, para categorizar en cuatro estados civiles (1-Sin hermanos o esposa; 2-Con hermanos o esposa pero sin niños; 3- Sin hermanos o esposa pero con niños; 4- Con hermanos o esposa y además con niños). Para generar estas variables se pueden utilizar los comandos de SPSS Recode, Compute e If Cases. También se usa el comando Crosstabs para generar la tabla de cinco vías y Layer para indicar que forme celdas para cada combinación de las variables.



Los resultados se muestran a continuación:

Las conclusiones del estudio indican que para los pasajeros sin hermanos o esposa o sin niños, a los cuales pertenecía el 60% de los pasajeros se observa que:



  • Las mujeres con boleto de primera clase tenían una probabilidad mayor de supervivencia.

  • Los hombres con boleto de tercera clase tenían menos probabilidad de sobrevivir.

  • Los niños tuvieron mayor probabilidad de sobrevivir que los adultos.

Ahora se procederá a investigar las asociaciones entre la supervivencia y los cinco predictores potenciales utilizando la regresión logística con el comando:





Compartir con tus amigos:
1   ...   49   50   51   52   53   54   55   56   ...   59


La base de datos está protegida por derechos de autor ©odont.info 2019
enviar mensaje

    Página principal