Tema 2: descripción conjunta de varias variables introducción distribuciones de frecuencias bivariantes


INTRODUCCIÓN AL MÉTODO DE MÍNIMOS CUADRADOS



Descargar 205.15 Kb.
Página10/16
Fecha de conversión02.11.2019
Tamaño205.15 Kb.
1   ...   6   7   8   9   10   11   12   13   ...   16
4.1 INTRODUCCIÓN AL MÉTODO DE MÍNIMOS CUADRADOS
El diagrama de dispersión o nube de puntos nos permitía visualizar la relación entre dos variables X e Y. Al representar el diagrama de dispersión podemos encontrar las siguientes situaciones:

  • Distribuciones estadísticas para las que la nube de puntos se dispone de tal forma que existe una función matemática cuyos puntos son una parte de su representación gráfica.

  • Sin coincidir exactamente sus puntos con las de una gráfica de una función matemática, se aproximan a ella con mayor o menor intensidad.

  • La nube de puntos presenta un aspecto tal que no existe concentración de puntos hacia ninguna gráfica matemática, distribuyéndose de una forma uniforme en una región del plano.

En el primer caso se dice que existe una dependencia funcional o exacta entre las variables X e Y, es decir existe una función matemática tal que Y = f(X). En el segundo caso se dice que existe una dependencia estadística o aproximada entre las dos variables, Y aprox f(X). Y en el último caso diríamos que las variables son independientes.

Es el segundo caso del que se ocupa la teoría de la regresión.

Las técnicas de regresión tienen por objeto modelizar, es decir, encontrar una función que aproxime lo máximo posible la relación de dependencia estadística entre variables y predecir los valores de una de ellas: Y (Variable dependiente o explicada) a partir de los de la otra (o las otras): X (variables(s) independiente(s) ó explicativa(s)).

Llamaremos regresión de Y sobre X a la función que explica la variable Y (dependiente) para cada valor de la X (independiente).

Y  f(X)

Llamaremos regresión de X sobre Y a la función que explica la variable X (dependiente) para cada valor de la Y (independiente).

X  f(y)

La regresión es lineal cuando el modelo función de regresión seleccionado es una recta. En cualquier otro caso se dice regresión no lineal. La regresión será simple cuando sólo tengamos una variable independiente. Cuando tengamos dos o más variables independientes, la regresión será múltiple (no se verá).

El procedimiento será:



  1. Elegir un tipo de función o curva que creamos que mejor relaciona las dos variables; esto lo podemos hacer observando la nube de puntos.

  2. Obtener la ecuación de la curva, de entre las infinitas de dicho tipo que hay en el plano, que mejor se adapte al conjunto de puntos. El objetivo de obtener esa ecuación será predecir el valor de la variable Y dado un valor x0 de la variable X.

  3. Obtener una medida del grado de esta asociación o correlación. Esto me dará la fiabilidad de las predicciones que haga con esta ecuación.

Notar que los dos primeros apartados se engloban dentro de lo que se conoce como la teoría de la regresión mientras que el tercero es lo que se conoce como teoría de la correlación.

El segundo apartado se conoce como el problema del ajuste y se pueden emplear diferente métodos matemáticos para ello, tenemos:


  • Método de los mínimos cuadrados.

  • Método de los polinomios ortogonales.

  • Método de los momentos.

  • Método de la curva logística.

Sólo vamos a desarrollar el método de los mínimos cuadrados. Trabajaremos con la muestra original, sin ordenar ni agrupar en una tabla de frecuencias.





Compartir con tus amigos:
1   ...   6   7   8   9   10   11   12   13   ...   16


La base de datos está protegida por derechos de autor ©odont.info 2019
enviar mensaje

    Página principal