El modelo teórico de regresión lineal múltiple y el teorema de Rouché-Fröbenius

10 de Octubre de 2008 · Imprimir Imprimir

Para todos aquellos a los que el modelo de regresión lineal múltiple les resulte familiar, no lo será menos la expresión matricial Y=X * Beta + epsilon. Esta ecuación matricial es el modelo teórico de la regresión lineal múltiple y expresa, de forma muy compacta, todo un sistema de ecuaciones lineales que resulta tener infinitas soluciones. De hecho, el proceso de encontrar la ecuación del hiperplano de regresión es, sencillamente, el de seleccionar de entre esas infinitas soluciones una que resulte óptima en algún sentido -este sentido no es otro que el de minimizar la suma de los cuadrados de los valores que en la solución del sistema se asignan a los errores, es decir, los residuos-.

La prueba de que el sistema Y = X * Beta + epsilon tiene infinitas soluciones nos la proporciona el teorema de Rouché-Fröbenius -conocido también como teorema de Kronecker-Capelli-, que afirma que es condición necesaria y suficiente para que un sistema de ecuaciones tenga solución que el rango de la matriz de coeficientes del sistema coincida con el rango de la matriz de coeficientes ampliada con los términos independientes. Además, si este rango coincide con el número de incógnitas del sistema, éste será compatible determinado -es decir, tendrá una única solución-; en caso contrario, el sistema será compatible indeterminado -es decir, tendrá infinitas soluciones-.

En resumen, si A es la matriz de coeficientes del sistema y A* la matriz ampliada, pueden darse tres situaciones:

  • rg(A) es distinto de rg(A*): entonces el sistema es incompatible, es decir, no tiene solución.
  • rg(A) y rg(A*) son iguales pero menores que el número de incógnitas: entonces el sistema es compatible indeterminado, es decir, tiene infinitas soluciones. La diferencia entre el número de incógnitas y el rango común de las matrices A y A* recibe el nombre de grados de libertad. Estos grados de libertad determinan la dimensión del espacio de soluciones del sistema. Expresado de otra forma, es posible fijar libremente los valores de un número de incógnitas igual a los grados de libertad del sistema de ecuaciones. Una vez hecho esto, las demás incógnitas tienen sus valores establecidos.
  • rg(A), rg(A*) y el número de incógnitas coinciden: entonces el sistema es compatible determinado, es decir, tiene una única solución.

Es muy fácil comprobar que la matriz de coeficientes y la matriz ampliada del sistema Y = X * Beta + epsilon son de rango n -igual al número de observaciones- mientras que el número de incógnitas es n+k+1, siendo k el número de variables explicativas consideradas en el modelo de regresión. Se trata, por tanto, de un sistema de ecuaciones compatible indeterminado con k+1 grados de libertad, es decir, un sistema con infinitas soluciones, que se encuentran en un espacio de dimensión k+1. Como consecuencia, existe plena libertad para elegir los valores más apropiados para las k+1 incógnitas que componen el vector Beta con el objetivo de que los valores que toman los n componentes del vector épsilon sean, en su conjunto, lo más pequeños posible.

Deja un comentario