El modelo teórico de regresión lineal múltiple y el teorema de Rouché-Fröbenius
Imprimir
Para todos aquellos a los que el modelo de múltiple les resulte familiar, no lo será menos la expresión matricial Y=X * Beta + epsilon. Esta ecuación matricial es el modelo teórico de la regresión lineal múltiple y expresa, de forma muy compacta, todo un que resulta tener infinitas soluciones. De hecho, el proceso de encontrar la ecuación del de regresión es, sencillamente, el de seleccionar de entre esas infinitas soluciones una que resulte óptima en algún sentido -este sentido no es otro que el de de los valores que en la solución del sistema se asignan a los errores, es decir, los residuos-.
La prueba de que el sistema Y = X * Beta + epsilon tiene infinitas soluciones nos la proporciona el -conocido también como teorema de Kronecker-Capelli-, que afirma que es para que un sistema de ecuaciones tenga solución que el de la matriz de coeficientes del sistema coincida con el rango de la matriz de coeficientes ampliada con los términos independientes. Además, si este rango coincide con el número de incógnitas del sistema, éste será compatible determinado -es decir, tendrá una única solución-; en caso contrario, el sistema será compatible indeterminado -es decir, tendrá infinitas soluciones-.
En resumen, si A es la matriz de coeficientes del sistema y A* la matriz ampliada, pueden darse tres situaciones:
- rg(A) es distinto de rg(A*): entonces el sistema es incompatible, es decir, no tiene solución.
- rg(A) y rg(A*) son iguales pero menores que el número de incógnitas: entonces el sistema es compatible indeterminado, es decir, tiene infinitas soluciones. La diferencia entre el número de incógnitas y el rango común de las matrices A y A* recibe el nombre de . Estos grados de libertad determinan la dimensión del espacio de soluciones del sistema. Expresado de otra forma, es posible fijar libremente los valores de un número de incógnitas igual a los grados de libertad del sistema de ecuaciones. Una vez hecho esto, las demás incógnitas tienen sus valores establecidos.
- rg(A), rg(A*) y el número de incógnitas coinciden: entonces el sistema es compatible determinado, es decir, tiene una única solución.
Es muy fácil comprobar que la matriz de coeficientes y la matriz ampliada del sistema Y = X * Beta + epsilon son de rango n -igual al número de observaciones- mientras que el número de incógnitas es n+k+1, siendo k el número de variables explicativas consideradas en el modelo de regresión. Se trata, por tanto, de un sistema de ecuaciones compatible indeterminado con k+1 grados de libertad, es decir, un sistema con infinitas soluciones, que se encuentran en un espacio de dimensión k+1. Como consecuencia, existe plena libertad para elegir los valores más apropiados para las k+1 incógnitas que componen el vector Beta con el objetivo de que los valores que toman los n componentes del vector épsilon sean, en su conjunto, .
