¿Y qué ocurre con la suma de cuadrados de los residuos…

18 de Noviembre de 2008 · Imprimir Imprimir

…cuando añadimos una restricción al modelo teórico?

La respuesta es sumamente intuitiva: ¡debe aumentar! ¿Por qué?

Si la estimación de minimos cuadrados de \beta -a la que hemos dado en llamar B y que puede tomar cualquier valor en R^{k+1}- garantiza que la suma de cuadrados de los residuos es un mínimo global, es claro que si el espacio de búsqueda se restringe a un subespacio afín de R^{k+1} -y éste es precisamente el efecto de añadir restricciones al modelo teórico- entonces el mínimo restringido será mayor o igual que el mínimo sin restricciones.

Es sólo una vez aceptado el hecho irrefutable de que la suma de cuadrados de los residuos debe crecer -o al menos no decrecer- al incorporar un conjunto de restricciones lineales al modelo teórico cuando cobra sentido la siguiente cuestión: ¿cuánto aumentará esta suma de cuadrados?

Desde un punto de vista teórico sabemos que la suma de cuadrados en el modelo con restricciones viene dada por {e_C}^t {e_C} = [(M+P) \varepsilon]^t [(M+P) \varepsilon]= \varepsilon^t (M+P) \varepsilon = \varepsilon^t M \varepsilon + \varepsilon^t P \varepsilon. Como la suma de los cuadrados de los residuos en el modelo sin restricciones es \varepsilon^t M \varepsilon deducimos que el incremento en la suma de cuadrados de los residuos debe ser:

\triangle SCR = \varepsilon^t P \varepsilon

Esta expresión -que será muy útil en posteriores desarrollos teóricos- no resulta, sin embargo, adecuada desde el punto de vista computacional.

Afortunadamente podemos seguir otro camino: sabemos que la estimación de \beta con el conjunto de restricciones lineales C \beta = \gamma nos la proporciona la expresión:

B_C = B + (X^t X) ^{-1} C^t [C (X^t X) ^{-1} C^t]^{-1} (\gamma - C B)

De aquí se deduce que el vector de los residuos del modelo sujeto a las restricciones es:

Y - X B_C = Y - X B - X (X^t X) ^{-1} C^t [C (X^t X) ^{-1} C^t]^{-1} (\gamma - C B)

La suma de los cuadrados de los residuos en el modelo con restricciones será:

SCR_C=(Y - X B_C)^t (Y - X B_C)=(Y - X B - K)^t(Y - X B - K)

Esta expresión es igual a:

(e-K)^t + (e-K)

donde:

K=X (X^t X) ^{-1} C^t [C (X^t X) ^{-1} C^t]^{-1} (\gamma - C B)

es un vector de dimensión (n,1).

Por tanto:

SCR_C=(e-K)^t + (e-K)=e^t e -e^t K -K^t e + K^t K

pero como se puede comprobar muy fácilmente:

e^t K=0 y K^t e=0

por lo que:

SCR_C=(e-K)^t + (e-K)=e^t e  + K^t K

de donde se deduce que el incremento en la suma de cuadrados de los residuos debido a la inclusión de las restricciones lineales es:

\triangle SCR = K^t K

Resulta evidente que, por ser K \in R^n, \triangle SCR es una suma de cuadrados y, por tanto, es una magnitud no negativa.

Veamos cuál es su valor:

\{X (X^t X) ^{-1} C^t [C (X^t X) ^{-1} C^t]^{-1} (\gamma - C B)\}^t \{X (X^t X) ^{-1} C^t [C (X^t X) ^{-1} C^t]^{-1} (\gamma - C B)\}

y operando:

(\gamma - C B)^t [C (X^t X) ^{-1} C^t]^{-1} C (X^t X) ^{-1} (X^t X) (X^t X) ^{-1} C^t [C (X^t X) ^{-1} C^t]^{-1} (\gamma - C B)

Si eliminamos los productos de matrices por sus respectivas inversas llegamos, en primer lugar, a:

(\gamma - C B)^t [C (X^t X) ^{-1} C^t]^{-1} [C (X^t X) ^{-1} C^t] [C (X^t X) ^{-1} C^t]^{-1} (\gamma - C B)

y luego a:

(\gamma - C B)^t [C (X^t X) ^{-1} C^t]^{-1} (\gamma - C B)

o lo que es equivalente:

\triangle SCR = (C B - \gamma )^t [C (X^t X) ^{-1} C^t]^{-1} (CB - \gamma )

Aún podemos dar una interpretación adicional a \triangle SCR. En efecto, la matriz (X^t X) es semidefinida positiva e invertible y, por tanto, es definida positiva. Este carácter lo comparten las matrices (X^t X) ^{-1}, C (X^t X) ^{-1} C^t y \{C (X^t X) ^{-1} C^t\}^{-1}.

Ahora, por tratarse \{C (X^t X) ^{-1} C^t\}^{-1} de una matriz definida positiva podemos afirmar que define un producto escalar en el espacio vectorial R^m -lo que lo convierte en un espacio normado- y que \triangle SCR es el cuadrado de la norma del vector C B - \gamma según el mencionado producto escalar que, como cuadrado de un escalar -que ya es, de por sí, no negativo- es no negativo.

Una interpretación intuitiva del incremento en la suma de los cuadrados de los residuos nos la proporciona la concepción de la norma de un vector como una medida de su “longitud“. En este sentido, podemos entender \triangle SCR como una medida de la longitud del vector CB - \gamma, es decir, una medida de la magnitud en que el estimador sin restricciones B incumple las restricciones C \beta = \gamma. Cuanto mayor sea el incumplimiento de estas restricciones mayor será el incremento de la suma de cuadrados de los residuos debido a la incorporación de dichas restricciones al modelo teórico.

Un comentario »

  1. Restricciones lineales con datos centrados ‹ Análisis y comunicación de datos cuantitativos ha dicho,

    19 de 19 de 2008 @ 7:21 am

    [...] de modo análogo a lo que hicimos en éste y en este otro post se llega a que la estimación de sujeta a las restricciones [...]

Deja un comentario