Comparación de modelos en regresión lineal múltiple

19 de Noviembre de 2008 · Imprimir Imprimir

Uno de los temas recurrentes en el modelo de regresión lineal múltiple es el referente a la comparación de modelos. En la tarea por tratar de predecir de la mejor manera posible la variable dependiente es crucial disponer de herramientas que permitan comparar entre sí distintas combinaciones de las variables explicativas, sujetas o no a ciertas restricciones.

Dada una variable dependiente Y y un conjunto de k variables explicativas X_1, \ldots, X_k diremos que un modelo \Omega es mayor que otro modelo \omega si el dominio del vector \beta en el modelo \omega es un subconjunto de dicho dominio en el modelo \Omega.

Como el espacio de búsqueda del óptimo en el modelo \omega es un subconjunto de dicho espacio de búsqueda en el modelo \Omega es evidente que la suma de cuadrados de los residuos en el modelo \Omega debe ser menor o igual que dicha suma de cuadrados en el modelo \omega, es decir:

SCR_{\omega} \ge SCR_{\Omega}

De aquí se deduce que:

\displaystyle {0 \le \frac{SCR_{\omega}-SCR_{\Omega}}{SCR_{\omega}} \le 1}

La fracción que aparece en la expresión anterior -cuyo valor se encuentra entre 0 y 1- es una medida de la aportación del modelo \Omega al modelo \omega. En efecto, el denominador de la fracción recoge la suma de cuadrados de los residuos del modelo \omega, es decir, la parte de la variación de la variable dependiente que el modelo \omega no ha sido capaz de explicar. Por su parte, el numerador recoge la reducción en la suma de cuadrados de los residuos por el hecho de pasar del modelo \omega al modelo \Omega. Si el valor del cociente fuera 0 significaría que el modelo \Omega no aporta nada -en comparación con el modelo \omega- a la explicación de la variable dependiente ya que SCR_{\Omega}=SCR_{\omega}. En el extremo opuesto, para que el valor del cociente sea 1 es necesario que SCR_{\Omega}=0, es decir, que el modelo \Omega prediga perfectamente los valores de la variable dependiente, siendo capaz de explicar todo aquello que el modelo \omega dejó sin explicar.

Por razones que más adelante veremos, vamos a llamar al cociente analizado R^2_{\Omega,\omega}, es decir:

\displaystyle {R^2_{\Omega,\omega}= \frac{SCR_{\omega}-SCR_{\Omega}}{SCR_{\omega}} }

Si aplicamos estos conceptos al caso de las restricciones lineales en el modelo de regresión nos encontramos con que el modelo sin restricciones es un modelo mayor que el modelo sometido a restricciones. Por ese motivo, la aportación de eliminar las restricciones de un modelo que las tenga vendrá dada por:

\displaystyle {R^2_{\Omega,\omega}= \frac{SCR_{C}-SCR}{SCR_{C}} = \frac {\triangle SCR}{SCR+\triangle SCR}}

Como ya hemos visto, bajo el supuesto C \beta = \gamma, tenemos que:

C B - \gamma = C B - C \beta = C (X^t X)^{-1} X^t Y - C (X^t X)^{-1} (X^t X) \beta = C (X^t X)^{-1} X^t \varepsilon

y, por tanto:

\triangle SCR = \varepsilon^t \{ X (X^t X)^{-1} C^t [C (X^t X)^{-1} C^t]^{-1} C (X^t X)^{-1} X^t \} \varepsilon= \varepsilon^t P \varepsilon

Recordemos que la matriz P es simétrica, idempotente y que cumple que M P = 0 y P M = 0.

Por tanto, si recordamos que SCR = \varepsilon^t M \varepsilon:

\displaystyle {R^2_{\Omega,\omega}= \frac{SCR_{C}-SCR}{SCR_{C}} = \frac {\triangle SCR}{SCR+\triangle SCR}}= \frac{\varepsilon^t P \varepsilon}{\varepsilon^t (M+P) \varepsilon}

Los vectores P \varepsilon, M \varepsilon y (M+P) \varepsilon son, respectivamente, los catetos y la hipotenusa de un triángulo rectángulo -en efecto, P \varepsilon y M \varepsilon son ortogonales ya que \varepsilon^t M P \varepsilon=0-. Ahora, si consideramos los vectores P \varepsilon y (M+P) \varepsilon y efectuamos su producto escalar tenemos que éste es igual a:

\varepsilon^t P (M+P) \varepsilon= \varepsilon^t P \varepsilon

Por otra parte, dicho producto escalar es igual a:

\sqrt{\varepsilon^t P \varepsilon} \sqrt{\varepsilon^t (M+P) \varepsilon} \cos \alpha

Igualando ambas expresiones y despejando \cos \alpha:

\displaystyle {\cos \alpha = \frac {\sqrt{\varepsilon^t P \varepsilon}}{\sqrt{\varepsilon^t (M+P) \varepsilon}}}

de donde se deduce que R^2_{\Omega,\omega} es el cuadrado del coseno del ángulo entre los vectores P \varepsilon y (M+P) \varepsilon siendo M \varepsilon el vector de los residuos en el modelo sin restricciones, (M+P) \varepsilon el vector de residuos en el modelo con restricciones y P \varepsilon el vector diferencia entre los dos anteriores.

Visto de otro modo, el coeficiente R^2_{\Omega,\omega} es:

\displaystyle{R^2_{\Omega,\omega}=\frac{\varepsilon^t P \varepsilon}{\varepsilon^t (M+P) \varepsilon}= 1-\frac{\varepsilon^t M \varepsilon}{\varepsilon^t (M+P) \varepsilon} = 1 - \frac{\| {M \varepsilon} \|^2}{\| {(M+P) \varepsilon} \|^2}}

y compara el vector de residuos sin restricciones M \varepsilon con el vector de residuos sujeto a las restricciones (M+P) \varepsilon.

Por ser P simétrica e idempotente es semidefinida positiva, y por tanto \varepsilon^t P \varepsilon \ge 0. De aquí se deduce que:

{\| {(M+P) \varepsilon} \|}^2 = \varepsilon^t M \varepsilon + \varepsilon^t P \varepsilon \ge \varepsilon^t M \varepsilon = {\| {M \varepsilon} \|}^2.

Si la longitud de M \varepsilon no es muy inferior a la de (M+P) \varepsilon entonces R^2_{\Omega,\omega} estará muy próximo a cero, lo que es un indicador de que la eliminación de las restricciones no aporta demasiado en el sentido de reducir la suma de los cuadrados de los residuos. Si, por el contrario, la longitud de M \varepsilon es mucho menor que la de (M+P) \varepsilon entonces el valor de R^2_{\Omega,\omega} será muy cercano a uno, lo que indica que la eliminación de las restricciones es muy provechosa en términos de reducción de la suma de los cuadrados de los residuos.

Por último, es necesario señalar que la expresión de los diversos vectores de residuos -en los modelos sin y con restricciones- en función del vector de errores \varepsilon resulta de gran interés para la presentación de sus propiedades geométricas -en particular, la ortogonalidad-, pero es inútil cuando se trata de efectuar un cálculo concreto, ya que, como siempre, el vector \varepsilon es desconcido. Cuando se trata de efectuar el cálculo concreto de R^2_{\Omega,\omega} hay que tomar en consideración que:

  • SCR = e^t e = Y^t Y - B^t X^t Y
  • \triangle SCR = (C B - \gamma)^t [C (X^t X)^{-1} C^t]^{-1} (C B - \gamma)
  • SCR_C=SCR+ \triangle SCR

Un comentario »

  1. Otras formas de comparar modelos ‹ Análisis y comunicación de datos cuantitativos ha dicho,

    20 de 20 de 2008 @ 4:57 pm

    [...] la hora de comparar modelos, la alternativa de calcular no es única. Otros dos índices que se emplean con gran frecuencia son y . Estos índices se [...]

Deja un comentario