Otras formas de comparar modelos

20 de Noviembre de 2008 · Imprimir Imprimir

A la hora de comparar modelos, la alternativa de calcular R^2_{\Omega,\omega} no es única. Otros dos índices que se emplean con gran frecuencia son F_{\Omega,\omega} y \bar{R}^2_{\Omega,\omega}. Estos índices se definen del siguiente modo:

  • \displaystyle {F_{\Omega,\omega} = \left( \frac {n-k-1}{m} \right) \frac{\triangle SCR}{SCR}}
  • \displaystyle{ \bar{R}^2_{\Omega,\omega}=1- \left( \frac{\frac{SCR}{n-k-1}}{\frac{SCR_C}{n-k-1+m}} \right)= 1 - \left( \frac{s^2}{{s^2}_C} \right)}

El primero de los dos índices, F_{\Omega,\omega}, compara el incremento en la suma de cuadrados debido a las restricciones con la suma de cuadrados de los residuos del modelo sin restricciones. Si este índice es muy grande, eso significa que se obtiene un gran beneficio por el hecho de eliminar las restricciones del modelo -o un gran perjuicio por el hecho de añadirlas-.

Como:

\displaystyle {\frac{\triangle SCR}{SCR}=cotan^2 \alpha}

tenemos que:

\displaystyle {F_{\Omega,\omega} = \left( {\frac{n-k-1}{m}} \right) cotan^2 \alpha}

siendo \alpha el ángulo que forman el vector de residuos del modelo restringido -(P+M) \varepsilon- y el vector diferencia entre los residuos del modelo restringido y del modelo libre -P \varepsilon-.

Por su parte, el índice \bar{R}^2_{\Omega,\omega} compara dos estimaciones de la varianza de los errores: la que se obtiene en el modelo libre -s^2- y la que se obtiene en el modelo restringido -{s^2}_C-. Aunque el denominador de s^2 -que es n-k-1- es menor que el de {s^2}_C - que es n-k-1+m- cabe esperar que s^2 sea menor que {s^2}_C ya que el numerador de s^2 es menor o igual que el de {s^2}_C. Cuanto más pequeño sea  s^2 en comparación con {s^2}_C mayor será \bar{R}^2_{\Omega,\omega}.

La interpretación geométrica de \bar{R}^2_{\Omega,\omega} es sencilla. Como

\displaystyle{\frac{SCR}{SCR_C}=sen^2 \alpha}

tenemos que:

\displaystyle{\bar{R}^2_{\Omega,\omega}= 1 - \left( {\frac{n-k-1+m}{n-k-1}} \right) sen^2 \alpha}

siendo \alpha el ángulo que comentábamos con anterioridad.

Nuevamente, para el cálculo efectivo de estos índices se revela inútil la expresión de las diversas sumas de cuadrados de residuos en función del vector de los errores \varepsilon. Por el contrario, los valores que deben ser tomados en consideración para efectuar los cálculos en casos concretos son los siguientes:

  • SCR = e^t e = Y^t Y - B^t X^t Y
  • \triangle SCR = (C B - \gamma)^t [C (X^t X)^{-1} C^t]^{-1} (C B - \gamma)
  • SCR_C=SCR+ \triangle SCR

Cabe señalar, finalmente, que resulta crucial poder expresar cada uno de los tres índices de comparación de modelos en función de los otros dos. Dada la importancia de este tema dedicaremos un futuro post a presentar y demostrar las relaciones entre R^2_{\Omega,\omega}, F_{\Omega,\omega} y \bar{R}^2_{\Omega,\omega}.

Un comentario »

  1. Contraste acerca de la calidad global del modelo de regresión ‹ Análisis y comunicación de datos cuantitativos ha dicho,

    8 de 8 de 2008 @ 4:59 pm

    [...] diversos indices para comparar -y seleccionar de entre ellos- modelos [...]

Deja un comentario