El modelo de ajuste con restricciones “pasa por la media”

23 de Diciembre de 2009 · Imprimir Imprimir

Consideremos el modelo teórico lineal

Y=X \beta + \epsilon

El modelo de ajuste correspondiente a este modelo teórico es

Y=X B + e

Este modelo de ajuste cumple

\bar{Y}=\bar{X} B

Este hecho se suele expresar diciendo que “el modelo de ajuste pasa por la media”. Este hecho resulta de gran utilidad práctica ya que permite el cálculo del término independiente en el caso de que el ajuste del modelo se esté efectuando mediante el método de datos centrados mediante el empleo de la siguiente fórmula:

a= \bar{y} - b_{1} \bar{X_1} - \ldots - b_{k} \bar{X_k}

Pero, ¿qué ocurre cuando al modelo teórico se le añaden restricciones lineales? ¿sigue pasando por la media? Dicho de otra forma: ¿se cumple la siguiente expresión?

\bar{Y}=\bar{X} B_C

Bajo ciertas condiciones, la respuesta es afirmativa y la demostración sumamente sencilla

Sabemos que

B_C = B + (X^t X)^{-1} C^t [C (X^t X)^{-1} C^t]^{-1} (\gamma - C B)

y por tanto

\bar{X} B_C = \bar{X} B +\bar{X} (X^t X)^{-1} C^t [C (X^t X)^{-1} C^t]^{-1} (\gamma - C B)

Para que \bar{Y}=\bar{X} B_C debe ocurrir que

\bar{X} (X^t X)^{-1} C^t [C (X^t X)^{-1} C^t]^{-1} (\gamma - C B) = 0

ya que \bar{Y}=\bar{X} B

Consideremos la matriz

\bar{X} (X^t X)^{-1} C^t

Demostraremos que, bajo ciertas condiciones muy generales, dicha matriz es nula y, en consecuencia, que

\bar{X} (X^t X)^{-1} C^t [C (X^t X)^{-1} C^t]^{-1} (\gamma - C B) = 0

por lo que

\bar{Y}=\bar{X} B_C

En efecto,

\bar{X} (X^t X)^{-1} C^t = H_1 X (X^t X)^{-1} C^t

donde H_1 es la matriz que proyecta los vectores de R^n en la dirección del vector formado por unos.

H_1 = 1 (1^t 1)^{-1} 1^t = \frac {1}{n} 1 1^t

El resultado de premultiplicar cualquier vector de R^n por la matriz H_1 es un vector de R^n cuyos componentes son todos iguales e iguales a la media de los componentes del vector original.

Consideremos ahora la matriz

X (X^t X)^{-1}

Si premultiplicamos esta matriz por X^t, el resultado es la matriz identidad, por lo que todas las columnas de X (X^t X)^{-1} excepto la primera son ortogonales al vector de R^n formado por unos -la primera columna de la matriz X-. Si no fuera así, (X^t X) (X^t X)^{-1} no sería la matriz identidad, lo cual es absurdo. Dicho de otro modo, las sumas de los elementos de todas y cada una de las columnas de la matriz  X (X^t X)^{-1} -excepto la primera- son nulas y, en consecuencia, las medias son nulas.

Como consecuencia de este hecho,

\bar{X} (X^t X)^{-1} = H_1 X (X^t X)^{-1}

es una matriz cuyos componentes son nulos salvo los de la primera columna.

¿Qué debe ocurrir para que la matriz \bar{X} (X^t X)^{-1} C^t sea nula?

Es suficiente con que la primera columna de la matriz C sea nula. En ese caso, al postmultiplicar \bar{X} (X^t X)^{-1} por C^t se obtendrán combinaciones lineales de columnas de ceros, ya que la primera columna de \bar{X} (X^t X)^{-1} -la única que puede no tener ceros- no forma parte de las combinaciones lineales.

¿Cómo podemos expresar la idea de que la primera columna de la matriz C sea nula de una forma más intuitiva? La primera columna de la matriz C recoge los coeficientes del término independiente en las restricciones lineales que se añaden al modelo teórico. Decir que la primera columna de C es nula es lo mismo que decir que las restricciones añadidas al modelo teórico no involucran al término independiente.

En resumen, hemos demostrado que si las restricciones lineales que se añaden a un modelo teórico no incluyen al término independiente -lo que, en la práctica es la situación más habitual- entonces el modelo de ajuste con restricciones “pasa por la media”, es decir, satisface la ecuación

\bar{Y}=\bar{X} B_C

Finalmente, este hecho resulta de gran utilidad práctica para calcular el término independiente en el modelo de ajuste con restricciones si es que se está trabajando con datos centrados ya que se cumple que

a_C= \bar{y} - b_{1C} \bar{X_1} - \ldots - b_{kC} \bar{X_k}

Deja un comentario