Las hipótesis de Gauss-Markov
Imprimir
En los anteriores posts relativos al modelo de regresión multivariante nos hemos ocupado de presentar diferentes formas de calcular una solución óptima para este sistema de ecuaciones -a la que hemos dado en llamar modelo de ajuste- y a demostrar que dicha solución es óptima en el sentido de que el módulo del vector de residuos es mínimo. Sin embargo, no hemos prestado atención al carácter constante o aleatorio de los distintos elementos que conforman el modelo teórico de regresión. Este carácter -fijo o aleatorio- es crucial para poder estudiar la calidad del modelo de ajuste que hemos encontrado.
El modelo teórico de regresión supone que la variable aleatoria dependiente es la suma de dos elementos:
- Un sumando constante y desconocido,
, que es una combinación lineal de las variables explicativas -además de la columna de unos-.
- Un sumando aleatorio y también desconocido
que recoge el efecto sobre la variable dependiente de todas aquellas variables candidatas a ser explicativas que no se encuentran recogidas en la parte constante del modelo.
De aquí deducimos que:
- El vector conocido
se descompone en la suma de dos elementos desconocidos. Sabemos que
se explica por un sumando constante
y otro sumando aleatorio
pero no sabemos el valor de cada uno de estos dos sumandos.
- El vector
es aleatorio, ya que el carácter aleatorio de
“se contagia” a
a través de la expresión del modelo teórico de regresión
.
Pues bien, las llamadas hipótesis de Gauss-Markov nos informan acerca de cuál es el comportamiento del vector aleatorio y, a partir de ellas, podremos determinar el comportamiento de otros vectores aleatorios tales como
o
.
Las hipótesis de Gauss-Markov son las siguientes:
- El vector de los errores
tiene media nula, es decir,
- Todas las variables aleatorias que componen el vector
tienen la misma varianza
, es decir
- La covarianza entre cualesquiera dos términos de error es nula, es decir,
La segunda y tercera hipótesis se pueden resumir diciendo que la matriz de covarianzas del vector de los errores es:
Bajo el supuesto de que las hipótesis de Gauss-Markov se cumplen, es muy sencillo calcular la esperanza matemática y la matriz de covarianzas de otros vectores aleatorios relacionados con .
En efecto, en lo que se refiere al vector aleatorio tenemos que:
pero como es constante tenemos que:
Esta expresión indica que la parte constante del modelo de regresión recoge el comportamiento promedio de la variable aleatoria
y que, por tanto, la diferencia entre este comportamiento promedio y el comportamiento real de la variable se debe a la existencia de otros factores que no se han considerado y que han sido relegados al término de error aleatorio. Es decir:
Por otra parte, respecto a la covarianza de tenemos que:
pero como es constante:
Por lo que respecta al vector -la solución óptima que hemos encontrado para el vector
- resulta que también es un vector aleatorio -ya que depende de
, que es aleatorio-. El cálculo de su esperanza matemática y de su matriz de covarianzas es sencillo.
Respecto a la esperanza matemática de tenemos que:
lo que convierte a en un estimador insesgado de
. El significado de la ausencia de sesgo es sencillo de entender: a pesar de que no siempre
“acertará” con el verdadero -y desconocido- valor de
nos queda el consuelo de saber que “por término medio” acierta a la hora de estimar el verdadero valor de
. Sin embargo, el hecho de que el estimador sea insesgado es un magro consuelo si cuando se “equivoca” el error cometido es muy grande. La medida de la variabilidad del estimador
nos la proporciona su matriz de covarianzas, cuyo cálculo es muy sencillo:
pero como es constante tenemos que:
Además, como la inversa de la traspuesta es igual a la traspuesta de la inversa y, por otra parte, la matriz es simétrica:
El escalar puede desplazarse a voluntad con lo que nos queda que:

El teorema de Gauss-Markov ‹ Análisis y comunicación de datos cuantitativos ha dicho,
29 de 29 de 2008 @ 8:22 am
[...] -un tanto simplificado- y su demostración. Teorema: Sea el modelo teórico de regresión . Si las hipótesis de Gauss-Markov se satisfacen, entonces el estimador de mínimos cuadrados es el mejor estimador lineal insesgado [...]
Acerca de… más información sobre estadistica y R « Acerca de… ha dicho,
2 de 2 de 2008 @ 10:37 am
[...] el modelo teórico de regresión . Si las hipótesis de Gauss-Markov se satisfacen, entonces el estimador de mínimos cuadrados [...]
Una estimación de la varianza de los errores ‹ Análisis y comunicación de datos cuantitativos ha dicho,
3 de 3 de 2008 @ 8:23 am
[...] el post relativo a las hipótesis de Gauss-Markov hemos concluido que la matriz de covarianzas del vector [...]
La distribución de las sumas de cuadrados de residuos ‹ Análisis y comunicación de datos cuantitativos ha dicho,
1 de 1 de 2008 @ 4:05 pm
[...] nueva hipótesis junto con las que anteriormente se han hecho acerca del vector de errores pueden resumirse en la siguiente: El vector de errores aleatorios [...]