La traza del producto de dos matrices

5 de Noviembre de 2008 · Imprimir Imprimir

La matriz H=X (X^t X)^{-1} X^t (hat matrix), cuyo efecto es el de proyectar ortogonalmente el vector de las observaciones de la variable dependiente sobre el espacio generado por las variables explicativas -y la columna de unos-, aparece por doquier en el desarrollo del modelo de regresión lineal múltiple. Como ya se ha comprobado en anteriores posts, la matriz H -y su complementaria, la matriz M=I-H- son simétricas, idempotentes y semidefinidas positivas. En este post, vamos a estudiar la traza de las matrices H y M. Esta traza es especialmente importante ya que las matrices idempotentes cumplen que su traza coincide con su rango (ver teorema 17 de este enlace).

Antes necesitamos demostrar que si A es una matriz de orden (m,n) y B es una matriz de orden (n,m) entonces se cumple que tr(AB)=tr(BA).

En efecto, consideremos el i-ésimo elemento de la diagonal principal de la matriz AB. Para calcularlo debemos multiplicar escalarmente la i-ésima fila de la matriz A por la i-ésima columna de la matriz B. Es decir:

AB_{ii}= \displaystyle \sum_{j=1}^n a_{ij}b_{ji}

Dado que la matriz AB es de orden (m,m) su traza será:

tr(AB) = \displaystyle \sum_{i=1}^m AB_{ii} = \displaystyle \sum_{i=1}^m \displaystyle \sum_{j=1}^n a_{ij}b_{ji}

En cuanto a la matriz BA, el elemento que ocupa la posición j-ésima en su diagonal principal será:

BA_{jj}= \displaystyle \sum_{i=1}^m b_{ji}a_{ij}

Ahora, como la matriz AB es de orden (n,n) su traza es:

tr(BA) = \displaystyle \sum_{j=1}^n BA_{jj} = \displaystyle \sum_{j=1}^n \displaystyle \sum_{i=1}^m b_{ji}a_{ij}

de donde resulta evidente que tr(AB)=tr(BA).

Vamos a aplicar esta propiedad de la traza del producto de matrices al caso de la matriz H. Tenemos que:

H=X(X^t X)^{-1} X^t  =[X(X^t X)^{-1}] [X^t]

Las matrices X(X^t X)^{-1} y X^t son, respectivamente de órdenes (n,k+1) y (k+1,n) por lo que, aplicando la propiedad anterior tendremos que:

tr(H)=tr([X(X^t X)^{-1}] [X^t])=tr([X^t][X(X^t X)^{-1}])=tr(I_{k+1})=k+1

En lo referente a la matriz M = I_{n}-H es evidente que:

tr(M)=tr(I_{n}-H)=tr(I_n)-tr(H)=n-(k+1)=n-k-1

2 comentarios »

  1. Una estimación de la varianza de los errores ‹ Análisis y comunicación de datos cuantitativos ha dicho,

    5 de 5 de 2008 @ 9:24 am

    [...] cuanto a la traza de podemos recurrir al hecho de que dadas dos matrices y de órdenes respectivos (n,p) y (p,n) . Por tanto, tendremos [...]

  2. Otras estimaciones insesgadas de la varianza de los errores ‹ Análisis y comunicación de datos cuantitativos ha dicho,

    20 de 20 de 2008 @ 8:49 am

    [...] por lo que [...]

Deja un comentario