De aplicaciones lineales, proyecciones y proyecciones ortogonales

16 de octubre de 2008 · Imprimir Imprimir

Decir, a bocajarro, que la solución proporcionada por el método de los mínimos cuadrados para el sistema de ecuaciones Y = X \beta + \epsilon es una descomposición de Y en dos sumandos tales que el primero de ellos es la proyección ortogonal del vector Y sobre el subespacio vectorial generado por las columnas de la matriz X y el segundo es el vector diferencia entre Y y la mencionada proyección, si bien es cierto, puede resultar un tanto confuso.

Con este post y el siguiente vamos a tratar de justificar esta afirmación, pero para ello necesitamos refrescar el álgebra lineal que aprendimos en primero de carrera.

Sean R^m y R^n dos espacios vectoriales y f:R^n \rightarrow R^m una aplicación de R^n en R^m. Se dice que dicha aplicación es lineal cuando:

f(a x_1+b x_2) = a f(x_1) + b f (x_2)\forall (x_1,x_2) \in R^n

Dada una aplicación lineal f:R^n \rightarrow R^m existe una matriz A de orden (m,n) asociada a dicha aplicación lineal, en el sentido de que f(x)=Ax \forall x \in R^n y a la inversa, es decir, dada una matriz A de orden (m,n) existe una aplicación lineal f:R^n \rightarrow R^m asociada a ella de manera que f(x)=Ax \forall x \in R^n. En otras palabras, existe una relación biunivoca entre las aplicaciones de R^n en R^m y las matrices de orden (m,n). Se dice, entonces, que A es la matriz asociada a la aplicación lineal f.

Las proyecciones son aplicaciones lineales cuya matriz asociada es idempotente. En otras palabras,  A es la matriz asociada a una proyección si y sólo si A^2=A. Veámoslo con un ejemplo. Supongamos que estamos considerando la aplicación lineal que a cada punto (x,y,z) del espacio R^3 le hace corresponder el punto (x,y,0) del plano (x,y). Es evidente que se trata de una proyección ya que por muchas veces que proyectemos el punto sobre el plano (x,y) no vamos a conseguir cambiar dicha proyección: -por ejemplo, el punto (5,4,1) se convierte, al ser proyectado, en el punto (5,4,0) y éste, por mucho que lo volvamos a proyectar, sigue siendo el punto (5,4,0). Este es el significado del término idempotente: sólo tiene efecto la primera vez.

La matriz asociada a la aplicación lineal de este sencillo ejemplo es, como se comprueba fácilmente:

A=\left( \begin{array}{ccc} 1 \ 0 \ 0 \\ 0 \ 1 \ 0 \\ 0 \ 0 \ 0 \end{array} \right)

y esta matriz verifica que A^2=A por lo que podemos afirmar que se trata de una proyección.

Dada una proyección f:R^n \rightarrow R^m se dice que es una proyección ortogonal si x-f(x) es ortogonal a R^m \forall x \in R^n. Por ejemplo, la proyección de los puntos de R^3 sobre el plano (x,y) es una proyección ortogonal ya que \left( {x,y,z} \right )^t – \left ( {x,y,0} \right ) ^t = \left( {0,0,z} \right)^t es ortogonal a cualquier vector del plano (x,y), que es de la forma (x,y,0). Expresado de otra manera, si una aplicación lineal es una proyección ortogonal, entonces a cada punto del espacio vectorial origen R^n le hace corresponder el punto del espacio vectorial destino R^m que se encuentra más próximo del punto original, haciendo que el módulo del vector x-f(x) sea mínimo.

Un comentario »

  1. De subespacios, subespacios generados, subespacios columna y matrices asociadas a una proyección ortogonal sobre el subespacio columna ‹ Análisis y comunicación de datos cuantitativos ha dicho,

    16 de 16 de 2008 @ 9:28 am

    [...] post continúa con el objetivo de justificar la afirmación realizada al comienzo del anterior. En él se refrescaron los conceptos de aplicación lineal, proyección y proyección ortogonal. [...]

Deja un comentario