Mapas de las regiones españolas

10 de marzo de 2009

En la actualidad me encuentro embarcado en la elaboración de una serie de artículos relacionados con la obtención de tipologías para las regiones de España. Además del archiconocido dendrograma se nos ha ocurrido que podríamos emplear mapas de los de toda la vida para representar los grupos que surgen de la tipología de regiones -por ejemplo, pintando las regiones que conforman el mismo grupo del mismo color-. Tras mucho buscar he encontrado una página del INE de la que se pueden descargar mapas en formato shp de las regiones y provincias españolas.

No hace falta decir que R puede leer este formato de datos. El package que se debe emplear es shapefiles.

El lamento de un matemático

10 de marzo de 2009

Lockhart ha dado en el clavo con este breve texto acerca de la situación de las matemáticas en nuestra cultura. ¿Qué hemos hecho? ¿Tiene remedio aún?

Curso de introducción a R

8 de febrero de 2009

Durante el mes de enero y la primera quincena de febrero he estado impartiendo un curso de 12 horas con el  título Introducción a R para los investigadores del Instituto Vasco de Competitividad de la Universidad de Deusto.

Dejo aquí las transparencias que he empleado por si resultan de utilidad a alguien. Os agradecería que, si encontráis errores -de bulto o no tanto- me informarais de ellos.

(Si alguien quiere el archivo de Lyx con el que he generado el pdf no tiene más que pedirlo).

Un truco para importar datos de Excel a R

2 de febrero de 2009

En ocasiones necesitamos analizar con R unos datos que nos llegan en formato de Libro de Excel. La opción más recomendable es guardar los datos en formato CSV e importarlos desde este formato.

No obstante, si la importación tiene carácter puntual, puede resultar útil el siguiente modo de proceder:

  • Modificar la configuración internacional en Excel -en Excel 2003, Herramientas/Opciones/Internacional-, de manera que el separador decimal sea el punto y no la coma.
  • Seleccionar el rango en el que se encuentran los datos -incluida la cabecera con los nombres de variables-
  • Copiar el rango al portapapeles -Ctrl-C o Edición/Copiar-
  • Desde R, ejecutar el siguiente comando:
 datos<-read.delim("clipboard")

El resultado es un dataframe de nombre datos.

Índice de libertad económica

20 de enero de 2009

La Heritage Foundation acaba de publicar el informe sobre el índice de libertad económica correspondiente al año 2009. También proporciona un link desde el que se puede acceder a los datos.

Un sencillo análisis de componentes principales -realizado con R y con el package FactoMineR- lleva a una conclusión curiosa: la libertad fiscal y el tamaño del sector público no están relacionados con el grado de libertad económica, financiera, laboral, derechos sobre la propiedad privada ni el grado de corrupción. Es lo que se deduce de la posición de las variables en el siguiente gráfico -que recoge aproximadamente un 69% de la variabilidad total de los datos-:

varindexeconomicfreedom

  • El primer componente principal -representado en horizontal- es un índice de la libertad económica, excepción hecha de la libertad fiscal. Los países con coordenadas positivas y elevadas en este primer componente disfrutan, en general, de un amplio grado de libertad económica; justo lo contrario es lo que ocurre con los países que presentan coordenadas negativas en este primer eje.
  • En lo que se refiere al segundo componente principal -en vertical- se trata de un indicador de la libertad fiscal y del tamaño del sector público. Los países con coordenadas positivas tienen una elevada libertad fiscal y un reducido sector público, a diferencia de los países con coordenadas negativas, que presentan escasa libertad fiscal y un sector público muy amplio.

Aquí se proporciona la definición exacta de cada una de estas “libertades”

En el siguiente gráfico se muestra la posición de los 183 países para los que existen datos en el plano formado por los dos primeros componentes principales tras haber efectuado una clasificación automática con el método de clasificación jerárquica ascendente con salto máximo y un corte del dendrograma en seis grupos:

indblog