Distribución log-normal
Imprimir
Llevo un par de días leyendo el interesante libro de Rein Taagepera de título Making Social Sciences More Scientific. La aportación fundamental del autor consiste en una comparación entre las formas de trabajo predominates en los ámbitos de las ciencias naturales y las ciencias sociales. Afirma Taagepera que las ciencias sociales son “menos ciencias” que las naturales y que, quizás, la aplicación de los métodos empleados en estas últimas podría mejorar los resultados y la imagen social de aquéllas.
Entre otras cosas, el autor critica la omnipresencia en las ciencias sociales de la distribución normal -y de la media aritmética-. En su opinión, en muchas ocasiones es una mejor opción la distribución log-normal y la media geométrica. El autor nos proporciona unos consejos prácticos para seleccionar la media que mejor se adapta a los datos de que disponemos. Cito:
Geometric means often express the central tendency better than arithmetic means. For the same reason, lognormal data fits often are called for, instead of desperate attempts to fit data into a Procrustean normal distribution. The following advice applies, with some reservations.
- In the absence of any other information, if a variable can range from minus to plus infinity, a normal distribution is our best bet, implying that the arithmetic mean is close to the median. (In the presence of further information, the bet may be off.)
- In the absence of any other information, if a variable can have only positive values, a lognormal distribution is among our best bets, implying that the geometric mean is close to the median. (In the presence of further information, the bet may be off-we may have a gamma distribution or something else.)
- However, if one tries a normal fit and standard deviation turns out less than one-half of the mean, then one might use this normal distribution. If standard deviation exceeds one-half of the mean, the normal fit should be abandoned in favor of lognormal.
- If negative values are conceptually excluded but zero values do ocurr, then neither distribution can fit. Neither mean adequately reflects the median, but a pseudo-geometric mean might approximate it.
- When there are grounds to hesitate between the arithmetic and geometric means, using the median might be the safest way, although it is awkward to calculte.
A este respecto resulta muy interesante el artículo de Limpert et al. (2001) de título Lognormal Distributions across the Sciences: Keys and Clues.
