jueves, 9 de diciembre de 2010

Minería de Datos y Estadística Sexy

Imagen de www.dataspora.com
Me llama la atención el uso una vez más del calificativo sexy para referirse a la estadística, por eso comparto la entrada de un blog que acabo de conocer y es muy interesante:

The three sexy skills of data geeks

Está escrito por Michael E. Driscoll en Dataspora Blog, sobre "Big Data, open source analytics, and data visualization".


Resumiendo, las cualidades sexy son:
  1. Aprender estadística
  2. Sufrir el Data Munging (sic)
  3. Contárselo a alguien (visualización)
Termina diciendo que con las tres cualidades juntas, somos sexy.

En esta entrada y en otra de Barrapunto he visto también enlaces a tres libros sobre sobre Data Mining disponibles para descargar, y que reproduzco aquí:

Por cierto no busquéis munging en los diccionarios, que no está. Yo lo traduciría libremente como Masticar los datos, y hay varias referencias por ahí:
  • Hay un libro de Manning titulado "Data Munging with Perl", donde dice que " 'munging' is a common term in the programmer's world. Many computing tasks require taking data from one computer system, manipulating it in some way, and passing it to another. Munging can mean manipulating raw data to achieve a final form. It can mean parsing or filtering data, or the many steps required for data recognition"
  • En el propio artículo de Driscoll, dice que " this refers to the painful process of cleaning, parsing, and proofing one’s data before it’s suitable for analysis"