Tarde, pero aquí están los reyes magos

Y traen mirra (libros gratis), incienso (cursos gratis) y oro (un estilo de vida). Este post continua el espíritu de celebración del año internacional de la estadística. Como diría el profesor Garicano: “los tres fundamentos claves necesarios para salir adelante en la economía de conocimiento son: un nivel avanzado de confianza en el uso de las matemáticas y la estadística; una capacidad elevada para escribir un argumento, no solo correcto gramaticalmente, sino razonado con claridad y convicción; y un nivel avanzado de inglés” (por cierto la historia de Nate Silver a la que se refiere la cuenta el propio Nate en un bestseller internacional que es muy recomendable para aprender a pensar como un analista de datos, una buena revisión aqui).

Primero los libros gratis. Son de nivel avanzado, pero de muy buena calidad en cada uno de sus campos:

“Networks, crowds and markets” de David Easley y Jon Kleinberg que os será de gran utilidad a quienes penséis en términos de redes sociales. El análisis de redes sociales se ha convertido en una de las técnicas más de moda fuera y dentro de la criminología. Cada vez se presentan más artículos y ponencias en congresos científicos de criminología empleando este tipo de enfoques. Este libro es un excelente tratado sobre el tema.

“The Elements of Statistical Learning: Data Mining, Inference, and Prediction” de Trevor Hastie, Robert Tibshirani, y Jerome Friedman. Este es menos especializado que el anterior, pero de un nivel más avanzado. Hay quien lo considera una especie de biblia y en el link encontrareis los programas empleados en los ejemplos (todos usando R). Os vendrá bien a quienes ya tengáis nociones básicas de regresión y modelos generales lineares. El mundo no se acaba ahí. En criminología la idea de “machine learning” (neural networls, generalised boosted regression, random forest, etc) todavía no se ha desarrollado mucho. Le damos mucho bombo a otro tipo de técnicas también sofisticadas como análisis multinivel o modelos de variables latentes. Sin embargo, el mundo de “data mining” puede dar lugar a aplicaciones de gran utilidad y es un terreno relativamente virgen. El director en funciones de NIJ, por ejemplo, ha jugado un papel clave en el uso de generalised boosted regression para poder identificar efectos causales en estudios observacionales (un ejemplo aquí). Esta semana me la he pasado usando su paquete twang en R, que implementa este enfoque, para estimar el efecto causal de pertenecer a bandas en varios dominios. Mientras que Richard Berk, otro monstruo, ha sido un pionero en el uso de random forests y técnicas similares para mejorar la capacidad predictiva de los instrumentos que emplean los operarios del sistema de justicia penal a la hora de diagnosticar peligrosidad (ver por ejemplo aquí).

Segundo, los cursos gratis. Ya he mencionado varias veces a los massive online open courses. Simplemente recordaros que están a punto de empezar los de este semestre. En Coursera  Roger Peng “Computing for Data Analysis”(una introducción a R en cuatro semanas empezó la semana pasada), mientras que el muy apetecible “Data Analysis” de Jeff Leek, empieza en 10 días. Ambos cursos requieren haber tomado al menos un curso de introducción a la estadística y ambos, como es habitual estos días, usan R. El curso de Jeff tiene muy buena pinta y es eminentemente moderno en su enfoque, parece que hablara de “reproducibility” (como hacer análisis para que otros puedan repetirlo) y simulación (como una forma de chequear nuestros resultados). Si estáis empezando en esto, el curso “en Stanford” de Sebastian Thrun, todo un genio que ha llegado muy lejos, se puede tomar en cualquier momento, y el 30 de enero empieza en edX una introducción muy básica a la estadística ofrecida por Berkeley University. ¡Ya podréis fardar luego de haber estudiado allí!

Y, last but not least, el oro: un estilo de vida. En estos días en los que uno se puede sentir particularmente cabreado con el top 2% y con muy buenas razones, pues uno se puede sentir particularmente inclinado para, como dicen en Inglaterra,  “to give two fingers” “to the man”. A mi particularmente me cabrea de qué forma están socavando el internet por razones puramente económicas y están produciendo algo que no es lo que teníamos. Simplemente nos quieren poseer. ¿Paranoia? Este es un buen estudio sobre el modelo comercial de Apple que quizás os puede persuadir a quienes todavía penséis que es cool ser un Mac. En fin, que es hora de pensar en alternativas. Y aquí es donde entra el maravilloso mundo open code que todavía nos ofrece lo mejor del proyecto de solidaridad, participación, y de compartir que soñábamos en los días iniciales del internet. ¿A qué viene todo este rollo? En fin que existe una alternativa al uso de las herramientas tecnológicas comerciales que empleamos para el análisis de datos y su publicación (en ponencias, artículos, blogs, etc). Muchas de estas alternativas (Vim en vez de otros editores de texto, Beamer en vez de power point, R en vez de cualquier programa de análisis de datos, etc.) de hecho son mucho más flexibles y potentes que los productos comerciales que nos venden, y de hecho incluso hay quien piensa que el conocimiento y manejo de las mismas es un buen indicio en tu currículo o cuanto menos manda una señal sobre qué tipo de científico eres. Jeromy Anglim, un psicólogo australiano, tiene en su blog numerosas entradas discutiendo el uso de este tipo de herramientas. Aquí os dejo una buena entrada en su blog que comienza a contar su transición, como científico social cuantitativo, a Ubuntu, una de las distribuciones de Linux más populares (¿por qué pagar por tu sistema operativo cuando tienes la excelente calidad de Linux?). Su blog está lleno de consejos prácticos  y recursos para facilitar la transición. ¿O queréis ser esclavos de Microsoft y Apple toda vuestra vida? La transición requiere esfuerzo, es un cambio fundamental y radical, pero todo lo que merece la pena en esta vida es así.

PS: Os prometo volver a un tema más sustantivo en mi próxima entrada: el futuro de la probación en Inglaterra y Gales.

Advertisements

2 thoughts on “Tarde, pero aquí están los reyes magos

  1. muchas gracias por los regalos juanjo!
    ya me he inscrito en estadísticas de edX! para comenzar de a poco…

    saludos y buen año

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s