Sebastian Wernicke: Mentiras, sucias mentiras y estadísticas (sobre TED Talks)


TEDUna experiencia de ingeniería inversa para hacer la mejor (o la peor) TED Talk utilizando las estadíasticas de la propia página de TED y la valoración de los visitantes a la misma.

Se trata de una diversión matemática que nos acerca al mundo de la Big Data del que estuvimos hablando hace unas semanas.

«En un brillante e irónico análisis, Sebastian Wernicke utiliza las herramientas de análisis estadístico con el objetivo de inventar una medida para crear la «TED Talk óptima», basada en las valoraciones de los usuarios. ¿Cómo la valoras? ¿Te deja boquiabierto? ¿Poco convincente? ¿O simplemente graciosa?»

Más sobre Big Data y Salud II


Es impresionante la cantidad de información que existe ahora sobre Big Data en la red. En TED hemos descubierto una sección con 9 charlas TED sobre este tema… Impresionante!

Making sense of too much data

 

Shyam Sankar: The rise of human-computer cooperation

Beth Noveck: Demand a more open-source government

Jamie Heywood: The big idea my brother inspired

John Wilbanks: Let’s pool our medical data

PSPP vs. SPSS


PSPP es una herramienta para el análisis estadístico de muestras de datos que puede leer un fichero de sintaxis y un fichero de datos, analizar los datos, y escribir los resultados en una lista de ficheros o por la salida estándar. El lenguaje aceptado por PSPP es parecido a los aceptados por los productos estadísticos de SPSS. Los detalles del lenguaje de PSPP se proporcionan en el manual de la página web del proyecto. (en inglés)

Entre las principales características de PSPP están la posibilidad de realizar procedimientos estadísticos rápidos, dos modos de uso: en terminal y con interfaz grafica de usuario, soporta más de mil millones de variables, además es compatible con proyectos como Gnumeric y OpenOffice. Por ahora solo esta disponible una versión en inglés, aunque los usuarios acostumbrados a SPSS se podrán adaptar rápidamente.

Detalles