23 junio 2012

Los Numerati: Lo saben todo sobre tí - Stephen Baker


La verdad es que cuando mi buen amigo Álvaro Andrade y su encantadora pareja me regalaron este libro me imaginé que llevaría dentro una historia relacionada con una secta con extrañas habilidades. Lo que me encontré realmente en él, son varios casos en los que el autor describe a los Numerati, auténticos gurús de la estadística y que, en base a muy inteligentes algoritmos y recursos hardware con brutales capacidades de cómputo, son capaces de clasificar los hábitos de las personas, invadiendo, de forma velada, la privacidad de las mismas.

Fundamentalmente, se basa en la transformación de datos de diversa índole en números, de manera que sean aprovechables para otros fines. Ya lo decía Simeón, mi profesor de estadística en la Universidad, que lo importante de la informática es mecanizar la estadística así que "menos mariconeo de pantalla" que sólo es "trabajo de secretaria".

El libro ofrece casos como el diseño de un supermercado y cómo se puede "forzar" o "encaminar" a un usuario a comprar lo que ellos quieran. ¿Cómo? Muy fácil, mediante la identificación y clasificación de los individuos.

- Pero, si yo no les doy mis datos a los del supermercado.
- Claro que se los das. ¿Te acuerdas de la tarjeta de fidelidad que pasas cada vez que compras?

Cada vez que presentamos la tarjeta de fidelidad vendemos nuestros hábitos de compra a cambio de un descuento de 1 euro o de unos vales para yogures en la siguiente compra. A los centros comerciales les viene de perlas saber cuántas personas varones de entre 25 y 30 años compran, por ejemplo cervezas, refrescos, pizzas, salchichas, hamburguesas… Podrá correlar con la información de cuando rellenó la tarjeta, que el individuo es soltero y que es amante de la comida basura. Si sólo se observan verduras y frutas en su dieta o alimentos sin gluten, se podría intuir que se trata de un vegetariano o de un celíaco. En este caso parece obvio, pero partiendo de datos más complejos y una buena metodología de análisis, habrá ejemplos mucho más elaborados, que seguro que ayudarán a enviar campañas de publicidad dirigidas (como si de un ataque APT se tratara) para hacernos creer que nos llevamos un chollazo de oferta, cuando realmente se aprovecha una vulnerabilidad del instinto humano: el consumismo.

Y tú ¿aún compras lo que necesitas o lo que subliminalmente te venden?

En el mundo online, se lleva viendo esto durante años. Adsense de Google, anuncios en Facebook, etc, etc,… basados en tus búsquedas anteriores, cookies, datos de navegación, incluso se ha dado el caso de líneas aéreas que suben el precio de los billetes precisamente en base a estos datos de su navegación previa en busca de tickets.

Estaba leyéndome este libro cuando llegó a mí un enlace, no sé si a través de Twitter o vía RSS en el que se dice que precisamente Twitter compra la empresa de análisis estadísticos hotspots.io. ¿La finalidad? Pues supongo que es la misma que teníamos Yago y yo, hace años, cuando pensamos en desarrollar un análisis de marcas a través de Internet, de manera que se pudiese obtener métricas para conocer el éxito o fracaso de campañas electorales o de publicidad, por ejemplo, mediante las APIs de Google y Yahoo (por aquellos entonces la ballena de Twitter era aún una sardina).

Por otro lado, el libro habla también de ejemplos en los que el convertir los datos de las personas en números, en tendencias, en modelos estadísticos de comportamiento, sirven (o pueden servir) para buenos fines, como la prevención de determinadas enfermedades como el parkinson, monitorización de constantes vitales de ancianos o personas enfermas en sus casas, un mayor número de datos para ayudar a un médico a evaluar un diagnóstico, etc… no siempre siendo necesario introducir nano-robots dentro del torrente sanguíneo de los ancianos o enfermos. Sin embargo, en este punto, surge la palabra: seguridad. ¿Qué medidas habrá que tomar para evitar alteraciones o compromisos de los datos recopilados por diferentes elementos? ¿Cómo se puede garantizar la privacidad de los datos médicos (que, en España, la LOPD clasifica como de nivel alto) de los pacientes?

Otros buenos ejemplos que aparecen en el libro podría ser la anticipación de cuerpos y fuerzas de seguridad del estado para bloquear un ataque terrorista inminente, medios que permitan monitorizar el paradero de según qué individuos clasificados como "de alto peligro" según pasan por diferentes lugares, identificados mediante reconocimiento facial, muy al estilo de la serie "Person Of Interest" que ya comentamos en SbD tiempo atrás.

En resumen, el libro es entretenido y te hace pensar. Si esperáis una narración en formato novela, con personajes que tienen un principio, una historia y un final,... no es lo que encontraréis en esta obra.

5 comments :

MrsVader dijo...

Gracias por abrirme los ojos. Tantos años pensando que Simeon era un capullo y que no entendía nuestros "mariconeos de pantalla" y resulta que simplemente no sabía hacernos comprender a la mayoría la conexión entre Estadística e Informática.

Román Ramírez dijo...

Lo importante tras esas predicciones estadísticas es cuando compartes los datos de forma cruzada (cross-marketing). Así Amazon comparte datos con un sexshop, con Google y con tu proveedor de Internet.

Ejemplo, Lorenzo ha comprado un libro sobre "cómo atar jovencitas" en Amazon, ha buscado en google "cuerdas y esposas" y ha navegado una serie de webs con temático de cuero y vinilo. La conclusión es obvia: Lorenzo es votante del PSOE.

A mí eso es lo que me aterra (no que seas votante del PSOE, eso me entristece simplemente :DD), que se pongan de acuerdo e incorporen a los tarados de los políticos que esgrimen "nuestra seguridad y la de nuestros hijos" para poder acumular todos esos datos.

Lorenzo_Martinez dijo...

No sé qué me preocupa más Román: Que tengas troyanizado mi ordenador, que desviases la mirada cuando nos cruzamos en el sexshop (igual es porque la sección en la que se te veía tan interesado querías que quedase para tu intimidad), o que hayas visto mi papeleta en las últimas elecciones generales.... xDDD

Luis Alexander Zelada Medina dijo...

ya había escuchado sobre este libro, pero olvide su nombre y claro que la estadística automatizada y un buen analisis puede predecir hasta la caida de la bolsa.
saludos

He. dijo...

Hari Seldon está más cerca de lo que parece.