Friday, December 19, 2008

Data Miners saben mas de ti de lo que te imaginas

Donde sea que vayamos dejamos huellas electronicas de nuestro paso, ya sea si compramos online o en una tienda con tarjeta de credito o debito, en el trabajo y tambien cuando salimos de paseo. Toda esta informacion es la materia prima para una nueva industria, en la cual los "Data Miners" manejan todos estos numeros para tratar de explicar e influenciar el comportamiento humano, si, el de ellos, el tuyo y el mio tambien.

Asi, las enormes bases de datos contienen mas informacion acerca de ti de lo que te imaginas. Ya en el 2006 la Carnegie Mellon University presento un estudio donde con solo saber tu genero, dia de nacimiento y codigo postal, se puede saber tu nombre con un 87% de certeza entre toda la poblacion de USA; la investigadora fue PhD Latanya Sweeney. Por otro lado, cualquier pagina web puede coleccionar inmensas cantidades de informacion de sus visitantes, por ejemplo, registran cada click, lo que compras, cuanto gastas, que anuncios vemos, incluso aquellos por los que paseas el mouse sin necesidad de hacer click. Algunos sites incluso pueden accesar toda la historia de tu web browser, con lo cual pueden inferir cual es tu genero y otro tipo de informacion demografica.



El negocio de recolectar y analizar esta "data" es cuantioso. No por nada la firma Acxiom mantiene informacion del estilo de vida y compras de unos 200 millones de personas en USA. Ellos saben cuanto pagas por la hipoteca de tu casa, a que revistas estas suscrito, que libros compras y que vacaciones tomas. Esta empresa compra casi cualquie bit de informacion sobre nosotros, y luego vende "selecciones" de esta a "cualquiera" que desee contactarnos con propaganda de productos y hasta de campañas politicas.

Y no creas que se detienen ahi, estan siempre en la busqueda de nuevas formas de extraer informacion de las personas. Por ejemplo, la empresa Umbria emplea software para analizar millones de blogs y forums cada dia; empleando analisis de estructuras para oraciones, seleccion de palabras y puntuaciones particulares pueden determinar el genero del blogger, sus intereses en su rango de edad y su opinion con respecto a estos. Esta informacion puede ser una herramienta valiosa para empresas que lanzan nuevos productos o politicos a la caza de mas votos.



No creas que la historia termina aqui, ya algunas empresas estan usando esta informacion para ver como se comportan sus empleados, obviamente los organismos gubernamentales de USA los emplean para encontrar terroristas y criminales en general... y pensar que todo practicamente empezo en Las Vegas con NORA. Si te interesa saber mas de esto puedes leer la nota original de NewScientist que dio pie a este post aqui, el libro The Numerati de Stephen Baker y algun buen libro con algoritmos para Data Mining si quieres empezar a crear software para esta industria. Pero cuidado, nunca sabes quien te esta rastreando en esta era digital.

Gracias por leer.

No comments:

Post a Comment