Big Data

XRay intenta descifrar el modelo que hay detrás del ‘targeting’ de anuncios

privatedata
Escrito por Mihaela Marín

Un grupo de investigadores intenta ayudar a los usuarios a entender cómo las grandes compañías como Google o Amazon utilizan sus datos privados.

Una recomendación online de un producto o servicio justo en el momento en el que el usuario lo necesita es más que una pura coincidencia. Cualquier información que queda registrada en algún formulario, correo electrónico o compra en Internet se añade a la gran base de datos que representa la identidad digital de cualquier usuario que luego servirá para que las empresas enfoquen mejor sus estrategias de marketing.

Se trata de una práctica que caracteriza la actividad comercial de muchas de las compañías que promocionan sus servicios en Internet, entre las más importantes Facebook, Amazon o Google. Las búsquedas online dejan indicios sobre las preferencias de los usuarios y las compañías aprovechan esta información para vender más.

¿Podemos considerar entonces este tipo de actividades honestas con el usuario? En la opinión de los científicos en computación de la Universidad de Columbia el mayor problema es la falta de transparencia:

La web es una caja negra: utiliza nuestra información personal sin nuestro conocimiento y control”, declara Roxana Geambasu, profesor asistente de informática.

Junto con Augustin Chaintreau, otro profesor asistente en la Universidad de Colombia, y un equipo de estudiantes de postgrado dirigido por Mathias Lecuyer han propuesto una herramienta que aborda el reto de la transparencia de datos. Se llama XRay (radiografía en inglés), y se ha descrito en un documento junto con los resultados de investigación en el Simposio de Seguridad Usenix que tuvo ayer en San Diego.

El prototipo consiste en una máquina de ingeniería inversa que modela las correlaciones realizadas por los servicios web. Los esfuerzos iniciales del grupo han tratado de determinar los tipos de anuncios que se muestran a los usuarios de Gmail basándose en el texto de sus mensajes de correo electrónico, las recomendaciones de productos que Amazon muestra a los usuarios en base a sus listas de deseos y las recomendaciones de vídeo que propone YouTube en función de los vídeos que el usuario ha visto previamente.

Para realizar el experimento los investigadores crearon cuentas y un historial de mensajes de correo electrónico, búsquedas y productos vistos. Luego observaron los anuncios y recomendaciones de productos o vídeos generados por la web como respuesta a la información introducida. A partir de los datos obtenidos han modelado correlaciones entre los estímulos y las respuestas recibidas de manera que XRay pueda  predecir y analizar “los resultados de la orientación contextual y conductual de los servicios web”.

Los desarrolladores apuntan que XRay informa de la correlación entre los correos electrónicos y anuncios, pero no puede revelar la causalidad. El hecho de que un anuncio en particular se relacione con un correo electrónico no significa que este sea el único factor que determine la correlación sino que hay otros aspectos como los algoritmos propios de Gmail para la colocación de anuncios que pueden influenciar en la creación del vínculo. Por lo tanto, no se puede decir “el anuncio X tiene como target el tema Y,” sino que “el anuncio X se correlaciona fuertemente con el tema Y”.

En el paper publicado como consecuencia de la investigación, el equipo deja entrever cuál va a ser la forma final de la herramienta: un plugin para Gmail que anotará en los anuncios de la interfaz de usuario el correo electrónico o combinación de correos que los han generado.

Según el estudio hay tres formas de targeting:

  • Targeting del perfil: aprovecha la información explícita estática o de lenta evolución – tales como la edad, el género, la raza o la ubicación – que el usuario a menudo suministra llenando un formulario
  • Targeting contextual:  aprovecha el contenido que se muestra en ese momento; en Gmail  es el anuncio que se muestra cuando tenemos el correo abierto mientras que en Amazon o Youtube el objetivo es el producto o el vídeo junto a los que se muestra la recomendación
  • Targeting de comportamiento: aprovecha las acciones del pasado de un usuario; un correo electrónico enviado o recibido hoy disparará un anuncio mañana; un video visto ahora puede activar una recomendación más tarde

El software XRay se dará a conocer bajo una licencia de código abierto que permitirá a los programadores utilizar y modificar el código si lo consideran conveniente para cualquier propósito no comercial. Los investigadores dejan claro que los datos presentados en este momento son a pequeña escala ya que hay un seguimiento de sólo veinte temas. Tienen la intención de aumentar ese número de manera significativa en el futuro próximo para rastrear cientos de temas, pero de momento sugieren utilizar los datos únicamente para crear una visión general y no reclamar conclusiones definitivas.

Imagen principal

Sobre el autor de este artículo

Mihaela Marín

Mi interés por la tecnología ha nacido cuando me he dado cuenta de que nos permite ver el lado escondido de la realidad. Todavía quedan muchas cosas por descubrir y suficiente curiosidad para entender lo que realmente somos. Especializada en Periodismo y Marketing, he podido compartir experiencias con profesionales del mundo empresarial tecnológico. Siempre en búsqueda de ideas, escribo para hacer conocido el trabajo innovador, capaz de cambiar los problemas en soluciones.