Innovación

Big Data como parte del conocimiento

Hay ciertas personas que sienten la obligación de unirse a proyectos de emprendeduría digital. El ingeniero de bases de datos Kurt Bollacker es una de esa clase de personas. Esta vez ha decidido embarcarse en el mercado de bases de datos con Infochimps, una de la compañías más interesantes en la actualidad. Su objetivo es sacar un modelo mixto que ayude al conocimiento.

Infochimps proporciona una infraestructura online para que la gente compre y venda grandes conjuntos de datos, big data. Una de sus jugadas maestras  tuvo relación con una polémica desatada tras colocar 1.000 millones de datos de Twitter a la venta. El departamento jurídico de Twitter rápidamente tomó nota de lo que el mercado fue capaz de ofrecer a sus clientes, pero el pellizco llegó a consumarse  gracias a Infochimps.

Entre los sets más populares de la compañía se encuentra una completa base de datos de la principal liga de baseball norteamericana descargable para las redacciones de medios de comunicación con información colgada desde 1873.

Kurt Bollacker, ingeniero de datos inquieto

La historia de Bollacker se remonta a la universidad de Duke, allí como estudiante ayudó a construir uno de los primeros motores de búsqueda para investigaciones académicas. Su primer prototipo tuvo relación con la subida de archivos en Internet, del que fue el principal ingeniero de un proyecto sustentado por la universidad de biomedicina de Duke. La investigación se centró en una fuerte recopilación de archivística digital.

Su proyecto más ambicioso y conocido fue Metaweb, una web semántica que fue perseguida por buscadores como Google, quien adquirió finalmente esta startup el pasado verano con el fin de integrar hardware con software de un modo inteligente. El propósito era que los buscadores ofrecieran respuestas concretas a un conjunto de enlaces.

Según el doctor Dirk Helbing del instituto federal de tecnología de Suiza, quien está liderando un proyecto por construir el llamado Living Earth Simulator (LES), un gigantesco simulador sobre el rastreo de desastres naturales y problemas sociales, su proyecto consiste en llevar el análisis de los big data a una de sus conclusiones más extremas.

“Muchos de los problemas que tenemos hoy en día – incluyendo la inestabilidad social y económica, las guerras, la propagación de la enfermedad – se relacionan con el comportamiento humano, pero hay al parecer una grave falta de entendimiento sobre cómo la sociedad y el funcionamiento de la economía  lidian con uno de los más acuciantes desafíos científicos de nuestro siglo”.

Metaweb y las bases de datos comunitarias

Metaweb es a día de hoy conocida por ofrecer bases de datos gratuitas. Según su principal creador, Bollacker, la compañía es popularmente descrita como ‘la entidad gráfica de la gente; lugares y objetos construidos por una comunidad que ama los datos abiertos’.

Metaweb fue adquirida este verano por una suma de dinero no revelada hasta el momento. Su tecnología basada en el Freebase se ha volcado finalmente en Google Refine, una herramienta utilizada para optimizar, depurar y limpiar bases de datos.

Al respecto, Bollacker no se hace ilusiones: “No creo que dentro de 20 años Google siga pagando por mantener un freebase en línea como un servicio. Por ello, tengo especial interés en asegurarme de que este conjunto de datos masivos siga con vida y creo que Infochimps tiene parte del modelo que puede ayudar a que esto ocurra. Una de las cosas que he aprendido a lo largo de mi carrera es que un dato que es amado tiende a sobrevivir.

Creo que los datos Freebase no tienen suficiente cariño. Creo que podemos sacar resúmenes de esas bases de datos. Descargan datos regularmente. Vamos a coger partes de esas descargas, a indexarlas mejor, a etiquetarlas mejor y a describirlas mejor”, concluye.

Los datos, el big data, son la parte esencial que la ciencia puede ofrecer para que el ser humano desarrolle completamente su conciencia de existencia. Aprovechar los datos abiertos es parte de ese proceso.

Sobre el autor de este artículo

Redacción TICbeat

Actualidad y análisis en tecnología, tendencias, aplicaciones web, seguridad, educación, social media y las TIC en la empresa.