Análisis Tecnología

Mitos y realidad de la búsqueda semántica

Fotografia - El Pensador de RodinYa llevamos unos años hablando sobre búsqueda semántica. Cualquier tecnología que tenga la ocasión de derrocar a Google nos interesa mucho a todos, especialmente si aprovecha las esperadas y cacareadas tecnologías semánticas. Sin embargo, por mucho progreso que se haga, a la mayoría aún no nos impresionan demasiado los resultados. En una comparación mano a mano con Google, los resultados no muestran mucha diferencia. ¿Qué estamos haciendo mal?

Por ejemplo, cuando preguntamos cuál es la capital de Francia, ambos métodos nos devuelven la misma respuesta: París. Además, muchas de las consultas que solíamos introducir en Google de forma abreviada nos ofrecen resultados similares si las introducimos usando lenguaje natural. Está claro que algo no funciona. Todos sabemos que la tecnología semántica es potente, pero ¿cómo y por qué? En este artículo vamos a demostrar que el problema es que no hacemos las preguntas correctas.

El error es que los buscadores semánticos nos presentan una caja de búsqueda similar a la de Google y nos permiten hacer consultas con el formato que queramos. Por eso introducimos lo que estamos acostumbrados a preguntar: consultas primitivas. Nunca se nos ocurre introducir “¿Qué actor fue protagonista de Pulp Fiction y Fiebre del sábado noche?“, o “¿Qué dos senadores estadounidenses han recibido donaciones de una entidad extranjera?“. Introducimos preguntas simples, pero no es ahí donde radica el poder de la búsqueda semántica. Examinemos todo el espectro de tecnologías semánticas, de Google y SearchMonkey a Powerset y Freebase para comprender qué sucede.

¿Qué problema estamos intentando resolver?

La primera confusión en este espacio se debe al hecho de que la búsqueda semántica se está posicionando como respuesta a todos los problemas posibles, desde la búsqueda moderna, dominada actualmente por Google, a problemas que resultan imposibles desde un punto de vista computacional. La situación se complica más debido al hecho de que ahora mismo sólo hay un conjunto muy pequeño de problemas que la búsqueda semántica puede resolver más eficazmente. Se trata de consultas complejas que necesitan deducción y razonamiento sobre un conjunto de datos complejo.

Como sabemos, Google funciona bien con consultas básicas. Desgraciadamente, el procesamiento de lenguaje natural no nos ofrece muchas ventajas cuando se trata de esta categoría de problemas. Google responde correctamente si le preguntamos la fecha de nacimiento de Leonardo Da Vinci, sin darnos ocasión a mejorar la búsqueda comprendiendo los nombres y verbos que hemos introducido.

Antes de examinar los problemas que resultan perfectos para búsqueda semántica, vamos a examinar los más complejos. Se trata de problemas que suponen un reto computacional y realmente no tienen nada que ver con comprender la semántica. Desde los comienzos de la Web semántica se ha perpetuado la idea errónea de que, de algún modo, anotando la red seremos capaces de resolver estos problemas de gran complejidad.  Esto simplemente no es así. Existen unos límites fundamentales dentro de lo que podemos computar, y una clase de problemas con un número exponencial de soluciones posibles no se va a resolver mágicamente porque representemos los datos como RDF.

Lo bueno es que hay un conjunto de problemas que resultan perfectos para la búsqueda semántica. Se trata de los problemas que hemos intentado resolver de forma tan fabulosa con una base de datos relacional. Con demasiada frecuencia olvidamos que las tecnologías semánticas están aquí para ayudarnos a representar datos relacionales repartidos por toda la red, por lo que no debería sorprendernos que las consultas relacionales sean las que den mejores resultados con buscadores semánticos.

El espectro de buscadores semánticos

Sin embargo, la búsqueda semántica no se basa sólo en las preguntas que hacemos. Como la red no es más que un conjunto de páginas HTML sin estructura, la búsqueda semántica también tiene que ver con los datos subyacentes. En el extremo más estructurado tenemos a Freebase, la base de datos semántica de todo. Freebase es accesible mediante texto libre, pero más notablemente mediante MQL (“lenguaje de consultas metaweb”). MQL es básicamente JSON con comodines. Mediante él podemos crear cualquier consulta en Freebase, y el resultado será la misma consulta incluyendo las respuestas.

Grafica comparativa de buscadores

Powerset, en cierto sentido, no es más que una base de datos relacional. Funciona comparando contra información determinada y estructurada. En el otro lado del espectro se encuentra Google, que se basa totalmente en frecuencias estadísticas y muy poca semántica. SearchMonkey de Yahoo! es una variante interesante. No añade nada al conjunto de resultados, sino que usa las anotaciones semánticas para presentar una interfaz de usuario más rica, interactiva y útil.

Empresas como Hakia y Powerset son las que probablemente estén realizando una labor más exhaustiva. Estas empresas intentan crear simultáneamente estructuras similares a Freebase improvisadas y después realizar consultas en lenguaje natural sobre ellas. La diferencia es que Hakia usa tecnología probablemente similar para hacer consultas en toda la red, mientras que Powerset ha escogido, probablemente con mucha astucia, restringir la búsqueda a Wikipedia.

¿Son tan diferentes Hakia, Powerset y Freebase?

Fotografia - Estudiantes universitariasEste análisis nos plantea una duda: ¿cuáles de estas tecnologías es diferente y cuáles son básicamente iguales? Vamos primero a lo sencillo. SearchMonkey de Yahoo! no es diferente de Google ni de ningún otro buscador en lo que respecta a su tecnología básica de búsqueda. La única diferencia está en la capa de presentación. SearchMonkey tiene un modo inteligente de crear una experiencia de usuario mejor al permitir a los publicadores presentar los resultados de búsqueda a los usuarios del mejor modo posible.

Sin embargo, en el caso de Hakia, Powerset y Freebase, la situación es mucho más complicada. En apariencia, todos estos productos son distintos: Hakia nos permite buscar en toda la red, Powerset está restringido a Wikipedia (y Freebase) y el propio Freebase tiene dos interfaces de búsqueda: la caja de búsquedas y el lenguaje de consultas. Aquí radica el problema: la interfaz de lenguaje natural no tiene nada que ver con la representación de los datos subyacentes.

El hecho es que todas estas tecnologías de búsqueda semántica permiten al usuario introducir preguntas complejas arbitrariamente y después interpretar estas consultas y ejecutarlas contra sus bases de datos. Básicamente, Hakia, Powerset y Freebase son bases de datos. Básicamente, todos ellos cuentan con algún tipo de procesamiento de lenguaje natural que traduce la pregunta a una consulta canónica en base de datos.

Para ver todo esto más claro, pensemos en Freebase y su lenguaje de consultas MQL. A diferencia del lenguaje natural, que admite toda clase de constructos, MQL no admite ambigüedad. Este lenguaje similar a JSON permite a los usuarios construir afirmaciones precisas y compararlas contra Freebase. El hecho de que Powerset admita consultas en lenguaje natural no significa que no contenga una base de datos. No cabe duda de que hay un tipo de base de datos similar como la que hay bajo la caja de búsquedas de Freebase. Lo que diferencia realmente a Freebase y Powerset es el método de recopilación de datos y la experiencia de usuario.

Regreso al futuro: lo importante es la interfaz de usuario

Pantalla de busqueda semanticaLa revelación más sorprendente sobre el sector de búsqueda semántica probablemente sea la interfaz de usuario. En primer lugar, Powerset lo hizo bien al darse cuenta de que la semántica debía verse reflejada en la interfaz. Cuando un usuario busca en Powerset, un gadget contextual consciente de la semántica de los resultados ayuda a éste a completar la experiencia de búsqueda.

Sin embargo, el mayor error que creemos que ha cometido Powerset también tiene que ver con la interfaz de usuario. La caja de búsqueda con la que todos estamos familiarizados por los buscadores tradicionales tiene que desaparecer. El tener una interfaz de búsqueda simple perjudica a Powerset y Hakia, y en menor medida a Freebase, que no se está posicionando como buscador genérico.

Es lo que sucedió con el lanzamiento de Powerset. La empresa lanzó un modo infinitamente mejor de interactuar con una de las fuentes de datos más importantes de la red: Wikipedia. Pero, ¿qué dijeron los críticos? Veamos si esto es el nuevo Google. Y la respuesta fue “no“.

Pero, ¿y si Powerset hubiese restringido las posibilidades de búsqueda? ¿Y si en lugar de una caja de búsquedas hubiese otra interfaz, o si dijesen a los usuarios que no buscasen información que pueden encontrar fácilmente en Google? ¿Por qué esperan las nuevas empresas mejorar el algoritmo que lleva dominando la red más de una década? En lugar de esto, deberían crear expectación resolviendo los problemas que se le resisten Google en la actualidad.
Conclusión

La búsqueda semántica es una tecnología en desarrollo que ha creado demasiadas expectativas. Todos hemos pensado erróneamente que estas tecnologías han venido a derrocar a Google ofreciendo mejores resultados de búsqueda. Nada de esto es cierto. Lo que sí es cierto, sin embargo, es que la búsqueda semántica va a ser algo grande y que va a ayudarnos a responder a preguntas que simplemente no podemos responder hoy: consultas complejas y deductivas hechas en toda la red como si de una base de datos se tratase.

Para que estas tecnologías de búsqueda semántica tengan repercusión en el mercado, es necesario que aclaren sus mensajes y, sobre todo, sus interfaces de usuario. Presentar una caja de búsquedas resulta engañoso y contraproducente, ya que los usuarios la asocian con las preguntas sencillas que Google resuelve sin problemas. Para realmente mostrar lo que es la búsqueda semántica, estas empresas tienen que crear interfaces de usuario innovadoras que ayuden al público a comprender la potencia tiene a su disposición.

Publicado originalmente en mayo de 2008

Sobre el autor de este artículo

Alex Iskold