Innovación Startups

Estas son las 8 tecnologías de lenguaje natural más innovadoras de España

lenguaje-programacion

Os mostramos los proyectos finalistas del I Hackathon de Tecnologías del Lenguaje, que se celebrará la próxima semana en el 4YFN de Barcelona.

El procesamiento del lenguaje natural o la traducción automática son dos de las tendencias más actuales en nuevas tecnologías aplicadas al lenguaje y la manera en que los humanos nos comunicamos con las máquinas. No en vano, este tipo de innovación nos promete una mejor gestión de los datos médicos, chatbots para nuestros coches, consultas más interactivas de nuevas ofertas TIC, herramientas conversacionales para pacientes que toman medicación a diario o sistemas que ayuden a aprender a leer o fortalecer la memoria de pequeños y mayores.

En nuestro país, numerosas grandes empresas y pequeñas startups están trabajando en esta nueva ola tecnológica con el lenguaje por bandera. Algunas de ellas las podremos ver en el evento ‘4 Years From Now’, paralelo al Mobile World Congress que comienza la próxima semana, donde competirán entre sí durante el I Hackathon de Tecnologías del Lenguaje, organizado por Red.es.

¿Cuáles son los ocho proyectos participantes? Te los contamos:

  • ‘¿Me das alguna idea sobre…?’, del equipo vicom-nlp (Fundación Vicomtech): Se trata de una aplicación para la extracción de información y el reconocimiento de entidades nombradas y expresiones temporales. Localiza eventos en localizaciones geográficas y fechas determinadas, y propone hoteles y restaurantes. La aplicación surge de la necesidad de acceder de forma natural a la información contenida en repositorios OpenData. Su objetivo es que el usuario visualice información sin el uso de interfaces en los que tiene que configurar búsquedas
  • ‘DanaVoice’, del equipo Arico (Alexis Rico): Se trata de un chatbot pensado exclusivamente para su uso en el coche. Se centra en la automatización de tareas comunes que no requieran atención visual del conductor, utilizando instrucciones procesadas vía lenguaje natural (controlar la música, responder a conversaciones de mensajería instantánea o realizar consultas avanzadas al dar órdenes en lenguaje natural).
  • ‘Diccionario ConTexto’, de Mikel Artetxe: Los diccionarios contextuales permiten buscar la traducción de palabras y expresiones sobre grandes corpus bilingües, ofreciendo así ejemplos de su uso real en contexto. Desafortunadamente, los productos existentes son cerrados y trabajan sobre un número reducido de idiomas. Este proyecto pretende desarrollar una alternativa libre que permitirá la creación automática de diccionarios contextuales a partir de cualquier corpus paralelo así como su consulta mediante una interfaz web.
  • ‘Find your IT job’, de EVERIS: Su objetivo es facilitar la búsqueda de ofertas de empleo TIC mediante un chatbot, en fuentes de datos estructuradas y no estructuradas mediante su categorización y la consulta en lenguaje natural. El sistema integra un módulo que, a partir de la descripción en lenguaje natural de una oferta, detecta las entidades presentes en la oferta: titulación, lenguajes de programación, idiomas, sistemas operativos, bases de datos…
  • ‘GeoDomain Tagging’, del equipo DonoSIA (Urko Larrañaga): Esta herramienta pretende facilitar la búsqueda de contenidos de interés para los usuarios. Para ello, identifica el dominio y el país, y lo vincula con el texto (que puede ser una sola frase o un documento entero). Para identificar el país, se ha generado un listado de entidades y su correspondiente relación con los países existentes.
  • ‘De cómo convertir la lectura en un juego’, del equipo Cogni-Play (IBM): Está dirigida a niños que estén aprendiendo a leer. La herramienta les ayude a adquirir vocabulario y mejorar la memoria y concentración. Mide dimensiones como la velocidad de lectura (se presentan párrafos de la lectura y el niño decide cuándo aparece el siguiente) y la comprensión del texto (se puede ver la definición y pronunciación de una palabra que no entienda). También presenta retos.
  • ‘Asistente social para mayores’, del equipo Cogniteam (IBM Global Services España): Este chatbot propone una solución que compatibilice el lenguaje natural con el lenguaje técnico presente en prospectos médicos. El chat interactúa con pacientes de la tercera edad, que toman medicamentos a diario. La solución escucha a la persona e interpreta sus estados (dolores de cabeza, cansancio, etc.) y contrasta con los prospectos médicos si pueden ser debidos a efectos secundarios de la medicación. De la misma forma, avisaría al paciente sobre recomendaciones alimenticias o físicas del medicamento.
  • ‘TextDigester: Resumen Automático Ubicuo’, de UPF-TextDigester Team (Francesco Ronzano): Integra diferentes recursos de PLN para soportar la generación de resúmenes de texto libre a gran escala y en diferentes idiomas. Además de textos planos, TextDigester puede analizar contenidos textuales de páginas HTML como las de un periódico, documentos XML como RSS feed y objetos JSON como los post de Twitter. Una vez detectado el idioma, TextDigester ejecuta el análisis léxico y semántico de los documentos. Gracias a esta información, TextDigester implementa varios métodos para generar resúmenes.

Sobre el autor de este artículo

Alberto Iglesias Fraga

Periodista especializado en tecnología e innovación que ha dejado su impronta en medios como TICbeat, El Mundo, ComputerWorld, CIO España, Kelisto, Todrone, Movilonia, iPhonizate o el blog Think Big de Telefónica, entre otros. También ha sido consultor de comunicación en Indie PR. Ganador del XVI Premio Accenture de Periodismo y Finalista en los European Digital Mindset Awards 2016.