Innovación

El MIT crea un ordenador capaz de aprender idiomas mediante videojuegos

Google ahora es también un diccionario: el buscador mejora sus definiciones

El MIT ha creado un sistema informático que ha aprendido a jugar a un juego de ordenador, basado puramente en texto, sin tener ningún conocimiento previo del lenguaje ni del significado de las palabras.

El uso de videojuegos para fomentar las habilidades lingüísticas de los más pequeños es algo sobradamente conocido y empleado por educadores y padres de todo el mundo pero, ¿se imaginan aplicar ese mismo principio para que sea una máquina la que aprenda a hablar?

Esa fue la pregunta que se hicieron en el MIT (Massachusetts Institute of Technology), la cual acabó desembocando en un ambicioso proyecto de investigación en el que un sistema informático ha aprendido a jugar a un juego de ordenador, basado puramente en texto, sin tener ningún conocimiento previo del lenguaje ni del significado de las palabras. O dicho al revés: consiguió aprender el idioma a través del juego.

Ya en 2011 la profesora Regina Barzilay consiguió que un ordenador aprendiera a jugar al mítico videojuego ‘Civilization’ pero, en este caso, el sistema había analizado previamente el manual con las reglas del juego, con lo que tenía algunas pistas sobre las que construir sus premisas y entender su funcionamiento. Sin embargo, esta misma investigadora ha conseguido ahora, junto a su equipo, que el ordenador consiga jugar sin tener acceso previo a ningún dato sobre el juego.

¿Cómo fue el juego?

Los investigadores estaban especialmente interesados ​​en diseñar un sistema que pudiera hacer inferencias acerca de la sintaxis, aspecto que ha sido un problema perenne en el campo del procesamiento de lenguaje natural. Así que los profesionales del MIT crearon su propio juego de ordenador basado en texto que, aunque de manera muy simple, tendía a describir estados de cosas utilizando construcciones sintácticas problemáticas, como la negación y la conjunción.

reglas-juego

Para evaluar su eficacia, probaron el sistema en un juego de fantasía desarrollado en Evennia, un conjunto de herramientas para la creación de videojuegos. Junto al nuevo ordenador del MIT se pusieron otras dos técnicas de procesamiento de lenguaje natural, la conocida como “bolsa de palabras” (en la que un algoritmo de aprendizaje automático basa sus resultados en la co-ocurrencia de palabras) y una de sus variantes, la “bolsa de bigramas”, que busca la co-ocurrencia de unidades de dos palabras. Huelga decir que el prototipo de Barzilay superó con claridad a sus dos rivales.

Sin embargo, el sistema no logró completar el juego ya que la demo creada en Evennia requiere que el jugador recuerde una descripción verbal de un grabado encontrado en una habitación y luego, después de navegar por varios retos intermedios, hacerlo coincidir con una descripción distinta del mismo grabado en una habitación diferente. “No sabemos cómo hacer eso en absoluto”, afirman desde el MIT.

Creando el Aprendizaje Profundo

Los investigadores del MIT utilizaron un enfoque de aprendizaje llamado “aprendizaje profundo”, una nueva concepción del concepto de redes neuronales, que es un elemento básico de la investigación de inteligencia artificial temprano. Por lo general, un sistema de aprendizaje automático se iniciará con algunas suposiciones acerca de los datos que está examinando, para evitar la pérdida de tiempo en hipótesis infructuosas. Un sistema de procesamiento de lenguaje natural podría, por ejemplo, asumir que algunas de las palabras que encuentre serán las palabras de negación… a pesar de que no tiene idea de cuáles son.

inteligencia-artificial

Las redes neuronales no hacen este tipo de supuestos. En su lugar, derivan un sentido de dirección de su organización en capas. Los datos se introducen en una matriz de nodos de procesamiento en la capa inferior de la red, cada uno de los cuales modifica los datos de una manera diferente antes de pasarla a la siguiente capa, que los modifica antes de pasarlos a la siguiente capa, y así sucesivamente. La salida de la capa final se mide contra algún criterio de rendimiento, y luego el proceso se repite, para ver si diferentes modificaciones mejoran el rendimiento.

Sobre el autor de este artículo

Alberto Iglesias Fraga

Periodista especializado en tecnología e innovación que ha dejado su impronta en medios como TICbeat, El Mundo, ComputerWorld, CIO España, Kelisto, Todrone, Movilonia, iPhonizate o el blog Think Big de Telefónica, entre otros. También ha sido consultor de comunicación en Indie PR. Ganador del XVI Premio Accenture de Periodismo y Finalista en los European Digital Mindset Awards 2016.