Aunque son las personas y no las máquinas quienes muestran mejores capacidades para el reconocimiento de imágenes, el rápido desarrollo de los algoritmos avanzados ha llevado a muchos científicos a señalar que solo es una cuestión de tiempo que las primeras sean superadas por las segundas en esta práctica.
Los mejores sistemas de visión computacional todavía tienen problemas para reconocer los objetos demasiado pequeños o finos, como por ejemplo una hormiga sobre el tallo de una flor; en cambio, a diferencia de los humanos, sí logran incluir los elementos en ciertas categorías específicas (aves o perros). En este sentido Olga Russakovsky, una de las científicas más reconocidas en el campo de visión artificial y reconocimiento de patrones, hizo una comparación junto con su equipo de expertos y encontró un valor mínimo entre nuestra capacidad de reconocimiento y la de los ordenadores:
Nuestros resultados muestran que un sujeto humano entrenado es capaz de superar el mejor algoritmo con aproximadamente 1,7%”.
Para ella está claro que las personas superarán la habilidad de la inteligencia artificial en la clasificación de modelos sólo por medio de mucho esfuerzo, experiencia y tiempo.
El equipo de Russakovsky no ha sido el único que se centrado en la investigación de los algoritmos para el reconocimiento de patrones. Este año la primera posición en la competición mundial más importante en este campo, ImageNet Large-Scale Visual Recognition Challenge, la ha ganado un grupo de investigadores de Google.
Un sistema informático que presta las funciones de la arquitectura neuronal
En la presentación de sus últimos resultados el equipo de Google ha detallado un sistema mejorado de detección de objetos que permite identificar con facilidad múltiples objetos de forma muy precisa. El nuevo algoritmo llamado GoogLeNet ha sido capaz no sólo de asignar las etiquetas correctas sino también de localizar e identificar otros elementos complejos dentro de la imagen analizada, obteniendo la menor tasa de error registrada hasta ahora por los algoritmos anteriores de sólo 6,7%.
La clave de su sistema de reconocimiento es el rediseño de una arquitectura neuronal que imita el cerebro humano y es capaz de ampliar el campo de visión, tanto en profundidad como en anchura. El resultado ha permitido afinar los criterios de evaluación del algoritmo creando un sistema de identificación y predicción más exacto.
Los principios en los que se basa GoogLeNet son la teoría hebbiana que describe el proceso de adaptación de las neuronas durante el aprendizaje y la invariación de escala, una ley según cual los objetos no cambian si son multiplicados por un factor común. Con la ayuda de estas dos teorías el software aprende a distinguir las proporciones de los distintos objetos incluso en el caso de las imágenes poco claras.
El nuevo sistema de detección de patrones permitirá a Google mejorar sus productos, desde la búsqueda de imágenes y vídeos de Youtube hasta su coche autónomo y finalmente, según afirma la compañía del buscador, se podría adaptar a cualquier situación en la que haga falta entender qué hay en una imagen y dónde están los objetos presentados dentro de la misma.
Leave a Comment
You must be logged in to post a comment.