Innovación

El nuevo algoritmo de Google detecta los objetos de una imagen con más precisión

google
Escrito por Mihaela Marín

GoogLeNet es capaz no sólo de asignar las etiquetas correctas sino también de localizar e identificar otros elementos complejos dentro de la imagen analizada.

Aunque son las personas y no las máquinas quienes muestran mejores capacidades para el reconocimiento de imágenes, el rápido desarrollo de los algoritmos avanzados ha llevado a muchos científicos a señalar que solo es una cuestión de tiempo que las primeras sean superadas por las segundas en esta práctica.

Los mejores sistemas de visión computacional todavía tienen problemas para reconocer los objetos demasiado pequeños o finos, como por ejemplo una hormiga sobre el tallo de una flor; en cambio, a diferencia de los humanos, sí logran incluir los elementos en ciertas categorías específicas (aves o perros). En este sentido Olga Russakovsky, una de las científicas más reconocidas en el campo de visión artificial y reconocimiento de patrones, hizo una comparación junto con su equipo de expertos y encontró un valor mínimo entre nuestra capacidad de reconocimiento y la de los ordenadores:

Nuestros resultados muestran que un sujeto humano entrenado es capaz de superar el mejor algoritmo con aproximadamente 1,7%”.

Para ella está claro que las personas superarán la habilidad de la inteligencia artificial en la clasificación de modelos sólo por medio de mucho esfuerzo, experiencia y tiempo.

El equipo de Russakovsky no ha sido el único que se centrado en la investigación de los algoritmos para el reconocimiento de patrones. Este año la primera posición en la competición mundial más importante en este campo, ImageNet Large-Scale Visual Recognition Challenge, la ha ganado un grupo de investigadores de Google.

googlenet

Imagen

Un sistema informático que presta las funciones de la arquitectura neuronal

En la presentación de sus últimos resultados el equipo de Google ha detallado un sistema mejorado de detección de objetos que permite identificar con facilidad múltiples objetos de forma muy precisa. El nuevo algoritmo llamado GoogLeNet ha sido capaz no sólo de asignar las etiquetas correctas sino también de localizar e identificar otros elementos complejos dentro de la imagen analizada, obteniendo la menor tasa de error registrada hasta ahora por los algoritmos anteriores de sólo 6,7%.

La clave de su sistema de reconocimiento es el rediseño de una arquitectura neuronal que imita el cerebro humano y es capaz de ampliar el campo de visión, tanto en profundidad como en anchura. El resultado ha permitido afinar los criterios de evaluación del algoritmo creando un sistema de identificación y predicción más exacto.

Los principios en los que se basa GoogLeNet son la teoría hebbiana que describe el proceso de adaptación de las neuronas durante el aprendizaje y la invariación de escala, una ley según cual los objetos no cambian si son multiplicados por un factor común. Con la ayuda de estas dos teorías el software aprende a distinguir las proporciones de los distintos objetos incluso en el caso de las imágenes poco claras.

El nuevo sistema de detección de patrones permitirá a Google mejorar sus productos, desde la búsqueda de imágenes y vídeos de Youtube hasta su coche autónomo y finalmente, según afirma la compañía del buscador, se podría adaptar a cualquier situación en la que haga falta entender qué hay en una imagen y dónde están los objetos presentados dentro de la misma.

 Imagen principal 

Sobre el autor de este artículo

Mihaela Marín

Mi interés por la tecnología ha nacido cuando me he dado cuenta de que nos permite ver el lado escondido de la realidad. Todavía quedan muchas cosas por descubrir y suficiente curiosidad para entender lo que realmente somos. Especializada en Periodismo y Marketing, he podido compartir experiencias con profesionales del mundo empresarial tecnológico. Siempre en búsqueda de ideas, escribo para hacer conocido el trabajo innovador, capaz de cambiar los problemas en soluciones.