Contenido creado por María Noel Dominguez
Inteligencia Artificial

Mejor que yo

IA de Microsoft que describe automáticamente las imágenes es más precisa que los humanos

El nuevo sistema de inteligencia artificial (IA) que Microsoft emplea para poner las descripciones automáticas de las imágenes es capaz de realizar esta tarea con más precisión que los humanos, según informa la compañía.

15.10.2020 08:19

Lectura: 2'

2020-10-15T08:19:00-03:00
Compartir en

Microsoft presentó el nuevo modelo de IA que emplea para las descripciones automáticas de imágenes. Para su desarrollo, el equipo responsable ha utilizado un conjunto de imágenes emparejadas con etiquetas, cada una de ellas asignada a un objeto específico de la imagen.

La diferencia en este modelo es que no han empleado descripciones completas, sino etiquetas, ya que estas últimas son "más eficientes" y permiten "introducir muchos datos al modelo", explican en el blog oficial.

De esta forma pudo "preentrenar" al modelo con vocabulario visual, es decir, para que identifique palabras individuales con las imágenes correspondientes. Posteriormente, lo han ajustado para las descripciones sobre un conjunto de descripciones de imágenes, con lo que aprende a redactar una frase.

Este enfoque de aprendizaje permite que el modelo, cuando está ante una imagen con nuevos objetos, "aproveche el vocabulario visual para generar una descripción precisa". La compañía asegura que ante imágenes sin descripciones, la IA es capaz de generar descripciones más precisas que las que fueron escritas por personas.

Este nuevo modelo es, además, el doble de preciso que el que la compañía ha estado utilizando desde 2015 en sus productos y servicios.

"El uso de subtítulos de imágenes para generar una descripción de la foto, conocido como texto alternativo, en una página web o documento es especialmente importante para las personas ciegas o con escasa visión", ha señalado el responsable de ingeniería de software del grupo de Plataformas de Inteligencia Artificial de Microsoft, Saqib Shaikh.

Desde Microsoft aceleraron la implantación del nuevo modelo en Azure, donde está disponible en Cognitive Services, y también en Seeing AI, la app que facilita el reconocimiento y descripción del entorno a personas ciegas. A finales de año también llegará a Word y Outlook, para Windows y Mac, y PowerPoint para Windows, Mac y web.

Con información de Europa Press