"¿Quién es el autor de esta imagen?"

Últimamente he leído esta frase cientos de veces, en muchos idiomas diferentes. Muchas veces no se llega a plantear pero la duda está ahí ante una imagen, mem, captura de pantalla dudosa, trino acusador, falsificación clamorosa, bulo reiterativo...

También puede ser que seas tú el artista y quieras saber si tu imagen, fotografía o texto (asociado a una imagen) se han utilizado sin permiso por otras personas en Internet. Y la solución siempre suele ser:

ImgOps

(botón de acción de favoritos o con el esquema de URL: imgops.com/[URL].jpg/png)*

*Esto es, poniendo imgops.com delante de la URL de una imagen.

En realidad con estas frases escasas y los dos enlaces el artículo ya está hecho, pero queda un poco ridículo así que voy a comentar algunas cosas más. Si te apañas mínimamente con la interfaz de la página y te gusta experimentar (y no tienes tiempo para aguantar uno de mis artículos interminables donde hablo de cosas que no tienen mucho que ver, como mitología) puedes dejar de leer en este punto. Nuevamente no es necesario pinchar en la mayoría de enlaces, siendo en muchos simples ejemplos de lo mencionado en el texto o explicaciones más extensas. Los enlaces con [w-es] o [w-en] a su lado son de Wikipedia, en español y en inglés respectivamente. Los enlaces con [🖼️] son enlaces directos a imágenes y con [dA] son páginas de deviantArt.

0. Introducción

ImgOps (de Image Operations) tiene muchas más funciones pero hoy voy a centrarme en contestar la pregunta del título. Para eso usaremos los buscadores CBIR (Content-based Image Retrieval [w-en] o, en español, "Consulta de imágenes mediante ejemplo [w-es]") que se pueden utilizar a través de ImgOps.

ImgOps en realidad sólo es una pasarela que sube automáticamente la imagen seleccionada al buscador elegido.

Aparecen 8 buscadores en la parte principal y otros 4 para buscar fuentes de aquel he... anime/manga que has visto en una red social y que no consigues encontrar. También hay otro para comparar caras de personas.

ImgOps sigue la interfaz de todos los CBIR: tiene dos modalidades para subir la imagen, por URL y o subiendo el archivo desde el dispositivo. ImgOps no almacena la imagen de manera prolongada ni provee ningún servicio por sí mismo, sólo es una manera de obtener atajos de muchas herramientas en línea.

No todos los buscadores CBIR son útiles para todos los casos. Como en mis artículos de archivadores (Lo efímero del hipervínculo I, II y III) el orden puede parece un tanto aleatorio, pero no es así.

Un ejemplo de búsqueda utilizando una imagen subida desde un ordenador y con los buscadores CBIR resaltados en mi orden de preferencia. Jamás encontré nada con el buscador CBIR de reddit, jamás. Los buscadores asiáticos (5) a veces no funcionan desde ImgOps.

Imagen de muestra: "Draco Niger Grandis" de Mark Harrison. Veamos si encontramos si se ha usado en algún otro contexto o si los buscadores nos dicen su autor.

1. Yandex

Ejemplo de búsqueda inversa en Yandex (a través de ImgOps).

En Menéame se ha prestado algo de atención a este buscador y concretamente a su buscador de imágenes ("Subir una foto a Yandex es [...] | 🔗 aunque también con titulares algo sensacionalistas como "El buscador de imágenes tan potente que es capaz de encontrar tu propio clon" | 🔗).

En mi opinión (a fecha junio de 2019) el servicio de Yandex ha adelantado al CBIR de Google tanto en capacidad de encontrar imágenes de una resolución mayor como para localizar contextos adicionales y modificaciones de una misma imagen.

En la búsqueda de ejemplo se pone de manifiesto todo ello:

  1. La imagen de mayor tamaño que recupera es de mayor tamaño que la original (1920x1080 [🖼️] vs 960x720 [🖼️]) pese a que no es exactamente la misma (lo que nos da otra pista para buscar más contextos).
  2. Otra imagen que sí es igual que la original también tiene un tamaño superior (1024x768 [🖼️]).
  3. Otro grupo de imágenes nos remite al pinchar a la portada del disco de black metal ambiental "Let Mortal Heroes Sing Your Fame" | , del grupo Summoning [w-es] [w-en] ["Contexto 1"]).
  4. El último grupo de imágenes nos muestra que se usó como portada de la edición alemana del año 2000 de la saga de Corum: "Das Buch Corum" de Michael Moorcock [w-es] [w-en] ["Contexto 2"].

Ventajas: Mayor número de contextos, mayor resolución promedio de los resultados de los tamaños más grandes.

Desventajas: Menor número de resultados globales, resultados espurios (imágenes que no tienen nada que ver). Se toma la fuente poco literalmente.

2. Google Images

Ejemplo de búsqueda inversa en Google Images (a través de ImgOps)..

_____________________________________________________________

No he encontrado artículos enlazados desde Menéame que hablen específicamente del buscador inverso de imágenes de Google, pero debería ser conocido por la mayoría. Dejo aún así unos enlaces de referencia:

¿Qué es y cómo se puede hacer una búsqueda inversa de imágenes? / [...] búsqueda inversa de imágenes en Google / [...] desde el móvil

Google Images cuenta con la inmensa ventaja de tener indexados el mayor número de páginas e imágenes que ningún otro buscador. Eso puede ser una gran ventaja pero también una desventaja.

En mi ejemplo, Google Images relaciona inmediatamente la imagen proporcionada con el "Contexto 1" (el disco de Summoning). Sin embargo, en las páginas iniciales en un principio no aparece ninguna alusión a otro contexto. Sí es capaz de encontrar versiones de la imagen que no aparecían en Yandex como por ejemplo: Booklet completo [🖼️] o fotomanipulaciones [dA] (que indirectamente nos lleva al título y autor original).

Ventajas: Tiene una base de datos mayor que ningún otro buscador. No suele haber resultados espurios.

Desventajas: La abundancia de imágenes puede ser contraproducente. Se encuentra la misma imagen repetida una y otra vez, sin que se pueda deducir (en otras búsquedas) un contexto claro o su contexto original. A veces se toma la fuente demasiado literalmente.

_____________________________________________________________

3. TinEye

Ejemplo de búsqueda inversa no exitosa en TinEye (a través de ImgOps).

Si bien cuando los CBIR comenzaron TinEye fue el sistema pionero, ha perdido mucho terreno ante el empuje de Yandex y Google, y ya no es mi sistema preferido para encontrar imágenes. Sin embargo, pese a lo catastrófico del ejemplo mostrado, TinEye sigue siendo un recurso a tener en cuenta, con sus 36.5 mil millones de imágenes indexadas.

Ejemplo de búsqueda inversa exitosa en TinEye (mediante URL).

Una de las grandes diferencias de TinEye con respecto al resto de buscadores CBIR ya mencionados y los que se mencionarán es que es un servicio centrado exclusivamente en la búsqueda inversa de imágenes. Su base de datos cuenta con registros bastante antiguos (por ejemplo, aún aparecen imágenes similares a imágenes que estaban alojadas en Elfwood) y a diferencia del resto de servicios permite organizar los resultados no sólo por tamaño sino también por fecha (más antiguo, más moderno), por similitud y por sitio web. Tienen indexadas también colecciones de stocks (recursos gráficos) como shutterstock o pixabay, así que si buscas una imagen que hayas subido a una galería de recursos gráficos o que sospeches que contenga un recurso gráfico, es más sencillo encontrarla a través de TinEye. En algunos casos Google, aunque enlace con la página correcta en alguno de los primeros resultados, puede no ser la galería original de recursos sino otra que también tenga permisos para distribuir la imagen. También tiene indexada una parte de DeviantArt.

Otro punto positivo es la posibilidad de guardar búsquedas si te registras. Mi recomendación es que si guardas una búsqueda porque quieras volver a ella, archives también los resultados (para saber como se archiva, ver mis artículos sobre archivado web).

Ventajas: Alternativa potente al ser un servicio exclusivamente de CBIR. Filtros por fecha, tamaño, sitio web, similitud. Encuentra imágenes de mayor antigüedad. No contiene resultados espurios y son variados.

Desventajas: La base de datos va crece comparativamente menos que la de sus competidores principales Yandex y Google. No parece escanear la web actual a una velocidad comparable a como lo hacía en principio (lo que redunda en que no suelen aparecen muchas imágenes indexadas recientemente). A veces no encuentra resultados con una imagen pero sí con otra ligeramente modificada.

4. Bing

Ejemplo de búsqueda inversa en Bing (a través de ImgOps).

Esta búsqueda de ejemplo en realidad ejemplifica perfectamente los problemas del buscador CBIR de Bing. Ha encontrado el que hemos llamado "Contexto 1" pero no ha sido capaz de encontrar nada más y los resultados están poblados de imágenes espurias que no tienen nada que ver con la imagen. Ni rastro del "Contexto 2".

Ventajas: Cuando los tres anteriores fallan puede haber una remota esperanza de que con Bing se encuentre algún resultado en alguna web exótica. Funciona razonablemente bien en imágenes que no den especiales problemas.

Desventajas: Escasez de resultados. Abundancia de resultados espurios. Los tamaños encontrados tampoco son especialmente relevantes.

5. Baidu - So.com - Sogou

Ejemplo de búsqueda inversa nada exitosa en Baidu (a través de una subida directa).

Lamentablemente ImgOps no parece funcionar con Baidu y con so.com directamente por lo que hay que realizar la subida de la imagen nuevamente en su servicio. La interfaz no está ni en español ni en inglés pero sigue el estándar dentro de los buscadores CBIR de identificar la búsqueda de ese tipo mediante una cámara fotográfica. Presionando se abren los controles: abajo un botón sirve para subir la imagen desde nuestro dispositivo y encima el cuadro de texto permite introducir la URL de la imagen. La interfaz de so.com y de Sogou es muy similar también.

Esto es un pie de imagen.

La búsqueda con Baidu es extremadamente lenta, unos 30 segundos he contado en el ejemplo y, aunque ha identificado el "Contexto 1" (al lado de la imagen en letra diminuta), no ha encontrado ninguna imagen relacionada. Obviamente esto puede variar muchísimo con otras imágenes.

Ejemplos de búsquedas inversas con So.com (no exitosa) y de sogou (moderadamente exitosa) (a través de una subida directa y de ImgOps respectivamente).

So.com no produce resultados apreciables en la mayoría de búsquedas y los resultados de Sogou también son escasos.

¿Por qué incluyo estos tres buscadores de imágenes si son tan malos?

Porque cuando buscamos alguna imagen que tenga algo que ver con China, Japón, etc., pasa esto:

Ejemplo de búsquedas inversas exitosas con Baidu (+ de 20 resultados) y sogou (+6 resultados) (a través de una subida directa).

(Inciso histórico-mitológico) La imagen es una Banderola de seda en forma de T (alternativa [w-en]) que apareció en la tumba n. 1 de la colina Mawangdui [w-es] [w-en], en Changsha, provincia de Hunan (China), perteneciente a Xin Zhui [w-es] [w-en] (período de Han Occidental [w-es] [w-en]). En ella se muestran el cielo (parte superior), el reino humano (parte media) y el inframundo (parte inferior). Aparecen Nüwa, el árbol Fusang donde está posado un Cuervo del sol (junto con los otros ocho soles), Chang'e volando a la luna, una liebre y una tortuga en la luna, etc.

Una página web encontrada a través de sogou es esta: 谁与争锋 (...) que muestra un número mayor de imágenes que cualquier otro resultado en buscadores no orientales.

Aparte de mostrar un ejemplo de un resultado real de esos buscadores cuando me documentaba para escribir el artículo que hice sobre los Yatagarasu y otros cuervos de tres patas (fin del inciso)...

Con esto quiero decir que estos CBIR son MUY útiles para encontrar imágenes relacionadas con un contexto chino, japonés, coreano, etc.

Eso sí, en alguna ocasión me han servido para encontrar alguna imagen en un tamaño diferente, que, subiéndola a otro CBIR me ha llevado a encontrar su origen.

Ventajas: Imágenes indexadas de millones de páginas web chinas, japonesas y orientales.

Desventajas: No es adecuado para cualquier búsqueda. Pocos resultados la mayor parte del tiempo. Lentitud. Interfaz en chino. Festival de resultados espurios sin ninguna relación concebible con la imagen subida (aunque algunas veces son interesantes: Alice and the gryphon [dA]).

6. SauceNAO

Ejemplo de búsqueda inversa no exitosa en SauceNAO (a través de ImgOps).

El 99.99% de resultados de imágenes que no sean de manga o que no estén en pixiv o DeviantArt serán negativos usando el buscador de SauceNAO. El 1% restante es debido (en mi experiencia) a personas que han subido sin permiso esa imagen a DeviantArt o pixiv. Sin embargo, yo he encontrado la fuente de algunas imágenes de esta manera así que ahí lo dejo.

Los otros tres específicos de manga funcionan de manera similar y no aportan nada a no ser que lo que se busque sea eso.

7. Otras técnicas

A pesar de todos estos buscadores CBIR, muchas veces es posible encontrar imágenes similares o la misma imagen, a pesar de que se sepa con seguridad que existe en otros tamaños. Una posible solución es combinar los resultados y tamaños que producen los resultados de Yandex, Google, TinEye y Bing. Las imágenes de partida diferentes (aunque sea sólo en tamaño) pueden producir resultados diferentes.

Rotar, expandir de tamaño, girar en espejo, eliminar marcas de agua añadidas a posteriori, son otras técnicas muy útiles a la hora de buscar mediante ejemplo una imagen. Herramientas para todo ello están incorporadas en ImgOps.

Dos herramientas fundamentales mostradas ahí son waifu2x (para aumentar de tamaño) y Jeffrey's Image Metadata Viewer (para visualizar los datos EXIF de una imagen). Algunas veces los autores de las imágenes incluyen su copyright en los datos EXIF del fichero. Otros datos interesantes que pueden incluir los datos EXIF son la fecha, modelo de la cámara, software, etc.

8. Conclusiones

El objetivo inicial era conocer en que otros contextos se usaba la imagen de Mark Harrison (y de paso mostrar las características de cada buscador). Mientras que prácticamente todos acertaron en que esa imagen se usaba de carátula de un disco de música, sólo Yandex mostró que también se usó en la portada de un libro de Moorcock (lo que tiene mucho sentido ya que parte de la letras de algunas canciones como "Ashen Cold [dA]" | , provienen de poemas de Moorcock).

El resultado ha sido que ningún buscador CBIR nos ha sugerido directamente el autor original. Sin embargo, a la hora de encontrar imágenes si el autor no está claro toda información es útil y podemos utilizar otras fuentes tangenciales para llegar hasta el autor. En mi caso llegué buscando información directamente acerca de la carátula [w-en], lo que me llevó a que dicha portada no sólo estaba basada en la imagen de Mark Harrison sino también en el marco de la obra "The Aino Myth [🖼️]" (1891) de Akseli Gallen-Kallela [w-es] [w-en].

Sé que hay complementos específicos de Google/TinEye/Yandex, pero ninguno es tan completo como ImgOps. También conozco la existencia de aplicaciones móviles para identificar ropa, objetos y cosas así, pero no las he probado. Existen decenas de proyectos públicos y privados [w-en] con este mismo objetivo pero fuera de los analizados aquí no conozco ninguno que merezca la pena.

El futuro de los buscadores CBIR pasa por aprendizaje automático [w-es] [w-en] y por la mejora de los algoritmos. En un tiempo, la búsqueda inversa de imágenes será tan precisa como lo es ahora la identificación de música mediante Shazam (←vídeo de Jaime Altozano que me decidió finalmente a escribir este artículo).

Un saludo,

Jakeukalane.

9. Preguntas

  1. ¿Os ha pasado alguna vez querer haber averiguado el nombre del autor de una imagen en Internet y no haberlo conseguido?
  2. ¿Conocíais estos servicios?
  3. ¿Los vais a usar a partir de ahora?
  4. ¿Qué otros consejos para encontrar la fuente de una imagen se os ocurren?