Competición de Computer Vision: más grande que ImageNet

La empresa CDiscount, un supermercado online francés del grupo Casino, acaba de lanzar en Kaggle (la plataforma online de competiciones sobre Data Science) un reto que consiste en que a partir de fotos de sus artículos y sus clasificaciones, se consiga clasificar otras imágenes en sus categorías. Se repartirán 35.000$ en premios repartidos de la manera 20.000 para el ganador, 10.000 para el segundo y 5.000 para el tercero, y se disponen de 3 meses hasta la finalización de la competición.

El reto en números: 15 millones de imágenes en resolución 180x180, a clasificar en 5271 categorías. En total te dan 7,069,896 productos, cada uno con al menos una foto, ya clasificados para entrenar. Por otro lado para comprobar lo bien que lo hace tu sistema, te dan un juego de test consistente en 1,768,182 productos.

Recordemos que ImageNet, el reto de Computer Vision más famoso del mundo, con fotos genéricas de todo tipo, da 14 millones de imágenes a clasificar en 1000 categorías.

Esto supone una gran dificultad en el reto, dado que hay menos imágenes por categoría para entrenar, así que hay que poner gran incapié en el data augmentation, además de realizar una buena topología de red. Segurament veamos muchos equipos participando con evoluciones de ResNet.

Pero aun existe una dificultad mayor: parte de los artículos contienen imágenes, por ejemplo carátulas de CDs, libros o carcasas de móviles, que podrían dar problemas al entrenar y al ser clasificadas.

¿Alguno de vosotros participará? ;)

El reto: www.kaggle.com/c/cdiscount-image-classification-challenge