edición general
  1. @LoboAsustado Claro que es estresante, porque entrenar es un cristo. Qué si seleccionar las imágenes, darles formato adecuado, escribir la descripción de cada una de ellas, seleccionar los valores y esperar a que no salga un churro...

    xD

    Si sólo te apetece crear imágenes Comfyui es más amigable con poca VRAM. Y es más fácil de lo que parece. Hay páginas donde te puedes descargar "workflows". Esta es una: comfyworkflows.com/

    Lo mejor para crear imágenes es que te instales comfyui+ ComfyUI Manager. Esa extensión facilita bajarte modelos y extensiones que están en los workflows: github.com/ltdrdata/ComfyUI-Manager

    Eso sí, luego recuerda borrar e instalar comfyui de nuevo, que instalar extensiones hace que tarde mucho en arrancar.

    Lo malo es que con 2 gigas de VRAM no te da para crear videos mediante Animatediff o Stable Video Diffusion. Pero puedes comprar 100 créditos de Google Colab por unos 12€, y te da para unas 50 horas por una gpu de 16 gb de VRAM.
  1. @thorin @LoboAsustado si estás intentando introducirte a los conceptos de la clasificación de imágenes, te recomiendo que le des un vistazo a Orange Data Mining, yo es la alternativa low Code que utilizo para explicar los conceptos antes de meternos en código

    m.youtube.com/watch?v=lvgx62a8XQk

menéame