@thorin Ya lo he visto. A cambio de 25GB d ram, casualmente solo tengo 24
Ya llegara, y total, tampoco tengo nada sobre lo que entrenar, estoy haciendo una inversión textual, con unas imágenes de prueba, y como pensaba, las imágenes de entrenamiento, o sus etiquetas son una mierda
@Nadieenespecial Pues yo ya me estoy haciendo a Dreambooth+Colab.
Lo más difícil que encuentro es hacer una selección buena de fotos que luego den buen resultado.
Se me acabaron los créditos de Colab, pero no noto diferencia. Hoy, mientras trabajaba, he creado 3 modelos a la misma velocidad que antes.
Lo del drama de Reddit no acabo de pillarlo, pero tengo claro que Emad es un poco idiota gracias a comentarios como este: i.redd.it/l5lv71rcbdt91.png Menos mal que gracias al software libre hay muchas cosas que no están bajo control.
Por cierto, esta página me ha ayudado muco para crear los modelos: www.birme.net/?target_width=512&target_height=512 Es un modo muy fácil de hacer las imágenes a 512X512, que se supone que son las óptimas para la creación de modelos.
@Nadieenespecial@visualito@iveldie Por cierto, un truco que parece funcionar para Dreambooth.
Al crear el modelo tienes que ponerle el nombre del sujeto, por ejemplo "panchoelnegro" y la categoría "gato".
Luego a la hora de generar la imagen artificial a partir del modelo sale mejor si mencionas las dos palabras palabras juntas: "Foto de panchoelnegro gato encima de una silla, estilo de Picasso".
Si es un coche, sería poner "pintura de fordjag coche, por Robert Capa". Etc..
@thorin En los powertoys, que es unas utilidades de microsoft para windows, que hay que instalarlas aparte ya hay un reescalador masivo de archivos. learn.microsoft.com/en-us/windows/powertoys/
Recomiendo siempre instalarlos, tienen unas cuantas muy útiles.
@visualito Ese no lo vemos a este paso, la comunidad esta a ver si se organiza para hacer sus propios modelos
@Nadieenespecial Lo estuve mirando, pero ese lo que hace es deformar la imagen, con lo que el resultado del modelo es malo.
Con Birme puedes seleccionar qué recortar de la imagen para que encaje en la medida deseada, sin distorsionar.
Hoy probé a hacer un modelo usando 200 imágenes y fue muy rápido para optimizarlas.
Ahora han añadido los hypernetworks a la UI del automatic, que si he entendido bien, significa que puedes reentrenar un modelo, como con el dreambooth, pero generando un archivo que extiende ese modelo.
Se supone que los resultados tendrían que ser parecidos a los del dreambooth, sin que el resto del modelo este afectado por esos pesos, con la modularidad de las inversiones textuales, a costa de que el archivo resultante es mas grande, y un entrenamiento mas lento
Esta nueva función en si es polémica por un drama que unos se acusan de copiar a otros debido a una filtración del código y modelo de una empresa privada, cuando se supone que ese código de la función es publico y anterior a todo eso. El reddit estos dias esta siendo puro drama. @visualito@thorin@iveldie
www.reddit.com/r/StableDiffusion/comments/xwdj79/dreambooth_training_i
@visualito @ElSev @iveldie