edición general
  1. @Nadieenespecial Parece que hay soluciones que juegan entre la RAM y la VRAM, permitiendo que VRAM de 8gbs

    www.reddit.com/r/StableDiffusion/comments/xwdj79/dreambooth_training_i

    @visualito @ElSev @iveldie
  1. @thorin Ya lo he visto. A cambio de 25GB d ram, casualmente solo tengo 24 :shit:
    Ya llegara, y total, tampoco tengo nada sobre lo que entrenar, estoy haciendo una inversión textual, con unas imágenes de prueba, y como pensaba, las imágenes de entrenamiento, o sus etiquetas son una mierda

    @visualito @ElSev @iveldie
    1. @Nadieenespecial

      A mi me sirve, tengo una RTX 2060 con 12 GB de VRAM y 64GB de RAM en el equipo

      @thorin @ElSev @iveldie
      1. @Nadieenespecial Pues yo ya me estoy haciendo a Dreambooth+Colab.
        Lo más difícil que encuentro es hacer una selección buena de fotos que luego den buen resultado.

        Se me acabaron los créditos de Colab, pero no noto diferencia. Hoy, mientras trabajaba, he creado 3 modelos a la misma velocidad que antes.

        Lo del drama de Reddit no acabo de pillarlo, pero tengo claro que Emad es un poco idiota gracias a comentarios como este: i.redd.it/l5lv71rcbdt91.png Menos mal que gracias al software libre hay muchas cosas que no están bajo control.

        Por cierto, esta página me ha ayudado muco para crear los modelos: www.birme.net/?target_width=512&target_height=512 Es un modo muy fácil de hacer las imágenes a 512X512, que se supone que son las óptimas para la creación de modelos.

        @visualito @iveldie
      2. @Nadieenespecial @visualito @iveldie Por cierto, un truco que parece funcionar para Dreambooth.
        Al crear el modelo tienes que ponerle el nombre del sujeto, por ejemplo "panchoelnegro" y la categoría "gato".

        Luego a la hora de generar la imagen artificial a partir del modelo sale mejor si mencionas las dos palabras palabras juntas: "Foto de panchoelnegro gato encima de una silla, estilo de Picasso".
        Si es un coche, sería poner "pintura de fordjag coche, por Robert Capa". Etc..

        O esa es la impresión de mucha gente.
      3. @thorin En los powertoys, que es unas utilidades de microsoft para windows, que hay que instalarlas aparte ya hay un reescalador masivo de archivos. learn.microsoft.com/en-us/windows/powertoys/
        Recomiendo siempre instalarlos, tienen unas cuantas muy útiles.

        @visualito Ese no lo vemos a este paso, la comunidad esta a ver si se organiza para hacer sus propios modelos


        @iveldie
      4. @Nadieenespecial Lo estuve mirando, pero ese lo que hace es deformar la imagen, con lo que el resultado del modelo es malo.
        Con Birme puedes seleccionar qué recortar de la imagen para que encaje en la medida deseada, sin distorsionar.

        Hoy probé a hacer un modelo usando 200 imágenes y fue muy rápido para optimizarlas.


        @visualito @iveldie
    2. @visualito Pero de 12 ya hacia un par de días que había bajado, creo, es difícil seguir todo el progreso técnico.

      Si usáis el webui de automatic han añadido el comando "AND" permitiendo fusionar 2 entradas de texto old.reddit.com/r/StableDiffusion/comments/xwplfv/and_prompt_combinatio
      En 4chan, que es donde se esta desarrollando hay algún ejemplo útil de la diferencia boards.4channel .org/g/thread/89013562#p89014696


      @thorin @ElSev @iveldie
    3. Ahora han añadido los hypernetworks a la UI del automatic, que si he entendido bien, significa que puedes reentrenar un modelo, como con el dreambooth, pero generando un archivo que extiende ese modelo.
      Se supone que los resultados tendrían que ser parecidos a los del dreambooth, sin que el resto del modelo este afectado por esos pesos, con la modularidad de las inversiones textuales, a costa de que el archivo resultante es mas grande, y un entrenamiento mas lento

      Esta nueva función en si es polémica por un drama que unos se acusan de copiar a otros debido a una filtración del código y modelo de una empresa privada, cuando se supone que ese código de la función es publico y anterior a todo eso. El reddit estos dias esta siendo puro drama.
      @visualito @thorin @iveldie
      1. @Nadieenespecial tiene que ver con playground ai? Tienen un dalle 2 que no sé de donde sale
    4. @Nadieenespecial

      Y todo el mundo esperando Stable Diffusion 1.5

      @thorin @iveldie

    menéame