128 meneos
3901 clics
Crear imágenes con VQGAN+CLIP
VQGAN es una Red Generativa Antagónica. Estas redes son una clase de algoritmos de inteligencia artificial que se utilizan en el aprendizaje no supervisado, implementadas por un sistema de dos redes neuronales que compiten mutuamente en una especie de juego de suma cero. Esta técnica puede generar imágenes que parecen auténticas a humanos. CLIP es otra inteligencia artificial que permite transformar textos en imágenes. Es decir, en VQGAN+CLIP, CLIP introduce entradas de texto a VQGAN. Aquí te explicamos cómo usarlo.
|
comentarios cerrados
Justificación para realizar este envío.
* Iba a publicar esto en formato artículo de menéame. Sin embargo, la edición de los artículos es mucho más limitada que el código wiki.
* Permite modificación futura. Es decir, a diferencia de mis artículos publicados anteriormente aquí, que tienen detalles obsoletos, podré ir modificando el texto en el futuro si fuera necesario.
* Permite edición colaborativa. De hecho la mayoría del artículo está maquetado y realizado por un colaborador (Avengium). Algo imposible en menéame.
* De las normas:
No tiene nada de malo enviar del propio blog; pero es mejor enviar sólo los artículos que consideres más interesantes y no abusar, procurando que la proporción de envíos de tu blog sea baja respecto al total de tus envíos.
Considero este envío interesante y es más que la suma de los artículos y vídeos que hemos usado para realizarlo (disponibles en el apartado "Enlaces externos"). Miraheze no tiene publicidad y la temática del resto de la wiki no trata de tecnología.
* Se aceptan correcciones y dudas (también si os da algún error, se puede buscar e incluir la solución).
** Incluso se aceptan ediciones directas de la wiki (obviamente siempre que no sean vandálicas).
* Eli versión IA es muy mono.
Un saludo
sigo una cuenta en Twitter que hizo varias y flipo como una AI puede llegar a esas conclusiones twitter.com/reparafoto/status/1402343018049454084
esta me dejo ojiplatico cuando puso de input la letra de la canción "nómadas" Franco Battiato
el resultado es flipante! que una AI pueda interpretar el significado de la cancion y crearte un cuadro!!
twitter.com/reparafoto/status/1399143503465222146
Pero sí, ojalá hubiera eso.
Yo lo que quiero es intentar instalarlo en mi propio ordenador, parece compatible todo.
Eso también lo pondré en su momento en la wiki.
NVIDIA-SMI 465.27 Driver Version: 460.32.03 CUDA Version: 11.2 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|===============================+======================+======================|
| 0 Tesla T4 Off | 00000000:00:04.0 Off | 0 |
| N/A 48C P8 10W / 70W | 0MiB / 15109MiB | 0% Default |
| | | N/A |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage
Parece que una Nvidia Tesla T4
Pero no me he fijado en si todas la máquinas son iguales o no.
Yo en mi ordenador no podría usarlo porque me sale esto:
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.
Creo que necesito activar alguna cosa. Pero nunca tengo tiempo de buscar.
y va y una AI en el siglo donde estoy viviendo (no dentro de 300 años) te hace una reinterpretación artística de una canción de Batiato bastante conseguía
flipé cuando lo vi
En su momento se llamaban contextopedias.
En meneame se negativiza mal y al primer envio propio le ponen spam, cuando las normas no lo consideran SPAM.
dot_csv tambien hablo d CLIP
www.youtube.com/watch?v=90QDe6DQXF4
www.youtube.com/watch?v=0BW9W9cuwR0
#12 #20 Al final todo son procesos matematicos tanto en cerebro como en maquinas.
Sobre dot_csv ya teníamos el primer vídeo enlazado. Ahora añadiré el segundo, gracias.
si ves apropiado puedes poner el de dall-e
www.youtube.com/watch?v=ztvtcKDrSwM
"fractal atom in unreal engine". 500 iteraciones
"mind machine da vinci draw". 400 iteraciones
Deep dream es anterior. No sé si se han adaptado para incluir también VQGAN pero el algoritmo deepdream original es otra cosa. Es bastante similar en el sentido de que permite transferencia de estilos, pero VQGAN+CLIP es totalmente otro nivel.
vale, sí, se han adaptado. A ver cuanto tarda deepdreamgenerator y resto de webs en subirse al tren.
En español, discord: discord.com/invite/bdH6swK4TJ
El discord donde está compartiendo la gente sus resultados es discord.com/invite/bdH6swK4TJ por si alguien quiere mostrar sus creaciones
cc #41 #15 #7 #13 #30 #5
Mañana debería funcionar de nuevo.