Recursos para usar Stable Diffusion

Written on October 24, 2022

“Una imagen vale más que mil palabras” ― Kurt Tucholsky

0. Consejos si vas a lo kamikaze

  • Si vas a usar Google Colab, créate una cuenta nueva de Google porque te va a crear muchos ficheros en tu Drive. Unos 4-5 GB más las imágenes que vayas generando, que se guardarán en tu Drive.

  • Para tener imágenes en poco tiempo, genera imágenes con pocos pasos, yo uso 20 y cuando encuentres algo que te guste, genéralas con la misma semilla pero con 40-50 pasos para tener mejores imágenes.

  • Genera imágenes en resoluciones no más grandes de 768px. Luego puede usar modelos ESRGAN para subir la resolución de esas imágenes x4 e incluso x8. La mayoría de GUIs de Stable Diffusion lo traen integrado.

  • Si quieres mejorar las caras pasa tu imagen generada pásala por un modelo GFPGAN. La mayoría de GUIs de Stable Diffusion lo traen integrado.

TLTR

Índice

  1. ¿Qué son los modelos text to image?
  2. ¿Qué son los modelos de difusión?
  3. Historia
  4. La velocidad cambia con la liberación de Stable Diffusion
  5. Documentación oficial
  6. Aplicaciones con las que puedes usar Stable Diffusion
  7. Tutoriales
  8. Notebooks de Google Colab que puedes usar gratis
  9. Ayudas para generar buenos prompts
  10. ¿Qué es Dreambooth?
  11. Glosario
  12. Métodos de sampling que he probado hasta ahora

1. ¿Qué son los modelos text to image?

2. ¿Qué son los modelos de difusión?

3. Historia

  • La mayor parte está extraída de este video: # ¡Y AHORA la IA también crea VÍDEOS y MODELOS 3D! (de DALL-E 2 a DreamFusion)

  • 2018 - GPT-1

  • 2019 - GPT-2

  • 2020 - GPT-3

  • Enero 2021 - DALL-E

  • Abril 2022 - DALL-E 2

  • Mayo 2022 - Imagen de Google

  • Agosto 2022 - Stable Diffusion revienta el mercado porque es el primer modelo de este tipo Open Source de verdad.
    • En ML necesitas, el código, los datos y poder entrenar el modelo en una máquina que no te hipoteque para toda la vida…
    • Hasta ahora, modelos similares sólo liberaban el código y necesitabas conseguir datos y máquinas muy grandes para los entrenos.
    • En muchos casos solo se publica el paper sin código con las explicación de como lo han hecho.
    • Pero Stability.ai publica el modelo Stable Diffusion, los datos y es entrenable en máquinas accesible para usuarios particulares.
    • Detrás de Stable Diffusion está un multimillonario conocido como Emad.
  • Agosto 2022 - Se publica DreamBooth de Google. Explica cómo reentrenar modelos de difusión con muy pocas imágenes.
    • Solo se publica el paper sin código [https://dreambooth.github.io/(https://dreambooth.github.io/](https://dreambooth.github.io/(https://dreambooth.github.io/)

4. La velocidad cambia con la liberación de Stable Diffusion

5. Documentación oficial

6. Aplicaciones con las que puedes usar Stable Diffusion

7. Tutoriales

8. Notebooks de Google Colab que puedes usar gratis

9. Ayudas para generar buenos prompts

10. ¿Qué es Dreambooth?

11. Glosario

12. Métodos de sampling que he probado hasta ahora

  • Euler a: más artísitico

  • Euler: más realista

  • LMS: Falla con cosas realistas

  • Heun: colores más estridentes

  • DPM Fast: Muy loco

Written on October 24, 2022