Última actualización el 3 de abril de 2023
Stable Diffusion es uno de los mejores generadores de imágenes de IA, que ayuda a millones de usuarios a crear imágenes contra sus mensajes de texto. No se preocupe, si usa Stable Diffusion sin estar familiarizado con este hecho, no se preocupe.
La siguiente lectura le informará al respecto.
¿Cómo se entrena la difusión estable?
La difusión estable es solo otro procesador de lenguaje neural de IA. Funciona mediante el procesamiento de las indicaciones de texto humano para crear una imagen que se asemeje mejor que lo represente. LAION construyó sus conjuntos de datos de imágenes a partir de common crawl, otra organización sin fines de lucro.
¿Qué es el proceso de recopilación de datos?
LAION recopila todas las etiquetas de imágenes de HTML que presentan atributos de texto alternativos. Posteriormente, clasificó los 5 mil millones de pares de imágenes según su idioma general.
Luego comenzó a filtrar los conjuntos de datos según su resolución, marcas de agua y puntajes estéticos previstos.
Entrenamiento inicial
El entrenamiento inicial de Stable Diffusion fue en imágenes de baja resolución de 256 × 256 píxeles. Más tarde se actualizó a la alta resolución de LAION, un subconjunto de LAION-5b, y tenía 170 millones de imágenes con una resolución de más de 1024 × 1024 píxeles. Sin embargo, todos se redujeron más tarde a 512 × 512 debido a los resultados de eficiencia.
¿Sería posible ejecutar Stable Diffusion con una GPU?
Sí, puede ejecutar Stable Diffusion sin una GPU de algunas maneras posibles. Por ejemplo, se puede usar con DreamStudio, que está en línea y no requiere actualizaciones de hardware para funcionar sin problemas.
Conclusión
Stable Diffusion usa diferentes conjuntos de datos, palabras clave, artistas y personajes. Dado que la tecnología de IA no puede hacer nada de forma independiente, aún necesita datos de entrada cuyo tamaño importa. Sin embargo, es de código abierto y muy flexible de usar al alcance de todos.