Stable Diffusion 3.5: nuevos modelos y funciones mejoradas

Stable Diffusion 3.5: nuevos modelos y funciones mejoradas 2

¿Te has enterado de la última novedad en el mundo de la inteligencia artificial? Según la fuente, Stability AI ha lanzado Stable Diffusion 3.5, buscando redimirse tras el tropiezo con SD3 Medium.

Stability AI se redime con Stable Diffusion 3.5

Después de la decepción que fue SD3 Medium, Stability AI está de vuelta con el lanzamiento de dos nuevos modelos: Stable Diffusion 3.5 Large y Stable Diffusion 3.5 Large Turbo. Según la fuente, estos modelos prometen ser más rápidos, personalizables y accesibles para todos.

La empresa reconoció que la versión anterior no cumplió con las expectativas y decidió tomarse el tiempo para desarrollar una versión mejorada. Ahora, con Stable Diffusion 3.5, buscan avanzar en su misión de transformar los medios visuales.

Modelos diseñados para sistemas de consumo

Los nuevos modelos están diseñados para funcionar en equipos de gama baja, lo que hace que la generación de imágenes avanzadas sea más accesible que nunca. Esto significa que incluso si no tienes una supercomputadora, podrás aprovechar las capacidades de estos modelos.

Además, Stability AI ha introducido una licencia más permisiva que permite tanto el uso comercial como no comercial. Las pequeñas empresas y personas que generen menos de $1,000,000 en ingresos con la herramienta pueden usar y desarrollar estos modelos de forma gratuita.

Tres versiones para diferentes necesidades

Stability AI está lanzando tres versiones de Stable Diffusion 3.5, cada una adaptada a distintas necesidades:

  • Stable Diffusion 3.5 Large: Con 8 mil millones de parámetros, ofrece una calidad de imagen superior y una adherencia estricta al prompt. Ideal para uso profesional a una resolución de 1 megapíxel.
  • Stable Diffusion 3.5 Large Turbo: Una versión destilada que sacrifica un poco de calidad por velocidad, generando imágenes de alta calidad en solo cuatro pasos.
  • Stable Diffusion 3.5 Medium: Próximamente, con 2.5 mil millones de parámetros, optimizado para hardware de consumo y un equilibrio entre rendimiento y facilidad de personalización.

Estos modelos son más flexibles, permitiendo a los usuarios ajustarlos para necesidades creativas específicas. Según la fuente, incluso en equipos modestos como una RTX 2060 con 6GB de VRAM, se pueden generar imágenes en tiempos razonables.

Mejoras significativas bajo el capó

Stability AI ha reimaginado cómo se comporta Stable Diffusion 3.5 para mejorar la experiencia del usuario. Han integrado la Normalización de Consulta-Clave en los bloques transformadores, estabilizando el proceso de entrenamiento y facilitando el ajuste fino y desarrollo.

Esto significa que puedes ajustar y refinar estos modelos más fácilmente que antes, ya seas un artista que busca crear estilos personalizados o un desarrollador interesado en construir una aplicación impulsada por IA.

Adherencia al prompt y calidad de imagen mejoradas

Según la fuente, el modelo Large ahora compite con modelos mucho más grandes en cuanto a lo bien que sigue la entrada del usuario. Lidera en el mundo de los generadores de imágenes en términos de adherencia al prompt y ofrece una calidad de imagen que rivaliza con modelos más exigentes.

Además, Stable Diffusion 3.5 es versátil en estilos, manejando desde renders en 3D hasta imágenes fotorrealistas y estilos de pintura. Esto permite a los usuarios ser creativos sin necesidad de conocimientos avanzados en lingüística.

Un modelo sin censura

Es importante mencionar que Stable Diffusion 3.5 es sin censura. Puede producir ciertos tipos de contenido, incluida la desnudez, ofreciendo a los usuarios total libertad creativa. Sin embargo, puede ser necesario ajustar y crear prompts específicos para obtener los mejores resultados.

Según la fuente, aunque el modelo no está al mismo nivel que los mejores ajustes finos de otros modelos, es comparable a los modelos originales y ofrece mejoras significativas en la comprensión de la anatomía.

Próximos pasos y expectativas

El 29 de octubre se lanzará Stable Diffusion 3.5 Medium, y poco después, Stability AI prometió lanzar Control Nets para SD 3.5. Estos permitirán funciones de control avanzadas, diseñadas para casos de uso profesionales.

Con Control Nets, los usuarios podrán hacer cosas como elegir la pose de su sujeto, jugar con mapas de profundidad y reimaginar una escena basada en un boceto. Esto podría llevar la potencia de Stable Diffusion 3.5 al siguiente nivel.

Conclusión

En resumen, Stability AI está aprendiendo de errores pasados y avanzando hacia un futuro donde las herramientas de IA avanzada sean más accesibles para todos. Stable Diffusion 3.5 ofrece mejoras significativas en adherencia al prompt, calidad de imagen y versatilidad.

Si bien no es perfecto, este lanzamiento marca un gran avance en la generación de imágenes por IA. Según la fuente, es difícil argumentar que este no es un paso importante hacia la democratización de la inteligencia artificial en el ámbito creativo.

Fuente: https://stability.ai/news/introducing-stable-diffusion-3-5


También podría ser de tu interés:

Deja un comentario