Genmo presenta Mochi 1, el nuevo modelo Open Source de IA para videos

Genmo presenta Mochi 1, el nuevo modelo Open Source de IA para videos 2

La empresa de inteligencia artificial Genmo ha sorprendido al mercado con el lanzamiento de Mochi 1, un modelo de código abierto que genera videos de alta calidad a partir de texto.

Mochi 1: un avance en la generación de videos

Mochi 1 es un innovador modelo que permite crear videos de alta calidad basados en indicaciones de texto. Según la fuente, su rendimiento es equiparable o superior al de competidores de código cerrado como Gen-3 Alpha de Runway o Dream Machine de Luma AI.

Lo más llamativo es que Mochi 1 está disponible bajo licencia Apache 2.0, lo que brinda acceso gratuito a tecnologías de vanguardia. Esto contrasta con otros modelos que pueden costar hasta $94.99 al mes.

Además, Genmo ofrece un espacio de experimentación en línea para que los usuarios puedan explorar las características de Mochi 1 de primera mano.

Características y promesas futuras

Actualmente, Mochi 1 ofrece videos en calidad 480p, pero la empresa promete lanzar una versión en alta definición, llamada Mochi 1 HD, más adelante en el año.

Videos iniciales compartidos muestran paisajes y movimientos sorprendentemente realistas, especialmente en escenas con sujetos humanos, como el video de una anciana que se ha difundido.

Según la fuente, Genmo ha enmarcado a Mochi 1 como una solución que reduce la brecha entre los modelos de generación de video abiertos y cerrados.

Superando a la competencia

Mochi 1 destaca en seguir instrucciones detalladas del usuario, permitiendo un control preciso sobre personajes, escenarios y acciones en los videos generados.

En pruebas internas, Genmo afirma que Mochi 1 supera a la mayoría de los modelos de IA de video, incluidos competidores como Runway y Luna, en cuanto a fidelidad a las indicaciones y calidad del movimiento.

Esto representa un avance significativo en el campo de la inteligencia artificial y la generación de contenido multimedia.

Financiación y visión a futuro

Paralelamente al lanzamiento de Mochi 1, Genmo ha anunciado una ronda de financiación Serie A de $28.4 millones, liderada por NEA y otros inversores destacados.

Esta inversión respalda la visión de Genmo de avanzar en la generación de videos y desarrollar tecnologías que impulsen el futuro de la inteligencia artificial en general.

La empresa está trabajando en capacidades de síntesis de imagen a video y en mejorar el control que los usuarios tienen sobre los resultados.

Detalles técnicos de Mochi 1

La arquitectura de Mochi 1 se basa en la estructura Asymmetric Diffusion Transformer (AsymmDiT), con 10 mil millones de parámetros.

Esto lo convierte en el modelo de generación de video de código abierto más grande jamás lanzado. La eficiencia es clave en su diseño, empleando un codificador-decodificador variacional de video que comprime los datos a una fracción de su tamaño original.

Esto lo hace accesible para la comunidad de desarrolladores y abre nuevas posibilidades en el campo.

Limitaciones actuales y mejoras futuras

A pesar de ser una versión preliminar, Mochi 1 presenta algunas limitaciones, como soporte únicamente de resolución 480p y posibles distorsiones visuales en movimientos complejos.

No obstante, Genmo planea lanzar Mochi 1 HD este año para mejorar la calidad de movimiento y ofrecer resolución 720p.

La empresa está comprometida en mejorar la capacidad de control del modelo para brindar a los usuarios mayor precisión en los resultados.

Aplicaciones y oportunidades

La liberación de Mochi 1 abre nuevas posibilidades en diversas industrias: desde investigación en tecnologías de generación de video hasta aplicaciones en entretenimiento, publicidad y educación.

Además, Mochi 1 puede utilizarse para generar datos sintéticos en el entrenamiento de modelos de IA en robótica y sistemas autónomos.

Según la fuente, esto podría revolucionar la forma en que se desarrollan y entrenan estos sistemas.

Invitación a explorar Mochi 1

Genmo invita a los usuarios a probar la versión preliminar de Mochi 1 a través de su espacio de experimentación en línea.

Aunque al momento de redactar este artículo, la URL no cargaba correctamente, la empresa está trabajando en ello.

Como parte de su desarrollo continuo, Genmo busca talento para unirse a su equipo de investigación y seguir avanzando en la generación de videos y en su visión del futuro de la inteligencia artificial.

Fuente: https://zengwt.medium.com/mochi-1-the-new-open-source-ai-video-model-by-genmo-ai-thats-changing-the-game-1e73accae52c


También podría ser de tu interés:

Deja un comentario