{"id":126082,"date":"2023-12-26T18:53:39","date_gmt":"2023-12-26T16:53:39","guid":{"rendered":"https:\/\/quondos.com\/mag\/?p=126082"},"modified":"2023-12-26T18:53:40","modified_gmt":"2023-12-26T16:53:40","slug":"videopoetque-es-la-ultima-creacion-de-google","status":"publish","type":"post","link":"https:\/\/quondos.com\/mag\/videopoetque-es-la-ultima-creacion-de-google\/","title":{"rendered":"VideoPoet,\u00bfqu\u00e9 es la \u00faltima creaci\u00f3n de Google?"},"content":{"rendered":"\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"514\" src=\"https:\/\/quondos.com\/mag\/wp-content\/uploads\/2023\/12\/Captura-de-pantalla-2023-12-26-175143-1024x514.png\" alt=\"\" class=\"wp-image-126084\" title=\"\" srcset=\"https:\/\/quondos.com\/mag\/wp-content\/uploads\/2023\/12\/Captura-de-pantalla-2023-12-26-175143-1024x514.png 1024w, https:\/\/quondos.com\/mag\/wp-content\/uploads\/2023\/12\/Captura-de-pantalla-2023-12-26-175143-300x151.png 300w, https:\/\/quondos.com\/mag\/wp-content\/uploads\/2023\/12\/Captura-de-pantalla-2023-12-26-175143-768x385.png 768w, https:\/\/quondos.com\/mag\/wp-content\/uploads\/2023\/12\/Captura-de-pantalla-2023-12-26-175143.png 1391w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<p>\u00a1Atenci\u00f3n, amantes de la tecnolog\u00eda! <strong>Google Research acaba de presentar VideoPoet<\/strong>, un modelo de inteligencia artificial (IA) que genera videos impresionantes a partir de varios inputs. Este modelo no es cualquier cosa: se basa en un modelo de lenguaje grande (LLM), t\u00edpicamente usado para generar texto y c\u00f3digo, pero entrenado para producir videos usando una enorme base de datos de 270 millones de videos y m\u00e1s de 1 mil millones de pares texto-imagen.<\/p>\n\n<div id=\"ez-toc-container\" class=\"ez-toc-v2_0_76 counter-hierarchy ez-toc-counter ez-toc-grey ez-toc-container-direction\">\n<div class=\"ez-toc-title-container\">\n<p class=\"ez-toc-title\" style=\"cursor:inherit\">\u00cdndice de contenidos<\/p>\n<span class=\"ez-toc-title-toggle\"><a href=\"#\" class=\"ez-toc-pull-right ez-toc-btn ez-toc-btn-xs ez-toc-btn-default ez-toc-toggle\" aria-label=\"Alternar tabla de contenidos\"><span class=\"ez-toc-js-icon-con\"><span class=\"\"><span class=\"eztoc-hide\" style=\"display:none;\">Toggle<\/span><span class=\"ez-toc-icon-toggle-span\"><svg style=\"fill: #999;color:#999\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" class=\"list-377408\" width=\"20px\" height=\"20px\" viewBox=\"0 0 24 24\" fill=\"none\"><path d=\"M6 6H4v2h2V6zm14 0H8v2h12V6zM4 11h2v2H4v-2zm16 0H8v2h12v-2zM4 16h2v2H4v-2zm16 0H8v2h12v-2z\" fill=\"currentColor\"><\/path><\/svg><svg style=\"fill: #999;color:#999\" class=\"arrow-unsorted-368013\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"10px\" height=\"10px\" viewBox=\"0 0 24 24\" version=\"1.2\" baseProfile=\"tiny\"><path d=\"M18.2 9.3l-6.2-6.3-6.2 6.3c-.2.2-.3.4-.3.7s.1.5.3.7c.2.2.4.3.7.3h11c.3 0 .5-.1.7-.3.2-.2.3-.5.3-.7s-.1-.5-.3-.7zM5.8 14.7l6.2 6.3 6.2-6.3c.2-.2.3-.5.3-.7s-.1-.5-.3-.7c-.2-.2-.4-.3-.7-.3h-11c-.3 0-.5.1-.7.3-.2.2-.3.5-.3.7s.1.5.3.7z\"\/><\/svg><\/span><\/span><\/span><\/a><\/span><\/div>\n<nav><ul class='ez-toc-list ez-toc-list-level-1 ' ><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-1\" href=\"https:\/\/quondos.com\/mag\/videopoetque-es-la-ultima-creacion-de-google\/#%C2%BFComo_funciona_VideoPoet\" >\u00bfC\u00f3mo funciona VideoPoet?<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-2\" href=\"https:\/\/quondos.com\/mag\/videopoetque-es-la-ultima-creacion-de-google\/#%C2%BFPor_que_VideoPoet_es_mejor\" >\u00bfPor qu\u00e9 VideoPoet es mejor?<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-3\" href=\"https:\/\/quondos.com\/mag\/videopoetque-es-la-ultima-creacion-de-google\/#Comparacion_con_otros_modelos\" >Comparaci\u00f3n con otros modelos<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-4\" href=\"https:\/\/quondos.com\/mag\/videopoetque-es-la-ultima-creacion-de-google\/#Orientacion_y_disponibilidad_de_VideoPoet\" >Orientaci\u00f3n y disponibilidad de VideoPoet<\/a><\/li><\/ul><\/nav><\/div>\n<h2><span class=\"ez-toc-section\" id=\"%C2%BFComo_funciona_VideoPoet\"><\/span>\u00bfC\u00f3mo funciona VideoPoet?<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p><strong>VideoPoet se basa en la arquitectura transformer<\/strong>, un dise\u00f1o de red neuronal que facilita un aprendizaje eficiente y flexible de datos secuenciales. Convierte los datos de entrada en incrustaciones de texto, tokens visuales y tokens de audio, y los usa como \u00abcondiciones\u00bb para generar el video de salida. Por ejemplo, si el input es una descripci\u00f3n textual, crear\u00e1 un video que coincida con esa descripci\u00f3n.<\/p>\n<p>Seg\u00fan la fuente, esto lo diferencia de la mayor\u00eda de los modelos de generaci\u00f3n de videos actuales, que utilizan m\u00e9todos basados en difusi\u00f3n. Estos modelos empiezan con un modelo de imagen preentrenado que produce im\u00e1genes de alta fidelidad para cuadros individuales y luego ajustan el modelo para mejorar la consistencia temporal entre cuadros de video. Sin embargo, <strong>los modelos basados en difusi\u00f3n a menudo tienen problemas<\/strong> para producir movimientos grandes coherentes y tienden a generar artefactos o fallos cuando el movimiento es demasiado grande o complejo.<\/p>\n\n\n\n\n\n\n<figure class=\"wp-block-image size-large\"><img decoding=\"async\" src=\"https:\/\/cms.techdogs.com\/\/getattachment\/Tech-News\/TechDogs_NewsDesk\/2023\/Dec\/21\/Google%E2%80%99s-VideoPoet-Adds-A-New-Verse-To-AI-Video-Ge\/1.gif.aspx\" alt=\"\" title=\"\"><\/figure>\n\n\n\n<h2><span class=\"ez-toc-section\" id=\"%C2%BFPor_que_VideoPoet_es_mejor\"><\/span>\u00bfPor qu\u00e9 VideoPoet es mejor?<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Por otro lado, <strong>VideoPoet puede generar movimientos m\u00e1s grandes y consistentes<\/strong> en videos m\u00e1s largos de 16 cuadros, sin comprometer la calidad o el realismo del video. Tambi\u00e9n puede simular diferentes movimientos de c\u00e1mara, estilos visuales y est\u00e9ticos, e incluso generar audio nuevo para que coincida con el video. Adem\u00e1s, puede manejar una variedad de inputs, incluyendo texto, im\u00e1genes y videos, y usarlos como prompts para generar nuevos videos.<\/p>\n<p>Es una soluci\u00f3n integral para la creaci\u00f3n de videos, ya que integra todas estas capacidades de generaci\u00f3n de videos dentro de un solo LLM. Esto elimina la necesidad de m\u00faltiples componentes especializados, ofreciendo una experiencia <strong>vers\u00e1til y sin fisuras<\/strong> para los usuarios.<\/p>\n\n<h2><span class=\"ez-toc-section\" id=\"Comparacion_con_otros_modelos\"><\/span>Comparaci\u00f3n con otros modelos<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>El equipo de Google Research ha demostrado los impresionantes resultados de VideoPoet en su paper de pre-revisi\u00f3n y en su blog. Tambi\u00e9n han comparado VideoPoet con otros modelos de generaci\u00f3n de videos, como Source-1, VideoCrafter y Phenaki, que utilizan m\u00e9todos basados en difusi\u00f3n. Mostraron clips de video generados por VideoPoet y los modelos competidores a evaluadores humanos, <strong>quienes prefirieron VideoPoet en la mayor\u00eda de los casos<\/strong>.<\/p>\n<p>Seg\u00fan el blog de Google Research: \u00abEn promedio, las personas seleccionaron entre el 24-35% de los ejemplos de VideoPoet como mejores en seguimiento de los prompts en comparaci\u00f3n con un 8-11% para los modelos competidores. Los evaluadores tambi\u00e9n prefirieron entre el 41-54% de los ejemplos de VideoPoet por su movimiento m\u00e1s interesante en comparaci\u00f3n con el 11-21% para otros\u00bb.<\/p>\n\n<h2><span class=\"ez-toc-section\" id=\"Orientacion_y_disponibilidad_de_VideoPoet\"><\/span>Orientaci\u00f3n y disponibilidad de VideoPoet<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>VideoPoet est\u00e1 dise\u00f1ado para producir videos en orientaci\u00f3n vertical por defecto, atendiendo al mercado de videos m\u00f3viles popularizado por Snap y TikTok. Sin embargo, el equipo de Google Research tiene planes de expandir las capacidades de VideoPoet para soportar tareas de generaci\u00f3n \u00abde cualquier a cualquier\u00bb, como texto-a-audio y audio-a-video, <strong>ampliando as\u00ed los l\u00edmites de lo posible<\/strong> en la generaci\u00f3n de video y audio.<\/p>\n<p>La \u00fanica desventaja es que <strong>actualmente no est\u00e1 disponible para uso p\u00fablico<\/strong>. El equipo de Google Research no ha anunciado cu\u00e1ndo se lanzar\u00e1 ni c\u00f3mo se integrar\u00e1 con los productos y servicios de Google. Hasta entonces, tendremos que esperar ansiosamente su llegada para ver c\u00f3mo se compara con otras herramientas en el mercado.<\/p>\n\n\n\n\n<p>Fuente:https:\/\/hyscaler.com\/insights\/videopoet-googles-new-ai-for-video-generation\/<\/p>\n","protected":false},"excerpt":{"rendered":"<p>\u00a1Atenci\u00f3n, amantes de la tecnolog\u00eda! Google Research acaba de presentar VideoPoet, un modelo de inteligencia artificial (IA) que genera videos &#8230; <\/p>\n<p class=\"read-more-container\"><a title=\"VideoPoet,\u00bfqu\u00e9 es la \u00faltima creaci\u00f3n de Google?\" class=\"read-more button\" href=\"https:\/\/quondos.com\/mag\/videopoetque-es-la-ultima-creacion-de-google\/#more-126082\" aria-label=\"Leer m\u00e1s sobre VideoPoet,\u00bfqu\u00e9 es la \u00faltima creaci\u00f3n de Google?\">Leer m\u00e1s<\/a><\/p>\n","protected":false},"author":850,"featured_media":126084,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1474],"tags":[],"class_list":["post-126082","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-inteligencia-artificial","generate-columns","tablet-grid-50","mobile-grid-100","grid-parent","grid-50","no-featured-image-padding"],"_links":{"self":[{"href":"https:\/\/quondos.com\/mag\/wp-json\/wp\/v2\/posts\/126082","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/quondos.com\/mag\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/quondos.com\/mag\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/quondos.com\/mag\/wp-json\/wp\/v2\/users\/850"}],"replies":[{"embeddable":true,"href":"https:\/\/quondos.com\/mag\/wp-json\/wp\/v2\/comments?post=126082"}],"version-history":[{"count":2,"href":"https:\/\/quondos.com\/mag\/wp-json\/wp\/v2\/posts\/126082\/revisions"}],"predecessor-version":[{"id":126085,"href":"https:\/\/quondos.com\/mag\/wp-json\/wp\/v2\/posts\/126082\/revisions\/126085"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/quondos.com\/mag\/wp-json\/wp\/v2\/media\/126084"}],"wp:attachment":[{"href":"https:\/\/quondos.com\/mag\/wp-json\/wp\/v2\/media?parent=126082"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/quondos.com\/mag\/wp-json\/wp\/v2\/categories?post=126082"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/quondos.com\/mag\/wp-json\/wp\/v2\/tags?post=126082"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}