{"id":126334,"date":"2024-02-05T17:30:52","date_gmt":"2024-02-05T15:30:52","guid":{"rendered":"https:\/\/quondos.com\/mag\/?p=126334"},"modified":"2024-02-05T17:30:52","modified_gmt":"2024-02-05T15:30:52","slug":"google-presenta-mobilediffusion-genera-en-menos-de-un-segundo-texto-a-imagen-en-el-movil","status":"publish","type":"post","link":"https:\/\/quondos.com\/mag\/google-presenta-mobilediffusion-genera-en-menos-de-un-segundo-texto-a-imagen-en-el-movil\/","title":{"rendered":"Google presenta MobileDiffusion, genera (en menos de un segundo) texto a imagen en el m\u00f3vil"},"content":{"rendered":"\n<p><\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"768\" src=\"https:\/\/quondos.com\/mag\/wp-content\/uploads\/2024\/02\/image1-1024x768.png\" alt=\"\" class=\"wp-image-126337\" title=\"\" srcset=\"https:\/\/quondos.com\/mag\/wp-content\/uploads\/2024\/02\/image1-1024x768.png 1024w, https:\/\/quondos.com\/mag\/wp-content\/uploads\/2024\/02\/image1-300x225.png 300w, https:\/\/quondos.com\/mag\/wp-content\/uploads\/2024\/02\/image1-768x576.png 768w, https:\/\/quondos.com\/mag\/wp-content\/uploads\/2024\/02\/image1-1536x1152.png 1536w, https:\/\/quondos.com\/mag\/wp-content\/uploads\/2024\/02\/image1.png 1728w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<div id=\"ez-toc-container\" class=\"ez-toc-v2_0_76 counter-hierarchy ez-toc-counter ez-toc-grey ez-toc-container-direction\">\n<div class=\"ez-toc-title-container\">\n<p class=\"ez-toc-title\" style=\"cursor:inherit\">\u00cdndice de contenidos<\/p>\n<span class=\"ez-toc-title-toggle\"><a href=\"#\" class=\"ez-toc-pull-right ez-toc-btn ez-toc-btn-xs ez-toc-btn-default ez-toc-toggle\" aria-label=\"Alternar tabla de contenidos\"><span class=\"ez-toc-js-icon-con\"><span class=\"\"><span class=\"eztoc-hide\" style=\"display:none;\">Toggle<\/span><span class=\"ez-toc-icon-toggle-span\"><svg style=\"fill: #999;color:#999\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" class=\"list-377408\" width=\"20px\" height=\"20px\" viewBox=\"0 0 24 24\" fill=\"none\"><path d=\"M6 6H4v2h2V6zm14 0H8v2h12V6zM4 11h2v2H4v-2zm16 0H8v2h12v-2zM4 16h2v2H4v-2zm16 0H8v2h12v-2z\" fill=\"currentColor\"><\/path><\/svg><svg style=\"fill: #999;color:#999\" class=\"arrow-unsorted-368013\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"10px\" height=\"10px\" viewBox=\"0 0 24 24\" version=\"1.2\" baseProfile=\"tiny\"><path d=\"M18.2 9.3l-6.2-6.3-6.2 6.3c-.2.2-.3.4-.3.7s.1.5.3.7c.2.2.4.3.7.3h11c.3 0 .5-.1.7-.3.2-.2.3-.5.3-.7s-.1-.5-.3-.7zM5.8 14.7l6.2 6.3 6.2-6.3c.2-.2.3-.5.3-.7s-.1-.5-.3-.7c-.2-.2-.4-.3-.7-.3h-11c-.3 0-.5.1-.7.3-.2.2-.3.5-.3.7s.1.5.3.7z\"\/><\/svg><\/span><\/span><\/span><\/a><\/span><\/div>\n<nav><ul class='ez-toc-list ez-toc-list-level-1 ' ><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-1\" href=\"https:\/\/quondos.com\/mag\/google-presenta-mobilediffusion-genera-en-menos-de-un-segundo-texto-a-imagen-en-el-movil\/#Introduccion_a_MobileDiffusion\" >Introducci\u00f3n a MobileDiffusion<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-2\" href=\"https:\/\/quondos.com\/mag\/google-presenta-mobilediffusion-genera-en-menos-de-un-segundo-texto-a-imagen-en-el-movil\/#%C2%BFPor_que_MobileDiffusion_marca_la_diferencia\" >\u00bfPor qu\u00e9 MobileDiffusion marca la diferencia?<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-3\" href=\"https:\/\/quondos.com\/mag\/google-presenta-mobilediffusion-genera-en-menos-de-un-segundo-texto-a-imagen-en-el-movil\/#Una_Arquitectura_Innovadora\" >Una Arquitectura Innovadora<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-4\" href=\"https:\/\/quondos.com\/mag\/google-presenta-mobilediffusion-genera-en-menos-de-un-segundo-texto-a-imagen-en-el-movil\/#Optimizacion_de_la_UNet_de_Difusion\" >Optimizaci\u00f3n de la UNet de Difusi\u00f3n<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-5\" href=\"https:\/\/quondos.com\/mag\/google-presenta-mobilediffusion-genera-en-menos-de-un-segundo-texto-a-imagen-en-el-movil\/#Un_Paso_Adelante_con_DiffusionGAN\" >Un Paso Adelante con DiffusionGAN<\/a><\/li><\/ul><\/nav><\/div>\n<h2><span class=\"ez-toc-section\" id=\"Introduccion_a_MobileDiffusion\"><\/span>Introducci\u00f3n a MobileDiffusion<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>En el mundo de la tecnolog\u00eda, la generaci\u00f3n de im\u00e1genes a partir de texto es una maravilla moderna. Modelos como <b>Stable Diffusion, DALL\u00b7E, y Imagen<\/b> han demostrado ser capaces de crear im\u00e1genes de alta calidad, pero tienen un coste elevado y requieren de equipos potentes. Google trae la novedad llega con <b>MobileDiffusion<\/b>: una propuesta fresca para llevar esta tecnolog\u00eda a nuestros m\u00f3viles.<\/p>\n\n<p>Seg\u00fan la fuente, el desaf\u00edo de hacer esto realidad era enorme, debido a los modelos pesados con miles de millones de par\u00e1metros. Sin embargo, <b>MobileDiffusion<\/b> se presenta como una soluci\u00f3n eficiente, dise\u00f1ada espec\u00edficamente para dispositivos m\u00f3viles, prometiendo generar im\u00e1genes de alta calidad en menos de un segundo.<\/p>\n\n<h2><span class=\"ez-toc-section\" id=\"%C2%BFPor_que_MobileDiffusion_marca_la_diferencia\"><\/span>\u00bfPor qu\u00e9 MobileDiffusion marca la diferencia?<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Los modelos de difusi\u00f3n de texto a imagen han sido, tradicionalmente, ineficientes. Necesitan m\u00faltiples evaluaciones y tienen una arquitectura compleja, lo que resulta en un proceso computacionalmente costoso. <b>MobileDiffusion<\/b> aborda estos desaf\u00edos de frente, proponiendo un modelo con tan solo <b>520M de par\u00e1metros<\/b>, optimizado para el rendimiento en dispositivos m\u00f3viles.<\/p>\n\n<p>Las t\u00e9cnicas previas se centraban en reducir el n\u00famero de evaluaciones necesarias, pero <b>MobileDiffusion<\/b> va un paso m\u00e1s all\u00e1. Se enfoca en la eficiencia arquitect\u00f3nica, revisando cada componente del modelo para asegurar una operaci\u00f3n \u00f3ptima en dispositivos con potencia limitada.<\/p>\n\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"960\" height=\"576\" src=\"https:\/\/quondos.com\/mag\/wp-content\/uploads\/2024\/02\/image7.jpg\" alt=\"\" class=\"wp-image-126336\" title=\"\" srcset=\"https:\/\/quondos.com\/mag\/wp-content\/uploads\/2024\/02\/image7.jpg 960w, https:\/\/quondos.com\/mag\/wp-content\/uploads\/2024\/02\/image7-300x180.jpg 300w, https:\/\/quondos.com\/mag\/wp-content\/uploads\/2024\/02\/image7-768x461.jpg 768w\" sizes=\"auto, (max-width: 960px) 100vw, 960px\" \/><\/figure>\n\n\n\n<h2><span class=\"ez-toc-section\" id=\"Una_Arquitectura_Innovadora\"><\/span>Una Arquitectura Innovadora<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>El coraz\u00f3n de MobileDiffusion es su arquitectura innovadora. Compuesta por un <b>codificador de texto<\/b>, un <b>diffusion UNet<\/b> y un <b>decodificador de im\u00e1genes<\/b>, esta estructura est\u00e1 optimizada para funcionar a la perfecci\u00f3n en dispositivos m\u00f3viles. Espec\u00edficamente, utiliza un modelo CLIP-ViT\/L14 para el codificador de texto, destacando por su peque\u00f1o tama\u00f1o y eficiencia.<\/p>\n\n<p>La UNet de difusi\u00f3n es donde <b>MobileDiffusion<\/b> realmente brilla. Se ha llevado a cabo un an\u00e1lisis exhaustivo de los bloques fundamentales de esta UNet, ajustando cada aspecto para maximizar la eficiencia sin comprometer el rendimiento.<\/p>\n\n<h2><span class=\"ez-toc-section\" id=\"Optimizacion_de_la_UNet_de_Difusion\"><\/span>Optimizaci\u00f3n de la UNet de Difusi\u00f3n<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>En la UNet de difusi\u00f3n, los bloques de transformadores y convoluci\u00f3n son cruciales. <b>MobileDiffusion<\/b> los examina meticulosamente, optimizando cada pieza para reducir las operaciones y los par\u00e1metros sin sacrificar la calidad. Un enfoque clave ha sido el uso de convoluci\u00f3n separable en lugar de las capas convencionales, una estrategia probada para reducir costos computacionales.<\/p>\n\n<p>La comparaci\u00f3n con otras UNets de modelos de difusi\u00f3n muestra que <b>MobileDiffusion<\/b> es superior en t\u00e9rminos de operaciones de punto flotante (FLOPs) y n\u00famero de par\u00e1metros. Un avance significativo para llevar esta tecnolog\u00eda a la palma de nuestras manos.<\/p>\n\n<h2><span class=\"ez-toc-section\" id=\"Un_Paso_Adelante_con_DiffusionGAN\"><\/span>Un Paso Adelante con DiffusionGAN<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Adem\u00e1s de la arquitectura optimizada, <b>MobileDiffusion<\/b> introduce <b>DiffusionGAN<\/b> para lograr una generaci\u00f3n de imagen en un solo paso. Esta t\u00e9cnica h\u00edbrida comienza con un modelo de difusi\u00f3n preentrenado y utiliza GAN para el paso de desruido, simplificando y acelerando el proceso de entrenamiento.<\/p>\n\n\n\n\n<p>Fuente:https:\/\/blog.research.google\/2024\/01\/mobilediffusion-rapid-text-to-image.html<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Introducci\u00f3n a MobileDiffusion En el mundo de la tecnolog\u00eda, la generaci\u00f3n de im\u00e1genes a partir de texto es una maravilla &#8230; <\/p>\n<p class=\"read-more-container\"><a title=\"Google presenta MobileDiffusion, genera (en menos de un segundo) texto a imagen en el m\u00f3vil\" class=\"read-more button\" href=\"https:\/\/quondos.com\/mag\/google-presenta-mobilediffusion-genera-en-menos-de-un-segundo-texto-a-imagen-en-el-movil\/#more-126334\" aria-label=\"Leer m\u00e1s sobre Google presenta MobileDiffusion, genera (en menos de un segundo) texto a imagen en el m\u00f3vil\">Leer m\u00e1s<\/a><\/p>\n","protected":false},"author":850,"featured_media":126337,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1474],"tags":[],"class_list":["post-126334","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-inteligencia-artificial","generate-columns","tablet-grid-50","mobile-grid-100","grid-parent","grid-50","no-featured-image-padding"],"_links":{"self":[{"href":"https:\/\/quondos.com\/mag\/wp-json\/wp\/v2\/posts\/126334","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/quondos.com\/mag\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/quondos.com\/mag\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/quondos.com\/mag\/wp-json\/wp\/v2\/users\/850"}],"replies":[{"embeddable":true,"href":"https:\/\/quondos.com\/mag\/wp-json\/wp\/v2\/comments?post=126334"}],"version-history":[{"count":3,"href":"https:\/\/quondos.com\/mag\/wp-json\/wp\/v2\/posts\/126334\/revisions"}],"predecessor-version":[{"id":126339,"href":"https:\/\/quondos.com\/mag\/wp-json\/wp\/v2\/posts\/126334\/revisions\/126339"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/quondos.com\/mag\/wp-json\/wp\/v2\/media\/126337"}],"wp:attachment":[{"href":"https:\/\/quondos.com\/mag\/wp-json\/wp\/v2\/media?parent=126334"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/quondos.com\/mag\/wp-json\/wp\/v2\/categories?post=126334"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/quondos.com\/mag\/wp-json\/wp\/v2\/tags?post=126334"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}