{"id":127121,"date":"2024-06-19T12:15:32","date_gmt":"2024-06-19T10:15:32","guid":{"rendered":"https:\/\/quondos.com\/mag\/?p=127121"},"modified":"2024-06-19T12:15:33","modified_gmt":"2024-06-19T10:15:33","slug":"deepseek-presenta-un-modelo-superior-a-gpt-4-y-claude-opus","status":"publish","type":"post","link":"https:\/\/quondos.com\/mag\/deepseek-presenta-un-modelo-superior-a-gpt-4-y-claude-opus\/","title":{"rendered":"DeepSeek presenta un modelo superior a GPT-4 y Claude Opus"},"content":{"rendered":"\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"550\" src=\"https:\/\/quondos.com\/mag\/wp-content\/uploads\/2024\/06\/image-6-1024x550.webp\" alt=\"\" class=\"wp-image-127123\" title=\"\" srcset=\"https:\/\/quondos.com\/mag\/wp-content\/uploads\/2024\/06\/image-6-1024x550.webp 1024w, https:\/\/quondos.com\/mag\/wp-content\/uploads\/2024\/06\/image-6-300x161.webp 300w, https:\/\/quondos.com\/mag\/wp-content\/uploads\/2024\/06\/image-6-768x412.webp 768w, https:\/\/quondos.com\/mag\/wp-content\/uploads\/2024\/06\/image-6-1536x825.webp 1536w, https:\/\/quondos.com\/mag\/wp-content\/uploads\/2024\/06\/image-6-2048x1100.webp 2048w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<p>Recientemente, el colectivo acad\u00e9mico DeepSeek-AI ha lanzado el modelo de lenguaje de c\u00f3digo abierto DeepSeek-Coder-V2, dise\u00f1ado para competir con modelos comerciales l\u00edderes como GPT-4, Claude o Gemini en la generaci\u00f3n de c\u00f3digo. Este nuevo modelo promete revolucionar la manera en que los desarrolladores trabajan con el c\u00f3digo.<\/p>\n\n<div id=\"ez-toc-container\" class=\"ez-toc-v2_0_76 counter-hierarchy ez-toc-counter ez-toc-grey ez-toc-container-direction\">\n<div class=\"ez-toc-title-container\">\n<p class=\"ez-toc-title\" style=\"cursor:inherit\">\u00cdndice de contenidos<\/p>\n<span class=\"ez-toc-title-toggle\"><a href=\"#\" class=\"ez-toc-pull-right ez-toc-btn ez-toc-btn-xs ez-toc-btn-default ez-toc-toggle\" aria-label=\"Alternar tabla de contenidos\"><span class=\"ez-toc-js-icon-con\"><span class=\"\"><span class=\"eztoc-hide\" style=\"display:none;\">Toggle<\/span><span class=\"ez-toc-icon-toggle-span\"><svg style=\"fill: #999;color:#999\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" class=\"list-377408\" width=\"20px\" height=\"20px\" viewBox=\"0 0 24 24\" fill=\"none\"><path d=\"M6 6H4v2h2V6zm14 0H8v2h12V6zM4 11h2v2H4v-2zm16 0H8v2h12v-2zM4 16h2v2H4v-2zm16 0H8v2h12v-2z\" fill=\"currentColor\"><\/path><\/svg><svg style=\"fill: #999;color:#999\" class=\"arrow-unsorted-368013\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"10px\" height=\"10px\" viewBox=\"0 0 24 24\" version=\"1.2\" baseProfile=\"tiny\"><path d=\"M18.2 9.3l-6.2-6.3-6.2 6.3c-.2.2-.3.4-.3.7s.1.5.3.7c.2.2.4.3.7.3h11c.3 0 .5-.1.7-.3.2-.2.3-.5.3-.7s-.1-.5-.3-.7zM5.8 14.7l6.2 6.3 6.2-6.3c.2-.2.3-.5.3-.7s-.1-.5-.3-.7c-.2-.2-.4-.3-.7-.3h-11c-.3 0-.5.1-.7.3-.2.2-.3.5-.3.7s.1.5.3.7z\"\/><\/svg><\/span><\/span><\/span><\/a><\/span><\/div>\n<nav><ul class='ez-toc-list ez-toc-list-level-1 ' ><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-1\" href=\"https:\/\/quondos.com\/mag\/deepseek-presenta-un-modelo-superior-a-gpt-4-y-claude-opus\/#DeepSeek-Coder-V2_Un_modelo_que_supera_a_GPT-4_y_Claude_Opus\" >DeepSeek-Coder-V2: Un modelo que supera a GPT-4 y Claude Opus<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-2\" href=\"https:\/\/quondos.com\/mag\/deepseek-presenta-un-modelo-superior-a-gpt-4-y-claude-opus\/#Arquitectura_y_variantes_del_modelo\" >Arquitectura y variantes del modelo<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-3\" href=\"https:\/\/quondos.com\/mag\/deepseek-presenta-un-modelo-superior-a-gpt-4-y-claude-opus\/#Rendimiento_en_benchmarks_y_disponibilidad\" >Rendimiento en benchmarks y disponibilidad<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-4\" href=\"https:\/\/quondos.com\/mag\/deepseek-presenta-un-modelo-superior-a-gpt-4-y-claude-opus\/#Mejoras_futuras\" >Mejoras futuras<\/a><\/li><\/ul><\/nav><\/div>\n<h2><span class=\"ez-toc-section\" id=\"DeepSeek-Coder-V2_Un_modelo_que_supera_a_GPT-4_y_Claude_Opus\"><\/span>DeepSeek-Coder-V2: Un modelo que supera a GPT-4 y Claude Opus<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n<p>DeepSeek-Coder-V2 se basa en el modelo anterior, DeepSeek-V2, y ha sido entrenado adicionalmente con 6 billones de tokens de un corpus de m\u00faltiples fuentes de alta calidad. El modelo ahora soporta <strong>338 lenguajes de programaci\u00f3n<\/strong>, un incremento significativo desde los 86 lenguajes soportados anteriormente. Adem\u00e1s, puede procesar contextos de hasta 128,000 tokens, una mejora considerable comparado con los 16,000 tokens anteriores.<\/p>\n\n<p>El conjunto de datos de entrenamiento se compone de un 60% de c\u00f3digo fuente, un 10% de datos matem\u00e1ticos y un 30% de lenguaje natural. La porci\u00f3n de c\u00f3digo incluye <strong>1.17 billones de tokens<\/strong> de GitHub y CommonCrawl, mientras que la parte matem\u00e1tica contiene 221 mil millones de tokens de CommonCrawl.<\/p>\n\n<h2><span class=\"ez-toc-section\" id=\"Arquitectura_y_variantes_del_modelo\"><\/span>Arquitectura y variantes del modelo<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n<p>DeepSeek-Coder-V2 utiliza una arquitectura de mezcla de expertos y viene en dos variantes: el modelo de 16 mil millones de par\u00e1metros tiene solo 2.4 mil millones de par\u00e1metros activos, mientras que el modelo de 236 mil millones de par\u00e1metros tiene solo 21 mil millones activos. Ambas versiones han sido entrenadas en un total de <strong>10.2 billones de tokens<\/strong>.<\/p>\n\n<p>En los benchmarks como HumanEval o MBPP, DeepSeek-Coder-V2 puede competir con los mejores modelos comerciales, seg\u00fan DeepSeek-AI. La versi\u00f3n de 236 mil millones alcanz\u00f3 un promedio del 75.3%, ligeramente menor que el 76.4% de GPT-4o, pero mejor que GPT-4 o Claude 3 Opus.<\/p>\n\n<h2><span class=\"ez-toc-section\" id=\"Rendimiento_en_benchmarks_y_disponibilidad\"><\/span>Rendimiento en benchmarks y disponibilidad<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n<p>En los benchmarks matem\u00e1ticos como GSM8K, MATH o AIME, DeepSeek-Coder-V2 est\u00e1 a la par con los modelos comerciales l\u00edderes. En tareas de lenguaje, su rendimiento es similar al de su predecesor, DeepSeek-V2. El modelo DeepSeek-Coder-V2 est\u00e1 disponible para su descarga en Hugging Face bajo una <strong>licencia de c\u00f3digo abierto<\/strong>, y puede usarse tanto para fines de investigaci\u00f3n como comerciales sin restricciones. Tambi\u00e9n es accesible a trav\u00e9s de una API.<\/p>\n\n<h2><span class=\"ez-toc-section\" id=\"Mejoras_futuras\"><\/span>Mejoras futuras<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n<p>A pesar de los resultados impresionantes, los desarrolladores ven margen de mejora en la capacidad del modelo para seguir instrucciones, lo cual es crucial para manejar escenarios de programaci\u00f3n complejos en el mundo real. DeepSeek-AI tiene la intenci\u00f3n de trabajar en esta \u00e1rea en el futuro para mejorar a\u00fan m\u00e1s la eficiencia y la utilidad del modelo.<\/p>\n\n<p>En resumen, DeepSeek-Coder-V2 representa un avance significativo en el campo de la generaci\u00f3n de c\u00f3digo, ofreciendo a los desarrolladores una herramienta poderosa y vers\u00e1til que compite directamente con los gigantes comerciales del sector. Este modelo no solo democratiza el acceso a la tecnolog\u00eda avanzada, sino que tambi\u00e9n establece un nuevo est\u00e1ndar en la calidad y funcionalidad de los modelos de c\u00f3digo abierto.<\/p>\n\n\n\n<p>Fuente:https:\/\/the-decoder.com\/deepseek-coder-v2-open-source-model-beats-gpt-4-and-claude-opus\/<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Recientemente, el colectivo acad\u00e9mico DeepSeek-AI ha lanzado el modelo de lenguaje de c\u00f3digo abierto DeepSeek-Coder-V2, dise\u00f1ado para competir con modelos &#8230; <\/p>\n<p class=\"read-more-container\"><a title=\"DeepSeek presenta un modelo superior a GPT-4 y Claude Opus\" class=\"read-more button\" href=\"https:\/\/quondos.com\/mag\/deepseek-presenta-un-modelo-superior-a-gpt-4-y-claude-opus\/#more-127121\" aria-label=\"Leer m\u00e1s sobre DeepSeek presenta un modelo superior a GPT-4 y Claude Opus\">Leer m\u00e1s<\/a><\/p>\n","protected":false},"author":850,"featured_media":127123,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1474],"tags":[],"class_list":["post-127121","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-inteligencia-artificial","generate-columns","tablet-grid-50","mobile-grid-100","grid-parent","grid-50","no-featured-image-padding"],"_links":{"self":[{"href":"https:\/\/quondos.com\/mag\/wp-json\/wp\/v2\/posts\/127121","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/quondos.com\/mag\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/quondos.com\/mag\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/quondos.com\/mag\/wp-json\/wp\/v2\/users\/850"}],"replies":[{"embeddable":true,"href":"https:\/\/quondos.com\/mag\/wp-json\/wp\/v2\/comments?post=127121"}],"version-history":[{"count":2,"href":"https:\/\/quondos.com\/mag\/wp-json\/wp\/v2\/posts\/127121\/revisions"}],"predecessor-version":[{"id":127124,"href":"https:\/\/quondos.com\/mag\/wp-json\/wp\/v2\/posts\/127121\/revisions\/127124"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/quondos.com\/mag\/wp-json\/wp\/v2\/media\/127123"}],"wp:attachment":[{"href":"https:\/\/quondos.com\/mag\/wp-json\/wp\/v2\/media?parent=127121"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/quondos.com\/mag\/wp-json\/wp\/v2\/categories?post=127121"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/quondos.com\/mag\/wp-json\/wp\/v2\/tags?post=127121"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}