OpenAI prepara GPT-Bidi-1, el nuevo modelo de voz de ChatGPT que busca competir con Gemini

OpenAI prepara GPT-Bidi-1, el nuevo modelo de voz de ChatGPT que busca competir con Gemini 2

OpenAI estaría ultimando el lanzamiento de GPT-Bidi-1, un nuevo modelo de inteligencia artificial centrado en conversaciones por voz que, según diferentes filtraciones aparecidas en el código interno de ChatGPT, promete ofrecer una experiencia mucho más natural que la actual. La principal novedad sería su capacidad para escuchar y hablar al mismo tiempo, algo que permitiría mantener diálogos más fluidos y cercanos a una conversación humana. De acuerdo con la información difundida por varios medios especializados, este desarrollo podría convertirse en uno de los movimientos más importantes de OpenAI durante los próximos meses.

Un modelo de voz diseñado para conversaciones más naturales

Según la información detectada en la aplicación de ChatGPT, GPT-Bidi-1 sería un modelo de voz bidireccional. Esto significa que la inteligencia artificial podría procesar información mientras habla y escucha de forma simultánea. La tecnología buscaría eliminar las pausas artificiales que todavía existen en muchos asistentes de voz actuales.

De acuerdo con las filtraciones recogidas por medios especializados, el sistema podría responder con expresiones breves como “vale” o “entiendo” mientras escucha al usuario. El objetivo sería hacer que la conversación resulte más fluida y que la interacción se parezca más a la que se produce entre dos personas. OpenAI no ha confirmado oficialmente estas funciones, pero las referencias encontradas apuntan en esa dirección.

La capacidad de interrumpir podría marcar la diferencia

Uno de los aspectos que más ha llamado la atención es la posibilidad de interrumpir a ChatGPT mientras está respondiendo. Según la información publicada, el sistema sería capaz de detectar el cambio de contexto y adaptar inmediatamente su respuesta. Esto evitaría tener que esperar a que la IA termine una explicación completa antes de realizar una corrección o añadir una nueva instrucción.

Por ejemplo, si un usuario solicita recomendaciones y decide modificar la petición a mitad de la respuesta, GPT-Bidi-1 podría reaccionar en tiempo real y ajustar el contenido sin reiniciar la conversación. Según la fuente original de la filtración, esta capacidad sería una de las principales ventajas frente a otros asistentes conversacionales actuales.

Más memoria y mejor comprensión del contexto

Otro de los elementos destacados es la gestión del contexto. Según los datos difundidos, GPT-Bidi-1 podría mantener conversaciones más largas sin perder información relevante. La IA recordaría mejor las instrucciones iniciales incluso cuando el usuario añada explicaciones adicionales durante el diálogo.

Esta característica podría resultar especialmente útil en tareas complejas, consultas profesionales o sesiones prolongadas de asistencia. Según la información publicada, la intención sería reducir uno de los problemas habituales de los asistentes conversacionales: la pérdida de contexto cuando la conversación se extiende durante varios minutos.

La competencia directa con Gemini de Google

La aparición de GPT-Bidi-1 se produce en un momento en el que la competencia entre OpenAI y Google es especialmente intensa. Gemini se ha consolidado como uno de los principales rivales de ChatGPT, especialmente gracias a su integración con dispositivos Android y servicios del ecosistema de Google.

Según los análisis publicados tras la filtración, OpenAI buscaría responder directamente a Gemini Live, la propuesta conversacional por voz de Google. La compañía no ha realizado declaraciones oficiales sobre esta comparación, pero diversos medios interpretan que el nuevo modelo ha sido diseñado para competir precisamente en el terreno de las conversaciones naturales en tiempo real.

  • Conversaciones bidireccionales en tiempo real.
  • Interrupciones sin reiniciar la respuesta.
  • Mayor capacidad para recordar el contexto.
  • Interacción más cercana al lenguaje humano.

Un posible paso hacia la transformación de ChatGPT

Las filtraciones también apuntan a que GPT-Bidi-1 podría formar parte de una actualización más amplia de ChatGPT. Según la información publicada, OpenAI estaría trabajando en una evolución importante de su plataforma, con nuevas capacidades relacionadas con agentes inteligentes y automatización de tareas.

De acuerdo con las informaciones disponibles, la compañía mantendría en secreto gran parte de sus planes hasta el lanzamiento oficial. No existe todavía una fecha confirmada para la llegada de GPT-Bidi-1, aunque algunos medios señalan que podría presentarse durante las próximas semanas.

Qué se sabe sobre su lanzamiento

Por el momento, OpenAI no ha anunciado públicamente la disponibilidad de GPT-Bidi-1 ni ha detallado sus características definitivas. Toda la información conocida procede de referencias encontradas en el código de la aplicación y de informes publicados por medios especializados. La compañía no ha confirmado oficialmente las funciones filtradas.

Aun así, las expectativas son elevadas porque el mercado de la inteligencia artificial está avanzando rápidamente hacia experiencias multimodales donde texto, voz e imagen conviven en un mismo entorno. Si las filtraciones terminan siendo correctas, GPT-Bidi-1 podría convertirse en una de las actualizaciones más relevantes de ChatGPT y reforzar la posición de OpenAI frente a competidores como Gemini.

Fuente: https://hipertextual.com/tecnologia/openai-ya-tiene-lista-la-ia-que-va-a-acabar-con-gemini-asi-es-gpt-bidi-1-el-nuevo-modelo-de-voz-que-habla-como-un-humano/


También podría ser de tu interés:

Deja un comentario