
OpenAI ha dado un paso más en la integración de ChatGPT con nuestras herramientas diarias al permitir que su chatbot lea código directamente desde aplicaciones de desarrollo en Mac. ¡Adiós a copiar y pegar!
ChatGPT se integra con aplicaciones de código en macOS
Según informes, OpenAI anunció que la app de escritorio de ChatGPT para macOS ahora puede leer código en varias aplicaciones enfocadas en desarrolladores, como VS Code, Xcode, TextEdit, Terminal e iTerm2.
Esto significa que los desarrolladores ya no tendrán que copiar y pegar su código en ChatGPT, una práctica común hasta ahora. Al habilitar esta función, OpenAI enviará automáticamente la sección de código en la que estás trabajando al chatbot como contexto, junto con tu prompt.
Limitaciones actuales y futuro de la función
Sin embargo, a diferencia de otras herramientas de IA para codificación como Cursor o GitHub Copilot, ChatGPT actualmente no puede escribir código directamente en las apps de desarrollo en tu nombre. Aún tendrás que copiar la respuesta del chatbot y pegarla en tu entorno de trabajo.
La función, llamada Work with Apps, está lejos de ser un agente de IA completo. Pero OpenAI afirma que lograr que ChatGPT entienda otras aplicaciones es un «elemento clave» hacia la construcción de sistemas más autónomos.
Cómo funciona Work with Apps
Para leer diferentes aplicaciones, OpenAI se basa principalmente en la API de accesibilidad de macOS para leer texto y traducirlo a ChatGPT, según Alexander Embiricos, líder de producto de escritorio en OpenAI.
El lector de pantalla en macOS, que ayuda a la función VoiceOver de Apple, existe desde hace casi dos décadas y es considerado bastante confiable para la mayoría de las aplicaciones comunes, aunque no para todas.
Disponibilidad y próximos pasos
OpenAI está enfocando esta función inicialmente en aplicaciones de codificación, probablemente porque los asistentes de codificación con IA se han convertido en uno de los casos de uso más populares para los modelos de lenguaje.
La función está disponible para usuarios de Plus y Teams desde hoy y se desplegará para Enterprise y Edu en las próximas semanas. OpenAI afirma que ChatGPT podrá trabajar con otros tipos de aplicaciones en el futuro, específicamente apps basadas en texto que podrían usarse para tareas de escritura.
Demostración con TechCrunch
En una demostración con TechCrunch, un empleado de OpenAI abrió la app de ChatGPT y un entorno de Xcode que contenía un proyecto simple modelando el sistema solar, aunque faltaba la Tierra.
El empleado seleccionó una pestaña de Xcode dentro de ChatGPT, lo que indica al chatbot que mire la app, y le pidió que «agregara los planetas que faltaban». El chatbot pudo completar la tarea, escribiendo una línea de código para representar la Tierra que coincidía con el formato del resto del proyecto.
Limitaciones y consideraciones
Para algunas aplicaciones, como VS Code de Microsoft, Work with Apps requiere que los usuarios instalen una extensión especial para consultar contenido. Además, como su nombre sugiere, el lector de pantalla de Apple solo puede leer texto, por lo que no puede ayudar a ChatGPT a entender elementos visuales como fotos, orientación de objetos o videos.
Work with Apps enviará tus últimas 200 líneas de código a ChatGPT junto con cada prompt para ciertas apps. Para otras, todo el código en tu ventana principal se usará como entrada para el chatbot. Esto podría implicar un uso considerable de tokens de entrada.
Comparación con otras soluciones
Es incierto cómo OpenAI planea expandir esta función a otras aplicaciones que no son compatibles con el lector de pantalla de Apple. Anthropic, uno de los competidores de OpenAI, lanzó un sistema de IA que analiza capturas de pantalla del escritorio del usuario para entender y usar otras apps.
Sin embargo, según informes, el enfoque de Anthropic deja mucho que desear en su estado actual. Es lento y comete muchos errores. No obstante, es una versión más general de un agente de IA que no depende de APIs y puede hacer más que solo leer texto en otra ventana.
El camino hacia agentes de IA más avanzados
«Esto no está destinado a ser un agente; es una forma de colaborar con herramientas de codificación para empezar, y habrá más herramientas próximamente», dijo Embiricos en una sesión informativa con TechCrunch.
«En cuanto a los agentes, creo que este es un elemento clave. La idea de que ChatGPT entienda o pueda trabajar con todo el contenido que tienes para que pueda ayudarte con él», añadió.
Lo que viene para OpenAI y ChatGPT
Este paso hacia agentes es especialmente notable dado que, según informes recientes, OpenAI está cerca de lanzar un agente de IA de propósito general, con el nombre en código «Operator», según Bloomberg.
Se espera que la herramienta llegue a principios de 2025 y rivalizaría con otros intentos tempranos de agentes de IA de propósito general, como el uso de computadora de Anthropic o el agente «Jarvis» reportado de Google.
Conclusión
OpenAI está dando pasos significativos para integrar ChatGPT con aplicaciones de escritorio, comenzando con macOS. Aunque aún hay limitaciones, esta nueva función promete facilitar el trabajo de los desarrolladores y apunta hacia un futuro con agentes de IA más avanzados.
Estaremos atentos a cómo evoluciona esta herramienta y cuándo estará disponible para otros sistemas operativos, como Windows, creado por el mayor patrocinador de OpenAI, Microsoft.
Fuente: https://www.theverge.com/2024/11/14/24296745/chatgpts-mac-app-will-be-able-to-read-your-code