Ya no solo observa, ahora también piensa con imágenes. OpenAI ha anunciado una de las actualizaciones más importantes de su 'chatbot': la capacidad para interpretar y manipular imágenes en tiempo real.
Una nueva generación de modelos visuales
La empresa tecnológica lanzó oficialmente sus modelos o3 y o4-mini, los cuales dotan a ChatGPT de la habilidad para comprender fotografías, esquemas, dibujos y hasta imágenes borrosas o de baja calidad. Pero lo más innovador es que también puede modificarlas al instante: rotarlas, ampliarlas, o editarlas mientras las analiza.
Según OpenAI, este avance marca la primera vez en que los modelos de razonamiento pueden usar todas las herramientas de ChatGPT de forma dinámica, incluyendo la búsqueda web, análisis de archivos y otros datos, para resolver problemas complejos en menos de un minuto.
Pensamiento visual más preciso y natural
El modelo o3 es descrito por la compañía como su modelo de razonamiento más avanzado hasta ahora, especialmente eficaz en tareas visuales como la interpretación de gráficos, tablas e imágenes técnicas. En evaluaciones recientes, cometió un 20 % menos de errores que su antecesor, destacando en programación, consultoría y ciencia de datos.
Tanto o3 como o4-mini también ofrecen respuestas más fluidas y personalizadas, simulando mejor una conversación natural, de acuerdo con OpenAI.
Expansión estratégica: ¿una nueva adquisición?
En paralelo al anuncio, el medio CNBC reveló que OpenAI está en negociaciones para adquirir Windsurf, una herramienta de inteligencia artificial especializada en codificación, por unos 3,000 millones de dólares. Esta posible compra busca fortalecer la posición de OpenAI frente a competidores como Microsoft, Anthropic y otros en el ámbito del desarrollo de software con IA.