
OpenAI ha presentado la última versión de la tecnología que sustenta su chatbot de IA ChatGPT. Se llama GPT-4o y se implementará para todos los usuarios de ChatGPT, incluidos los no suscriptores.
Es más rápido que los modelos anteriores y ha sido programado para sonar hablador y, a veces, incluso coqueto en sus respuestas a las indicaciones.
La nueva versión puede leer y discutir imágenes, traducir idiomas e identificar emociones a partir de expresiones visuales. También hay memoria para que pueda recordar indicaciones anteriores.
Se puede interrumpir y tiene un ritmo de conversación más fácil: no hubo demora entre hacerle una pregunta y recibir una respuesta.
Fallos
Durante una demostración en vivo utilizando la versión de voz de GPT-4o, brindó sugerencias útiles sobre cómo resolver una ecuación simple escrita en una hoja de papel, en lugar de simplemente resolverla. Analizó algunos códigos informáticos, los tradujo entre italiano e inglés e interpretó las emociones en un selfie de un hombre sonriente.
Usando una cálida voz femenina estadounidense, saludó a sus apuntadores preguntándoles cómo estaban. Cuando le hicieron un cumplido, respondió: “¡Basta, me estás haciendo sonrojar!”.
No era perfecto: en un momento confundió al hombre sonriente con una superficie de madera y comenzó a resolver una ecuación que aún no se había mostrado. Esto demostró involuntariamente que todavía queda mucho camino por recorrer antes de que se puedan solucionar los fallos y alucinaciones que hacen que los chatbots sean poco fiables y potencialmente inseguros.
Pero lo que sí nos muestra es la dirección que tomará OpenAI, que creo que pretende que GPT-4o se convierta en la próxima generación de asistente digital de IA, una especie de Siri o Hey, Google turboalimentado que recuerda lo que se dijo en el pasado y puede interactuar más allá de la voz o el texto.
Si había un elefante en la sala, junto al entusiasta público fuera de cámara que gritaba y aplaudía, era el precio medioambiental de esta tecnología.
Sabemos que la IA consume más energía que las tareas informáticas tradicionales, y que cuanto más sofisticada se vuelve, más potencia informática requiere. Durante la velada no se habló de sostenibilidad.
Desmitificar
Hemos visto chatbots como Grok y Pi de Elon Musk, del cofundador de DeepMind, Mustafa Suleyman, priorizar la “personalidad” de sus productos, pero la forma en que GPT-4o maneja a la perfección la combinación de texto, audio e imágenes con una respuesta instantánea. Parece poner a OpenAI por delante de la competencia.
Por supuesto, por el momento solo tenemos la palabra de la empresa: fue su demostración, cuidadosamente seleccionada y administrada por ellos. Será interesante ver cómo GPT-4o se adapta a escala a los millones de personas que ya utilizan ChatGPT a medida que se implementa.
La directora de tecnología de OpenAI, Mira Murati, describió a GPT-4o como «mágico», pero agregó que la empresa «eliminaría ese misticismo» con el lanzamiento del producto.
Una elección de palabras interesante y emotiva: si bien esta tecnología se está volviendo rápidamente más sofisticada y cada vez más convincente como compañera, no es sensible ni mágica, es programación compleja y aprendizaje automático.
Ha habido rumores sobre una asociación entre OpenAI y Apple y, aunque esto aún no se ha confirmado, fue revelador durante la presentación que se utilizaron productos de Apple en todas partes.
Otro tiro de gracia fue el momento de este evento, 24 horas antes de que su rival Google muestre sus últimos desarrollos en inteligencia artificial en su conferencia anual, Google IO. (Fuente…)




















