OpenAI ha presentado su nuevo modelo de lenguaje, GPT-4o, que permite interactuar con las máquinas a través de la voz. A diferencia de los asistentes virtuales actuales, como Siri o Alexa, GPT-4o ofrece una experiencia mucho más cercana a la interacción humana.
El logro más destacado de OpenAI es la reducción de la latencia, pasando de los 2,8 segundos de GPT-3.5 y los 5,4 segundos de GPT-4 a tan solo 0,32 segundos en GPT-4o. Esto significa que ChatGPT, el asistente basado en GPT-4o, responde de forma casi inmediata y de manera natural, con cambios de entonación y expresividad propios de una voz humana.
Las implicaciones de esta mejora son enormes, ya que facilita el acceso y la popularización de esta tecnología. Ahora, además de poder escribir nuestras preguntas en un teclado, podemos hablar directamente con ChatGPT, acelerando la interacción y mejorando la experiencia.
Las demostraciones de OpenAI mostraron las capacidades de ChatGPT, como la expresión de sarcasmo, la posibilidad de hablar en otros idiomas o la traducción en tiempo real. Esto abre un abanico de posibilidades en campos como la enseñanza y nuestra relación con las máquinas.
Este avance nos acerca a la realidad que se mostraba en la película ‘Her’, donde una inteligencia artificial era capaz de entablar una relación cercana con los humanos. La voz de ChatGPT, con su emotividad y capacidad de seducción, puede generar una conexión emocional con los usuarios.
En definitiva, GPT-4o representa un gran avance en la interacción por voz con las máquinas. La reducción de la latencia y la capacidad de expresión y entonación de ChatGPT hacen que la experiencia sea más natural y atractiva. Este nuevo modelo de lenguaje de OpenAI tiene el potencial de revolucionar la forma en que nos relacionamos con la tecnología y abre un mundo de posibilidades en diversos campos.
Imagen: OpenAI