OpenAI ha anunciado el lanzamiento del nuevo modo de voz de ChatGPT, una funcionalidad muy esperada que estará disponible esta semana para los usuarios de las suscripciones de pago Plus y Team. Sin embargo, los usuarios en la Unión Europea, el Reino Unido, Suiza, Islandia, Noruega y Liechtenstein deberán esperar un poco más.
La compañía, liderada por Sam Altman, había prometido el lanzamiento de una versión alfa en mayo, pero el despliegue se retrasó hasta julio para abordar cuestiones de seguridad. Ahora, el modo de voz llega con varias novedades, aunque se ha retirado la capacidad de imitar voces de otras personas.
Entre las mejoras, se incluyen instrucciones personalizadas que permiten ajustar las respuestas del sistema, memoria para recordar información importante de interacciones anteriores y cinco nuevas voces. La voz “Sky”, que era similar a la de Scarlett Johansson, fue retirada debido a una polémica.
El despliegue se realizará por etapas, y los usuarios recibirán una notificación en ChatGPT cuando el modo de voz esté disponible. Una vez activado, podrán elegir su voz favorita y personalizar las instrucciones desde la configuración.
Este nuevo modo de voz representa un avance significativo respecto al anterior, permitiendo conversaciones más naturales y con menos latencia. A nivel técnico, esto se debe a que el modelo GPT-4o procesa la voz directamente, eliminando la necesidad de convertirla a texto y viceversa.
Sin embargo, el modo de voz que se está lanzando es diferente al que se mostró en mayo, ya que OpenAI aún tiene pendiente incorporar capacidades de visión, que permitirán a la aplicación ver a través de la cámara del dispositivo. Se espera que esta funcionalidad llegue en una fecha posterior.
Imagen: OpenAI