Si chiama GPT-4o e sarà distribuito a tutti gli utenti ChatGPT, compresi i non abbonati, riferisce la BBC.
È più veloce dei modelli precedenti ed è programmato per rispondere alle richieste parlando e talvolta anche flirtando.
La nuova versione può leggere e discutere immagini, tradurre lingue e identificare emozioni da espressioni visive, oltre a ricordare query precedenti.
Il bot AI è interrompibile e ha una cadenza di conversazione più rilassata: non c’è più alcun ritardo tra fare una domanda e ottenere una risposta.
Nuove possibilità
I membri del team OpenAI hanno dimostrato le capacità audio del nuovo modello, chiedendogli ad esempio di calmare una persona prima di un discorso pubblico, scrive CBNC.
Mark Chen, ricercatore di OpenAI, ha affermato che il modello può “comprendere le tue emozioni”, aggiungendo che può anche gestire gli utenti che lo interrompono.
Il team gli ha anche chiesto di analizzare l’espressione facciale dell’utente per commentare le emozioni che la persona potrebbe provare.
“Ciao come stai? Come posso rallegrarti la giornata oggi?” ha detto salutando l’utente.
Secondo un post sul blog, la società prevede di testare la modalità vocale nelle prossime settimane, con accesso anticipato agli abbonati ChatGPT Plus a pagamento.
OpenAI ha inoltre affermato che il nuovo modello può rispondere alle richieste audio degli utenti “in soli 232 millisecondi, con una media di 320 millisecondi, come un essere umano in una conversazione”.
Il signor Chen ha dimostrato la capacità della modella di raccontare una storia prima di andare a letto e le ha chiesto di cambiare il tono della sua voce per renderla più drammatica. Le ha persino chiesto di cantare una fiaba.
I membri del team hanno anche dimostrato la capacità del modello di risolvere equazioni matematiche e scrivere codice, rendendolo un concorrente più forte del programma GitHub Copilot di Microsoft.
“Ninja di Twitter. Esploratore devoto. Fanatico del web. Secchione della birra. Difensore di Internet amante degli hipster.”