OpenAI ha presentato una nuova evoluzione del suo sistema di intelligenza artificiale, che conversa a voce e vede ciò che c’è intorno
OpenAI, la società statunitense specializzata nello sviluppo di intelligenza artificiale, ha lanciato un nuovo aggiornamento di ChatGPT, il suo prodotto più noto e discusso degli ultimi anni.
Le novità sono state annunciate durante un evento online lunedì 13 maggio, preceduto da numerose anticipazioni e ipotesi, tra cui la possibilità che OpenAI stesse per presentare un motore di ricerca per competere con Google.
Invece, l’evento ha svelato nuove funzionalità che permettono di dialogare più facilmente con ChatGPT a voce e di farle analizzare l’ambiente circostante tramite la fotocamera dello smartphone.
OpenAI vuole che parliamo a ChatGPT, ecco come
La nuova versione di ChatGPT si basa su GPT-4o, l’ultima evoluzione del modello GPT-4 che alimenta il sistema di intelligenza artificiale di OpenAI.
Sam Altman, CEO della società, ha spiegato che la nuova versione è stata progettata per essere “multimodale”, ovvero capace di generare contenuti a partire da testi, immagini e audio.
L’obiettivo è rendere ChatGPT sempre più simile a un assistente virtuale, in grado di conversare naturalmente con gli utenti, fornendo indicazioni, informazioni o contenuti creativi.
Le funzionalità rese possibili da GPT-4o saranno messe a disposizione di tutti, ma per chi utilizza una versione a pagamento di ChatGPT saranno disponibili alcune opzioni in più e soprattutto maggiori capacità di elaborazione delle informazioni, per ottenere risposte più velocemente.
La diffusione del modello aggiornato è già in corso, ma saranno necessari alcuni giorni prima che sia disponibile per tutti e a seconda delle aree geografiche ci potrebbero essere alcune limitazioni, per esempio legate alle regole dei singoli paesi sulla privacy.
Oltre a essere disponibile sia su computer tramite browser sia su app per gli smartphone come era stato finora, ChatGPT potrà anche essere utilizzata tramite una app da installare sul proprio computer.
In precedenza OpenAI aveva già fatto qualche esperimento con i comandi vocali, mettendo a disposizione della propria app per smartphone una funzione per parlare direttamente con ChatGPT, che rispondeva a voce fornendo le informazioni richieste.
Il sistema non era però molto naturale e non c’erano possibilità di interazione fino a quando il sistema non aveva terminato di dare la propria risposta.
La nuova versione di ChatGPT offrirà invece un’esperienza più intuitiva e diretta, almeno secondo i responsabili di OpenAI.
Nel corso della presentazione è stata mostrata la capacità dell’applicazione di interagire e di farsi interrompere da ulteriori richieste vocali, a differenza di quanto fanno solitamente gli assistenti vocali che continuano a parlare fino a quando non hanno terminato di dare la loro risposta.
L’app può anche essere utilizzata per chiedere a ChatGPT di “vedere” che cosa ha intorno tramite la fotocamera dello smartphone, fornendo poi informazioni in base al riconoscimento degli oggetti e dei contesti in cui si trova.
L’esperienza è stata paragonata a quella offerta da Samantha, l’assistente virtuale di cui si innamora Theodore Twombly (interpretato da Joaquin Phoenix) nel film Her.
Samantha è capace di riconoscere e interpretare i contesti, interagendo in modo naturale con il suo interlocutore. Sam Altman ha persino pubblicato un post su X con il semplice commento: “Her”.
In realtà, la nuova versione di ChatGPT è ancora lontana dal fornire un’esperienza paragonabile a quella del film o a quelle immaginate in altre opere di fantascienza, principalmente a causa degli errori (“allucinazioni”) che i sistemi di intelligenza artificiale continuano a commettere.
La loro affidabilità nel fornire informazioni precise e verificate è ancora relativamente bassa, sollevando interrogativi sulle implicazioni e sugli effetti delle allucinazioni, specialmente in ambiti come l’informazione.
Tuttavia, OpenAI sta facendo progressi significativi con ChatGPT e altri sistemi di intelligenza artificiale su cui sta lavorando, come DALL-E per la produzione di immagini e Sora per i video brevi.
La società dispone di notevoli risorse finanziarie, principalmente grazie agli investimenti di Microsoft e di altri grandi clienti che stanno sperimentando questi sistemi nei loro flussi di lavoro.
Secondo Bloomberg, OpenAI sarebbe in trattative con Apple per potenziare Siri, l’assistente vocale degli iPhone, con GPT-4o e altri sistemi, ampliandone così le funzionalità attualmente limitate.
Tra le grandi aziende tecnologiche statunitensi, Apple è indietro rispetto alla concorrenza nello sviluppo e nella diffusione di sistemi di intelligenza artificiale. Per questo motivo, si prevede che l’azienda faccia qualche annuncio importante entro la fine dell’anno, possibilmente già a giugno durante la tradizionale presentazione degli aggiornamenti dei suoi sistemi operativi.
La concorrenza nel settore è molto intensa, coinvolgendo alcune delle più grandi aziende tecnologiche al mondo. OpenAI ha presentato le sue novità lunedì, probabilmente per anticipare Google, che martedì sera svelerà le ultime novità relative ai suoi servizi.
Secondo le anticipazioni, Google presenterà una versione aggiornata del suo assistente, che funzionerà con Gemini, il suo sistema di intelligenza artificiale.
L’Assistente Google, presente su Android e su molti dispositivi per la casa attraverso Google Home, non ha fatto particolari progressi negli ultimi anni, causando spesso frustrazione tra gli utenti. L’aggiornamento potrebbe rendere il sistema più interattivo e utile nello svolgimento di vari compiti, proprio come la nuova versione di ChatGPT.