Oggi segna il lancio di ChatGPT-4.5, il modello tanto atteso da OpenAI, accessibile agli abbonati di ChatGPT Plus. Tuttavia, non tutti gli utenti potrebbero avere subito accesso a questa nuova versione, in quanto il roll-out sarà graduale. Questa scelta è stata spiegata dal CEO di OpenAI, Sam Altman, che ha evidenziato l'importanza di garantire una user experience ottimale, evitando limiti di utilizzo eccessivi che possano compromettere le interazioni tra il modello e gli utenti.
Ritiro e spiegazioni di OpenAI
OpenAI ha deciso di mettere in atto un rilascio scaglionato del modello per migliorare le conversazioni tra utenti e intelligenza artificiale. Sam Altman ha sottolineato che una distribuzione simultanea avrebbe comportato la necessità di limiti di utilizzo ridotto, ostacolando l'efficacia delle interazioni. Il nuovo modello rappresenta l'ultimo traguardo di OpenAI, con revisioni che lo rendono più vicino a una conversazione umana grazie a capacità migliorate di intelligenza emotiva e abilità relazionali. Altman lo ha descritto come "il primo modello che sembra parlare con una persona pensante".
Confronto tra ChatGPT-4.5 e ChatGPT-4o
Per mettere alla prova le capacità di ChatGPT-4.5, sono state effettuate sette diverse prove tra questo e il precedente modello, ChatGPT-4o. Le valutazioni hanno coperto vari aspetti, tra cui la risoluzione di problemi, la personalità dell'AI e le abilita di scrittura creativa. Ecco un'analisi approfondita.
Risoluzione di problemi
Una delle prove più classiche è stata il famoso rompicapo del contadino che deve trasportare un lupo, una gallina e un sacco di grano. Entrambi i modelli, ChatGPT-4.5 e ChatGPT-4o, hanno fornito la soluzione corretta, ma con alcune differenze nel modo di comunicare le istruzioni. ChatGPT-4o ha mostrato una comunicazione più concisa e diretta, permettendo una comprensione veloce senza troppi dettagli. Viceversa, ChatGPT-4.5 ha presentato la soluzione in modo più strutturato, enfatizzando le motivazioni dietro ogni movimento, il che potrebbe risultare utile per chi cerca spiegazioni più approfondite.
Personalità dell’AI
In un'altra prova, è stato chiesto di spiegare l'importanza dell'interesse composto in vari toni. Il modello 4o ha eccelso nella chiarezza e nella struttura, risultando più coinvolgente e divertente, soprattutto nella spiegazione per i bambini tramite un'analogia con un "contenitore magico". Al contrario, ChatGPT-4.5 ha adottato un approccio più tecnico, fornendo una risposta meno giocosa ma più precisa da un punto di vista finanziario.
Capacità di scrittura creativa
La scrittura creativa è stata testata richiedendo l'apertura di un romanzo distopico. Entrambi i modelli hanno creato scenari intriganti, ma ChatGPT-4.5 ha scardinato la struttura con un'atmosfera più immersiva e dettagli sensoriali. ChatGPT-4o ha stabilito più rapidamente l'ambientazione ma senza la stessa ricchezza di descrizione, generando quindi un'opzione più avvincente per lettori alla ricerca di un'esperienza narrativa profonda.
Accuratezza dei fatti
Sulla questione delle ultime innovazioni nel campo dell'intelligenza artificiale, ChatGPT-4.5 ha approfondito vari argomenti con maggiore dettaglio rispetto al suo predecessore, menzionando anche applicazioni in settori specifici come la salute e l'istruzione. Nonostante le risposte di ChatGPT-4o siano state solide, il modello successivo ha fornito informazioni più ampie e numerosi esempi pratici.
Commedia e umorismo
I due modelli sono stati messi alla prova nel creare una breve routine di stand-up sulla mancanza di lettura dei termini e condizioni. Qui, ChatGPT-4o ha offerto una storyline più avvincente e divertente, completando perfettamente il classico schema comico, mentre ChatGPT-4.5 ha impiegato un umorismo più osservazionale, risultando meno incisivo e memorabile.
Pensiero critico
Un'altra prova ha coinvolto la costruzione di argomenti pro e contro l'arte generata dall'AI. ChatGPT-4o ha saputo contestualizzare meglio la discussione, proponendo confronti storici che rendono più comprensibile l'evoluzione dell'arte grazie alla tecnologia. Al contrario, ChatGPT-4.5 ha presentato argomentazioni più sintetiche, ma mancando di profondità e varietà.
Comprensione multimodale
Infine, per scrivere istruzioni su come legare un papillon, ChatGPT-4o ha dimostrato di essere più intuitivo e accessibile, sfruttando etichette per chiarire i passaggi. ChatGPT-4.5, sebbene efficace, ha avuto una struttura meno user-friendly.
In generale, le prove rivelano che, sebbene ChatGPT-4.5 porti importanti miglioramenti, ChatGPT-4o si è dimostrato un modello favorevole in diverse situazioni, in particolare per chiarezza e coinvolgimento. Questo è un buon segnale per coloro che attendono il rilascio di ChatGPT-4.5: il modello che già utilizzano potrebbe essere quello che meglio soddisfa le loro esigenze.