Salta al contenuto principale

Strawberry è finalmente qui (e si chiama o1)

openai o1

Keypoints:

  • OpenAI ha rilasciato o1 (precedentemente noto come "Strawberry"), un nuovo modello di intelligenza artificiale con capacità di ragionamento avanzate.
  • o1 utilizza l'apprendimento per rinforzo e mostra il suo ragionamento in tempo reale.
  • Il modello eccelle in compiti complessi come operazioni matematiche avanzate e coding, ma ha alcune limitazioni.
  • È disponibile in versione preview per utenti ChatGPT Plus e Team, con accesso limitato per utenti Enterprise e Edu.
  • o1 rappresenta un passo avanti significativo verso l'intelligenza artificiale di livello umano (AGI).

Cosa bolle in pentola da OpenAI?

In un articolo del 16 luglio scorso abbiamo parlato dell'AGI, degli stadi evolutivi dell'AI secondo OpenAI e infine di un allora misterioso progetto volto a migliorare notevolmente la capacità di ragionamento dell'AI: Strawberry. Secondo la "scaletta dell'AI" stilata da OpenAI, una svolta del genere avrebbe portato la tecnologia intelligente ad un livello successivo ("Level 2 - Reasoners")

stadi dell'AI secondo OpenAI, scaletta
Come sappiamo, il tempo per l'AI scorre in fretta - forse troppo -  a tal punto che Strawberry, che a luglio era un progetto alla stregua del fantascientifico - è stato appena rilasciato, anche se con un nome diverso.

L'innovazione di OpenAI

Il 12 settembre 2024, OpenAI ha annunciato il lancio di o1, capostipite di una nuova generazione di modelli denominati "reasoning models". Questo avanzamento tecnologico si propone di risolvere problemi complessi con una velocità e un'accuratezza che superano le capacità umane. Allo stesso tempo è stato introdotto o1-mini, una versione più compatta ed economicamente accessibile del modello, equivalente alla versione mini di GPT 4o.

La specialità di o1

Ciò che distingue o1 dai suoi predecessori è la sua capacità di illustrare l'intero processo di ragionamento in modo trasparente e comprensibile. A tal fine, il modello utilizza l'apprendimento per rinforzo, una tecnica che permette all'AI di imparare secondo un sistema di ricompense e penalità. Inoltre, o1 ricorre a un approccio "chain of thought" per l'elaborazione delle query. Questo approccio innovativo consente a o1 di affrontare sfide complesse in ambiti quali matematica, scienze e programmazione con una precisione che rivaleggia, e in alcuni casi supera, quella degli esperti umani. In breve, o1 non si limita a fornire risposte, ma illustra passo dopo passo il percorso logico che lo conduce alla soluzione.

openai o1Fonte: OpenAI

L'interazione con o1 offre un'esperienza più simile al dialogo con un esperto umano. Quando affronta un problema complesso, il modello esprime il suo processo di pensiero con frasi come "Sto considerando...", "Analizziamo questo aspetto...", e "Procediamo con il prossimo passaggio...", creando l'illusione di un ragionamento umano in tempo reale.

Prestazioni straordinarie

I risultati ottenuti da o1 sono finora impressionanti. Nelle competizioni di programmazione online Codeforces, il modello ha raggiunto l'89° percentile contro  l'11° di gpt4o. Altrettanto notevole è stata la sua performance in un esame di qualificazione per l'Olimpiade Internazionale di Matematica: mentre il suo predecessore risolveva correttamente solo il 13% dei problemi, o1 ha ottenuto un sorprendente 83% di risposte esatte.

prestazioni o1Fonte: One Useful Thing

Le ambizioni di OpenAI non si fermano qui. L'azienda afferma che la prossima iterazione di questo modello sarà in grado di eguagliare le prestazioni di studenti di dottorato in compiti particolarmente impegnativi nei campi della fisica, della chimica e della biologia. 

Jerry Tworek, responsabile della ricerca presso OpenAI, ha dichiarato che o1 utilizza un algoritmo di ottimizzazione completamente nuovo e un set di dati di addestramento creato ad hoc. Diversamente dai modelli GPT precedenti, che erano programmati per emulare pattern dai loro dati di addestramento, o1 è stato addestrato per risolvere problemi autonomamente, attraverso l'apprendimento per rinforzo. Questa metodologia consente al modello di sviluppare strategie di problem-solving originali e adattive.

Limiti 

Nonostante le sue capacità straordinarie, è importante notare che o1 presenta - per il momento - alcuni limitazioni. Infatti, il modello non ha le stesse conoscenze generali sul mondo che ha gpt 4o, non possiede la capacità di navigare sul web, di elaborare file e immagini ed è significativamente più lento del suo predecessore: OpenAI ha dichiarato che il modello richiede un tempo considerevole per formulare le risposte, un compromesso necessario per garantire la profondità e l'accuratezza del ragionamento. Ma si noti che al momento o1 è in una fase  di "preview", il che significa che non è ancora stato perfezionato a dovere e sarà sicuramente aggiornato nei prossimi mesi.  Inoltre, come ha ammesso Tworek, sebbene il modello sembri avere meno allucinazioni rispetto a gpt 4o, il problema non è stato ancora risolto.

Accessibilità e disponibilità

OpenAI ha adottato un approccio graduale per l'introduzione di o1:

  • Gli utenti ChatGPT Plus e Team hanno accesso immediato sia a o1-preview che a o1-mini.
  • Gli utenti Enterprise ed Edu potranno accedere al modello dall'inizio della settimana successiva al lancio.
  • Per quanto riguarda o1-mini, OpenAI prevede di renderlo disponibile a tutti gli utenti gratuiti di ChatGPT, sebbene la data precisa non sia stata ancora comunicata.

È importante notare che, al momento, esiste una limitazione significativa sul numero di messaggi che o1 può elaborare, invitando gli utenti a un utilizzo oculato e strategico della risorsa.

L'aspetto economico dell'innovazione

L'accesso a tecnologie all'avanguardia come o1 comporta inevitabilmente dei costi. Nell'API, o1-preview ha un prezzo di $15 per 1 milione di token in input e $60 per 1 milione di token in output. Per contestualizzare, GPT-4o ha un costo di $5 per 1 milione di token in input e $15 per 1 milione di token in output. La differenza di prezzo è ovviamente legata alle capacità avanzate e alle risorse computazionali richieste da o1: è il prezzo dell'innovazione (e Sam Altman ha più volte ribadito che OpenAI non baderà a spese pur di raggiungere l'AGI).


Fonti e approfondimenti:
Ethan Mollick
The Verge