Londra, OpenAI e Meta stanno per rilasciare nuovi modelli di intelligenza artificiale che sostengono saranno capaci di ragionare e pianificare, passi fondamentali verso il raggiungimento di una cognizione sovrumana nelle macchine.
Gli annunci durante un evento a Londra
Questa settimana, i dirigenti di OpenAI e Meta hanno annunciato che si stanno preparando a lanciare le prossime versioni dei loro grandi modelli di linguaggio, i sistemi che alimentano le applicazioni di intelligenza artificiale generativa come ChatGPT.
Meta ha dichiarato che inizierà a distribuire Llama 3 nelle prossime settimane, mentre OpenAI, sostenuta da Microsoft, ha indicato che il suo prossimo modello, previsto per essere chiamato GPT-5, arriverà “presto”.
“Stiamo lavorando duramente per capire come far sì che questi modelli non solo parlino, ma effettivamente ragionino, pianifichino… abbiano memoria”, ha detto Joelle Pineau, vicepresidente della ricerca sull’intelligenza artificiale presso Meta.
Il direttore operativo di OpenAI, Brad Lightcap, ha dichiarato al Financial Times in un’intervista che la prossima generazione di GPT mostrerà progressi nella risoluzione di “problemi difficili” come il ragionamento.
“Stiamo per iniziare a vedere un’intelligenza artificiale che può affrontare compiti più complessi in modo più sofisticato”, ha detto. “Penso che stiamo appena cominciando a grattare la superficie delle capacità di ragionamento di questi modelli.”
Il ritmo dei progressi sta accelerando
I miglioramenti di Meta e OpenAI fanno parte di una serie di nuovi grandi modelli di linguaggio che saranno rilasciati quest’anno da aziende come Google, Anthropic e Cohere.
Poiché le aziende tecnologiche si affrettano a creare intelligenza artificiale generativa sempre più sofisticata – software in grado di creare parole, immagini, codice e video umanoidi di qualità indistinguibile dall’output umano – il ritmo dei progressi sta accelerando.
Il ragionamento e la pianificazione sono passaggi fondamentali verso ciò che i ricercatori di intelligenza artificiale chiamano “intelligenza generale artificiale” – la cognizione di livello umano – perché permettono a chatbot e assistenti virtuali di completare sequenze di compiti correlati e prevedere le conseguenze delle loro azioni.
Agenti di intelligenza artificiale sempre meno stupidi
Parlando in un evento a Londra martedì, il capo scienziato dell’intelligenza artificiale di Meta, Yann LeCun, ha detto che attualmente i sistemi di intelligenza artificiale “producono una parola dopo l’altra senza pensare e pianificare”.
Poiché faticano a gestire domande complesse o a mantenere informazioni per lungo tempo, fanno ancora “stupidi errori”, ha detto.
Aggiungere il ragionamento significherebbe che un modello di intelligenza artificiale “cercasse possibili risposte”, “pianificasse la sequenza di azioni” e costruisse un “modello mentale di quali saranno gli effetti delle sue azioni”, ha detto.
Si tratta di un “grande pezzo mancante su cui stiamo lavorando per far sì che le macchine raggiungano il prossimo livello di intelligenza”, ha aggiunto.
LeCun ha detto che si sta lavorando su “agenti” di intelligenza artificiale che potrebbero, ad esempio, pianificare e prenotare ogni passo di un viaggio, dall’ufficio di qualcuno a Parigi a un altro a New York, compreso il raggiungimento dell’aeroporto.
Integrazioni anche per Whatsapp e gli occhiali intelligenti Ray-Ban
Meta prevede di integrare il suo nuovo modello di intelligenza artificiale in WhatsApp e nei suoi occhiali intelligenti Ray-Ban. Si sta preparando a rilasciare Llama 3 in una serie di dimensioni di modello, per diverse applicazioni e dispositivi, nei prossimi mesi.
Lightcap ha aggiunto che OpenAI avrebbe “qualcosa di più da dire presto” sulla prossima versione di GPT.
“Nel tempo, vedremo i modelli affrontare compiti più lunghi e complessi”, ha detto. “E ciò richiede implicitamente il miglioramento della loro capacità di ragionamento.”
Al suo evento a Londra, Chris Cox, direttore del prodotto di Meta, ha detto che le telecamere negli occhiali Ray-Ban di Meta potrebbero essere utilizzate per guardare, ad esempio, una macchina del caffè rotta, e un assistente di intelligenza artificiale – alimentato da Llama 3 – spiegherebbe al portatore come ripararla.
“Parleremo con questi assistenti di intelligenza artificiale tutto il tempo”, ha detto LeCun.