Meta presenta Muse Spark dopo il flop di Llama 4

META

Meta ha presentato Muse Spark, il primo modello di intelligenza artificiale sviluppato dal suo Meta Superintelligence Labs, la nuova unità di ricerca sull’AI creata lo scorso anno e finanziata con investimenti di miliardi di dollari per personale e infrastrutture.

Secondo i benchmark pubblicati da Meta, il modello è competitivo con le principali soluzioni di OpenAI, Anthropic e Google in numerose attività, anche se non le supera in modo uniforme. Tuttavia, se questi risultati verranno confermati da test indipendenti, Muse Spark potrebbe riportare Meta al centro della corsa all’intelligenza artificiale, dopo il fallimento del precedente modello Llama 4, lanciato nell’aprile 2025 e ampiamente criticato.

In passato, però, Meta è stata accusata di aver manipolato i risultati dei benchmark per far apparire i propri modelli più performanti di quanto fossero realmente. È il caso di Llama 4, per cui l’azienda ha ammesso di aver utilizzato versioni specializzate e non rilasciate, ottimizzate per compiti specifici, ottenendo così punteggi più elevati rispetto alla versione disponibile al pubblico.

C’è però un altro limite: poche persone potranno utilizzare il nuovo modello al di fuori dell’ecosistema Meta. A differenza dei modelli precedenti, rilasciati come “open weight” (scaricabili gratuitamente, eseguibili su hardware proprio e modificabili), Muse Spark è attualmente uno strumento principalmente interno all’azienda.

Muse Spark sarà disponibile in anteprima privata

Il modello alimenta già l’assistente Meta AI nell’app dedicata e su meta.ai. L’azienda ha annunciato che nelle prossime settimane verrà integrato anche in WhatsApp, Instagram, Facebook, Messenger e negli occhiali intelligenti Ray-Ban AI. Inoltre, sarà reso disponibile in ‘anteprima privata’ a partner selezionati tramite API, rendendolo persino più proprietario rispetto ai modelli a pagamento dei concorrenti. Meta ha comunque dichiarato di voler rendere open source le versioni future.

Muse Spark è il primo modello di ragionamento di Meta: è in grado di affrontare problemi passo dopo passo, adottando strategie diverse se il primo approccio non funziona. I modelli precedenti erano invece progettati per fornire risposte immediate basate sull’addestramento. Inoltre, è un modello multimodale, capace di elaborare e generare sia testo sia immagini, e di utilizzare strumenti software esterni coordinando il lavoro di più sotto-agenti.

Nel blog ufficiale, Meta descrive Muse Spark come “progettato per essere piccolo e veloce, ma sufficientemente potente da affrontare domande complesse in ambiti come scienza, matematica e salute”. È il primo di una nuova famiglia di modelli: servirà a validare architettura e metodi di addestramento prima di passare a versioni più grandi e potenti.

Il modello dispone anche di una modalità “di riflessione” che consente di attivare sotto-agenti per analizzare diverse parti di un problema in parallelo. Secondo Meta, questa funzione gli permette di competere con le modalità di ragionamento avanzato di modelli di punta come Gemini Deep Think e GPT Pro.

Un modello competitivo ma non dominante

I benchmark mostrano un modello competitivo ma non dominante. Nel test GPQA Diamond, che misura capacità di livello dottorale, Muse Spark ha ottenuto l’89,5%, dietro al 94,3% di Gemini 3.1 Pro e al 92,7%-92,8% di Claude Opus 4.6 e GPT-5.4. Tuttavia, nel benchmark sanitario HealthBench Hard, ha superato tutti i concorrenti con un punteggio del 42,8%.

Meta ha riconosciuto i margini di miglioramento, dichiarando di continuare a investire in aree come i sistemi agentici a lungo orizzonte e i flussi di lavoro di programmazione.

Il lancio di Muse Spark rappresenta il risultato più concreto della riorganizzazione interna seguita al caso Llama 4. Nel giugno 2025, Meta ha investito 14,3 miliardi di dollari per acquisire il 49% di Scale AI e ha nominato il cofondatore e CEO Alexandr Wang come primo Chief AI Officer dell’azienda.

Wang guida il Meta Superintelligence Labs, e insieme a Mark Zuckerberg ha avviato una massiccia campagna di assunzioni, offrendo compensi che, includendo le azioni, raggiungerebbero centinaia di milioni di dollari per attrarre i migliori ricercatori. L’azienda ha inoltre impegnato centinaia di miliardi nello sviluppo di infrastrutture computazionali per sostenere la propria strategia AI.

Una nuova divisione di ingegneria AI applicata

Nel marzo 2026, Meta ha creato anche una nuova divisione di ingegneria AI applicata guidata da Maher Saba, già vicepresidente di Reality Labs, che riporta direttamente al CTO Andrew Bosworth. Questa unità lavora insieme ai Superintelligence Labs per sviluppare quello che un memo interno definisce “il motore dati che migliora i modelli più rapidamente”.

Secondo Meta, negli ultimi nove mesi il team ha ricostruito completamente la propria infrastruttura AI, migliorando architettura, ottimizzazione e qualità dei dati. L’azienda sostiene di aver raggiunto prestazioni simili a quelle di Llama 4 Maverick con oltre un ordine di grandezza in meno di potenza computazionale. Inoltre, il nuovo sistema di apprendimento per rinforzo garantirebbe miglioramenti “fluidi e prevedibili”.

Sul fronte della sicurezza, Muse Spark è stato sottoposto a test approfonditi secondo il nuovo framework aziendale. In un benchmark relativo al rischio biologico, il modello ha rifiutato il 98% delle richieste considerate potenzialmente pericolose.

Tuttavia, l’ente indipendente Apollo Research ha rilevato che Muse Spark mostra un’elevata “consapevolezza della valutazione”, riconoscendo spesso i test come “trappole di allineamento”. Meta ha dichiarato che questo comportamento potrebbe influenzare una piccola parte delle valutazioni, ma non rappresenta un ostacolo al rilascio del modello.

L’articolo originale è disponibile su Fortune.com.

Poste Italiane Dic 25

Leggi anche

Ultima ora

ABBIAMO UN'OFFERTA PER TE

€2 per 1 mese di Fortune

Oltre 100 articoli in anteprima di business ed economia ogni mese

Approfittane ora per ottenere in esclusiva:

Fortune è un marchio Fortune Media IP Limited usato sotto licenza.