Anthropic sta rendendo disponibile al grande pubblico il suo primo modello di classe Mythos. Martedì il laboratorio di intelligenza artificiale ha annunciato il rilascio di Fable 5 – il primo lancio su larga scala di un modello appartenente a una categoria significativamente più potente – come versione general availability, mentre Claude Mythos 5 sarà accessibile ai partner selezionati che già utilizzano Claude Mythos Preview.
Si tratta di un passo importante per l’azienda, che inizialmente aveva considerato i modelli di classe Mythos troppo pericolosi da distribuire a causa della loro maggiore capacità di individuare vulnerabilità informatiche. La decisione arriva inoltre poco più di una settimana dopo il deposito riservato della documentazione per la quotazione in borsa (Ipo).
Fortune aveva riportato per la prima volta l’esistenza del nuovo e più potente modello a marzo, dopo che una fuga di dati ne aveva rivelato la presenza. Ad aprile, Anthropic aveva annunciato ufficialmente Mythos, definendolo un “salto di qualità” nelle capacità dell’AI. L’azienda aveva scelto di controllarne rigorosamente la diffusione attraverso un’iniziativa chiamata Project Glasswing.
L’obiettivo del progetto era fornire ai professionisti della cybersicurezza l’accesso alle capacità informatiche del modello, consentendo loro di rafforzare le difese contro le nuove minacce poste da sistemi di intelligenza artificiale sempre più avanzati.
Ora Anthropic sostiene di essere sufficientemente fiduciosa nei nuovi sistemi di sicurezza da impedire che queste capacità potenzialmente pericolose finiscano nelle mani sbagliate.
“Il motivo per cui stiamo rilasciando Fable 5 proprio adesso è che ci sentiamo molto più sicuri delle misure di protezione che abbiamo implementato”, ha dichiarato a Fortune Dianne Na Penn, responsabile della gestione prodotti, della ricerca e dei laboratori di Anthropic.
L’azienda ha spiegato che le risposte relative ad aree considerate ad alto rischio, come biologia e cybersicurezza, verranno bloccate e, nella maggior parte dei casi, sostituite dalle risposte generate da Claude Opus 4.8, il modello meno potente lanciato all’inizio dell’anno. Il timore è che offrire un accesso libero a un’intelligenza di livello Mythos possa consentire a soggetti malevoli di realizzare attacchi informatici più sofisticati o sviluppare armi biologiche con maggiore facilità.
Anthropic ha inoltre affermato di aver sottoposto a severi test i propri classificatori – algoritmi di machine learning – per verificarne la resistenza ai tentativi di aggiramento delle restrizioni.
Secondo l’azienda, le capacità del nuovo modello “superano quelle di qualsiasi altro modello che abbiamo precedentemente reso disponibile al pubblico” e mostrano prestazioni eccezionali in settori come la programmazione, il lavoro basato sulla conoscenza e l’analisi visiva.
Penn ha sottolineato che Fable 5 eccelle in particolare nella cosiddetta “gestione della memoria a lungo termine”, ovvero la capacità di un modello di AI di mantenere il controllo e la comprensione di compiti lunghi e complessi.
Mentre i modelli precedenti tendevano talvolta a “perdere il filo” durante attività particolarmente articolate, il nuovo sistema è molto più efficace nel ricordare il contesto e gli obiettivi per periodi prolungati. Penn ha inoltre evidenziato miglioramenti nella capacità di auto-verifica e nel rispetto delle istruzioni: il modello controlla con maggiore attenzione il proprio lavoro, verifica le ipotesi formulate e corregge eventuali errori prima di fornire una risposta definitiva.
Questi cambiamenti, ha spiegato, si traducono in una qualità complessiva più elevata sia nei compiti di programmazione sia in quelli non legati al coding.
“Pensiamo che in alcuni casi possa sostituire attività di lavoro intellettuale, che si tratti di programmazione o di altri ambiti, ma riteniamo anche che stia ampliando notevolmente i casi d’uso”, ha affermato Penn. “Ora è possibile utilizzare un modello come Fable 5 per gestire progetti molto complessi e di lunga durata, potenzialmente durante la notte. Ciò potrebbe includere, ad esempio, la revisione completa di una base di codice per individuare possibili miglioramenti.”
“Raccomandiamo ai clienti di affidare a Fable 5 i compiti più impegnativi“, ha aggiunto.
Il laboratorio ha dichiarato che i primi dati mostrano come almeno il 95% delle sessioni Fable venga gestito interamente dalle risposte del modello stesso, senza dover essere reindirizzato a Opus. Tuttavia, Anthropic in passato ha ricevuto critiche da alcuni utenti che sostengono che i filtri di sicurezza dell’azienda tendano talvolta a bloccare richieste innocue o a rifiutare erroneamente determinate domande.
Penn ha riconosciuto che le nuove protezioni potrebbero non essere perfette fin dall’inizio.
“Riconosciamo che alcune richieste legittime potrebbero essere bloccate nelle prime fasi”, ha dichiarato. “Stiamo lavorando attivamente per migliorare queste misure di sicurezza dopo il lancio, ma volevamo rendere il modello disponibile al pubblico in modo sicuro il prima possibile”.
Fable 5 e Mythos 5 saranno offerti a un costo di 10 dollari per milione di token in input e 50 dollari per milione di token in output, un prezzo doppio rispetto alla versione standard di Opus 4.8, il modello più avanzato dell’azienda prima dell’arrivo della nuova generazione.
L’articolo originale è su Fortune.com
