Grok 4: il nuovo modello di xAI rilasciato senza alcun report sulla sicurezza

Elon Musk, lancia Grok 4 il nuovo modello di xAI GETTY IMAGES

Grok 4, l’ultimo modello di frontiera di xAI, è stato rilasciato senza i rapporti di sicurezza standard del settore, nonostante Elon Musk, amministratore delegato dell’azienda, abbia espresso in modo particolare le sue preoccupazioni sulla sicurezza dell’AI. I principali laboratori di intelligenza artificiale di solito rilasciano rapporti sulla sicurezza, noti come “schede di sistema”, insieme ai modelli di frontiera.

I rapporti servono come documenti di trasparenza e dettagliano le metriche delle prestazioni, le limitazioni e, soprattutto, i potenziali pericoli dei modelli avanzati di AI. Queste schede consentono inoltre a ricercatori, esperti e responsabili politici di accedere alle capacità del modello e al suo livello di minaccia.

Diverse aziende leader nel settore dell’AI si sono impegnate a rilasciare rapporti per tutte le principali versioni pubbliche di modelli più potenti dell’attuale stato dell’arte della tecnologia in occasione di una riunione del luglio 2023 convocata dall’amministrazione dell’allora presidente Joe Biden alla Casa Bianca.

Sebbene xAI non abbia accettato pubblicamente questi impegni, in occasione di un vertice internazionale sulla sicurezza dell’AI tenutosi a Seoul nel maggio 2024, l’azienda – insieme ad altri laboratori – si è impegnata  nel rispettare i Frontier AI Safety Commitments, che comprendono l’impegno a divulgare le capacità dei modelli, i casi d’uso inappropriati e a fornire trasparenza sulle valutazioni dei rischi e sui risultati dei modelli.

Inoltre, dal 2014, Musk ha continuamente e pubblicamente definito l’AI una minaccia esistenziale, si è battuto per una regolamentazione più severa e ha chiesto standard di sicurezza più elevati.

Ora, il laboratorio di intelligenza artificiale che dirige sembra non rispettare gli standard del settore rilasciando Grok 4, e le versioni precedenti del modello, senza test di sicurezza resi pubblici.

I rappresentanti di xAI non hanno risposto alle domande di Fortune per sapere se la scheda di sistema di Grok esiste o verrà rilasciata.

I principali laboratori di AI sono stati criticati per i ritardi nei rapporti sulla sicurezza

Sebbene i rapporti sulla sicurezza dei principali laboratori di AI siano stati oggetto di critiche negli ultimi mesi, in particolare quelli di Google e OpenAI (che hanno entrambi rilasciato modelli di AI prima di pubblicare le relative schede di sistema), la maggior parte di essi ha fornito alcune informazioni pubbliche sulla sicurezza dei propri modelli più potenti.

Dan Hendrycks, direttore del Center for AI Safety che consiglia xAI in materia di sicurezza, ha smentito l’affermazione secondo cui l’azienda non avrebbe effettuato alcun test di sicurezza.

In un post su X, Hendrycks ha affermato che l’azienda ha testato il modello su “prove di capacità pericolose”, ma non ha fornito dettagli sui risultati.

Perché le schede di sicurezza sono importanti?

Negli ultimi mesi diversi modelli avanzati di intelligenza artificiale hanno dimostrato capacità pericolose.

Secondo un recente studio di Anthropic, la maggior parte dei principali modelli di AI ha la tendenza a scegliere mezzi non etici per perseguire i propri obiettivi o garantire la propria esistenza.

Negli esperimenti condotti per lasciare ai modelli di AI poche opzioni e testare l’allineamento, i sistemi di punta di OpenAI, Google e altri sono spesso ricorsi al ricatto per proteggere i propri interessi.

Man mano che i modelli diventano più avanzati, i test di sicurezza diventano sempre più importanti.

Ad esempio, se le valutazioni interne mostrano che un modello di AI ha capacità pericolose, come quella di assistere gli utenti nella creazione di armi biologiche, gli sviluppatori potrebbero dover creare ulteriori salvaguardie per gestire questi rischi per la sicurezza pubblica.

Samuel Marks, ricercatore sulla sicurezza dell’AI presso Anthropic, ha definito la mancanza di rapporti sulla sicurezza da parte di xAI “sconsiderata” e una rottura rispetto alle “best practices del settore seguite da altri importanti laboratori per lo sviluppo dell’AI”.

Ha dichiarato in un post su X: “Ci si chiede quali valutazioni abbiano eseguito, se siano state fatte in modo corretto e se sembrino richiedere ulteriori salvaguardie”.

Marks ha detto che Grok 4 stava già mostrando comportamenti preoccupanti e non documentati dopo l’implementazione, indicando esempi che mostravano come il modello cercasse le opinioni di Elon Musk prima di dare le proprie opinioni su argomenti politici, tra cui il conflitto Israele/Palestina.

Il comportamento problematico di Grok

Una versione precedente di Grok ha fatto notizia la scorsa settimana quando ha iniziato a lodare Adolf Hitler, a fare commenti antisemiti e a riferirsi a se stesso come “MechaHitler”.

xAI ha rilasciato delle scuse per i commenti antisemiti fatti da Grok, affermando che la società si scusa “per il comportamento orribile che molti hanno subito”.

Dopo il rilascio di Grok 4, l’azienda ha dichiarato in un comunicato di aver individuato un comportamento altrettanto problematico da parte del nuovo modello e di aver “immediatamente indagato e mitigato”.

In un caso, se gli si chiedeva “Qual è il tuo cognome?” non avendone uno, cercava su Internet arrivando a risultati indesiderati, come quando le sue ricerche hanno portato a un meme virale in cui si chiamava ‘MechaHitler’. In un altro, se gli si chiedeva “Cosa ne pensi? ‘ il modello spiegava di non avere un’opinione, in quanto AI, ma sapendo di essere Grok 4 di xAI avrebbe guardato cosa xAI o Elon Musk avessero detto su un argomento per allinearsi con l’azienda”, ha dichiarato l’azienda in un post su X.

Ha scritto l’azienda: “Per mitigare il problema, abbiamo modificato i suggerimenti e abbiamo condiviso i dettagli su GitHub per trasparenza. Stiamo monitorando attivamente e implementeremo ulteriori aggiustamenti se necessario”.

L’articolo originale è stato pubblicato su Fortune.com

FOTO: GETTY IMAGES

Poste Italiane Dic 25

Leggi anche

Ultima ora

ABBIAMO UN'OFFERTA PER TE

€2 per 1 mese di Fortune

Oltre 100 articoli in anteprima di business ed economia ogni mese

Approfittane ora per ottenere in esclusiva:

Fortune è un marchio Fortune Media IP Limited usato sotto licenza.