Magazine, Tecnologia

Umani vs. umani: il rischio di delegare ragionamento, creatività e conoscenza agli Llm

Le macchine non hanno ancora raggiunto la genialità di Einstein, e per come sono costruite non possono farlo. Ma sempre più spesso deleghiamo agli Llm conoscenza e creatività. Ecco perché è un rischio enorme.

“L’immaginazione è più importante della conoscenza. La conoscenza è limitata, l’immaginazione abbraccia il mondo”. Albert Einstein usava questa frase a ragion veduta: anche lui utilizzava l’immaginazione per creare esperimenti mentali (Gedankenexperiment), per visualizzare teorie fisiche prima ancora di dimostrarle. Un Llm sarebbe in grado di raggiungere quei livelli di genialità creativa? La risposta breve è no, ma forse non è questo il concetto più importante: il punto è che nonostante le macchine non abbiano i nostri livelli di creatività, stiamo comunque delegando a loro il modo in cui ragioniamo, creiamo e, soprattutto, conosciamo.

Un paper pubblicato a dicembre su Nature Human Behaviour confronta la creatività negli esseri umani e nei modelli linguistici di grandi dimensioni. La buona notizia: in media, siamo in testa noi. Come ricorda lo stesso paper (‘A large scale comparison of divergent creativity in humans and Llm’) le collaborazioni uomo-macchina sono ormai una realtà incontrovertibile, ma sappiamo poco della comparazione tra le nostre capacità di creare qualcosa di nuovo e quelle di un’intelligenza artificiale.

I risultati chiave: la creatività umana in media è leggermente superiore a quella degli Llm, ma le differenze sono più pronunciate agli estremi, con gli esseri umani che mostrano livelli più elevati di creatività nella fascia più alta di risultati positivi. In sostanza, il top 10% degli esseri umani è più creativo del top 10% dei modelli AI.

Per mettere alla prova un campione di umani e diversi large language model i ricercatori hanno usato il Dat, il Divergent Association Task, un test usato in psicologia che misura la capacità di generare soluzioni che divergono da quelle conosciute chiedendo di nominare un set di sostantivi che differiscono il più possibile l’uno dall’altro senza l’aiuto di spunti esterni. Una forma di creatività chiamata ‘pensiero divergente’ che è alla base della capacità umana di trovare nuove soluzioni a problemi aperti, spiegano i ricercatori.

Fornire l’eccellenza umana come esempio da seguire dà risultati sorprendenti. I ricercatori hanno provato ad ‘aumentare’ la creatività dei Llm attraverso prompt, con l’istruzione di ‘impersonare’ personaggi geniali come (appunto) Albert Einstein, Leonardo da Vinci, Marie Curie, Steve Jobs e anche Oprah Winfrey. Risultato: output peggiore. In generale, se si spingono gli Llm a pensare in modo più creativo, le macchine sono portate a restituire soluzioni ‘false’. L’utilizzo dei chatbot anche nei compiti creativi è ormai un dato di fatto. Il punto è che, secondo i ricercatori, va fatto con cognizione di causa, un monito che molti utenti spesso sembrano dimenticare. “Nel complesso, i risultati suggeriscono che le partnership uomo-macchina dovrebbero essere applicate a seconda della fase del processo creativo. Gli Llm possono aiutare nelle prime fasi”, avvisa il team di ricerca.

Non è un avvertimento che vale solo per i compiti creativi.

La scorsa estate un uomo ha interrogato ChatGpt sulla possibilità di rimuovere il cloruro di sodio dalla sua dieta, preoccupato dagli effetti negativi del sale da tavola.

Consigliato dal chatbot, lo ha rimosso completamente, sostituendolo con il bromuro di sodio. Secondo l’articolo scientifico che ha riportato il caso il 60enne ha sviluppato bromismo, una sindrome che una volta contribuiva a quasi un ricovero psichiatrico su 10: non è più un problema dagli inizi del ‘900, quando il bromuro di sodio veniva usato come sedativo. Gli autori dell’articolo, dell’Università di Washington a Seattle, hanno affermato che il caso ha evidenziato “come l’uso dell’intelligenza artificiale possa potenzialmente contribuire allo sviluppo di esiti negativi prevenibili sulla salute”.

Qual è stato qui l’errore? Non certo cercare un’informazione con un chatbot, che è diventata quasi una scelta obbligata: non è un caso se Google mostra la risposta del suo prima ancora dei tradizionali risultati di ricerca. Fidarsi ciecamente dell’output di quel chatbot – quello è l’errore secondo gli esperti. Perché non ci si sta fidando di un’informazione verificata, ma di una risposta plausibile dal punto di vista linguistico.

In generale, spiega Walter Quattrociocchi, professore ordinario di informatica all’università Sapienza di Roma, il problema riguarda la costruzione di cognizioni senza metacognizione. Tradotto: affidiamo agli Llm l’incarico di insegnarci qualcosa quando non hanno la possibilità loro, in prima battuta, di capirla. Ci affidiamo alla conoscenza solo apparente di modelli addestrati a generare la risposta più probabile a un determinato input. La testimonianza sono proprio i compiti creativi: “Gli Llm operano su uno spazio statistico e prediligono la media, lo standard. La vera creatività risiede invece da combinazioni di skill ed eventi rari”, spiega Quattrociocchi.

Nel paper pubblicato su Pnas a ottobre con il suo gruppo di ricerca (‘The simulation of judgment in Llms’) Quattrociocchi ha illustrato il concetto di epistemia, che indica appunto l’illusione della conoscenza data dalla plausibilità delle risposte di un chatbot.

In un altro paper pubblicato a dicembre, Quattrociocchi è andato più in profondità: ci sono in particolare sette ‘linee di faglia epistemiche’ tra umani e Llm, e riguardano ancoraggio, analisi, esperienza, motivazione, ragionamento causale, metacognizione e valore. In sostanza, una mappa dei passaggi attraverso cui si forma un giudizio umano e di quelli che gli Llm replicano: anche quando l’output finale sembra simile, nei sette punti evidenziati dallo studio i due processi divergono molto.

“Chiamiamo la condizione risultante epistemia: una situazione strutturale in cui la plausibilità linguistica sostituisce la valutazione epistemica, producendo la sensazione di sapere senza il lavoro del giudizio”, recita lo studio.

Gli Llm, in sostanza, non formano credenze o modelli del mondo, spiega il professore con una certa irritazione per le narrazioni salvifiche o apocalittiche (a seconda dei casi) sulle potenzialità dell’intelligenza artificiale: i pericoli dell’Agi, l’intelligenza artificiale generale che in teoria dovrebbe essere il fine ultimo di player come OpenAI e Anthropic, sarebbero solo parte di una strategia di marketing. “E quando la conoscenza si mischia con il marketing”, spiega Quattrociocchi, “il risultato è quasi sempre confusione e un dibattito pubblico distorto”.

Intanto, la conoscenza viene sostituita, e in un altro paper firmato dal professore si fa l’esempio di Grokipedia, la versione muskiana di Wikipedia basata su AI generativa. Un’enciclopedia generativa dove spariscono fonti discordanti, opinioni e chiaroscuri, in favore di un linguaggio più fluido che mette al primo posto la plausibilità. In poche parole, ha scritto Quattrociocchi, l’approssimazione statistica che sostituisce la verifica.

L’articolo originale è stato pubblicato sul numero di Fortune Italia di marzo 2026 (numero 2, anno 9)