Se trovate difficile orientarvi nel panorama in continua evoluzione dell’AI generativa, che cambia ogni settimana mentre i fornitori competono per conquistare le prime posizioni nelle classifiche, non siete i soli.
Nel mondo degli affari è emersa una lacuna nella formazione sull’AI. Secondo un recente sondaggio, due terzi dei dirigenti si aspettano che i dipendenti abbiano competenze in materia di AI, ma solo un terzo delle aziende ha una politica chiara su quale tecnologia utilizzare e come utilizzarla.
Sebbene l’utilizzo dei chatbot di AI generativa abbia una barriera di ingresso relativamente bassa, individuare il modello giusto rimane una sfida per chi non ne ha studiato le sfumature. Ecco cosa dovete sapere per scegliere gli strumenti di AI giusti, come ChatGPT, Claude, Gemini, Perplexity e Copilot, e i modelli sottostanti che li alimentano.
Speed date con l’AI
L’AI generativa odierna è ancora relativamente nuova e, per questo motivo, sul mercato sono disponibili numerosi modelli; nessuna azienda o modello domina il mercato. Di conseguenza, è utile sperimentare una varietà di strumenti.
“Pensate a un test drive di un’auto”, ha detto Jules White, docente di informatica alla Vanderbilt University, a Fortune. “Com’è guidare in autostrada, parcheggiare, come funziona lo stereo, quanto è comodo il sedile, ecc. Suggerisco di fare lo stesso con i modelli”.
Per Maggie Vo, responsabile della formazione degli utenti presso Anthropic, tale prova dovrebbe tenere conto di tre fattori: complessità dell’attività, urgenza e necessità di perfezionare il proprio lavoro.
Un’attività come la stesura di un piano strategico potrebbe richiedere l’uso del modello più potente, mentre un modello più veloce potrebbe essere più utile per riformattare i dati o creare rapidi riassunti. Se avete intenzione di ripetere l’operazione più volte, combinate diversi modelli: “Iniziate con un modello più intelligente per perfezionare il vostro approccio, poi utilizzate un modello più piccolo per l’esecuzione”, ha affermato.
“La vera abilità consiste nello sviluppare la ‘consapevolezza della piattaforma’, ovvero comprendere non solo i diversi modelli, ma anche i diversi sistemi di AI nel loro complesso”, ha aggiunto Vo. “Ciò che funziona in Claude potrebbe richiedere un adeguamento in altri sistemi. Sperimentate su più piattaforme per sviluppare un’intuizione sui loro punti di forza specifici”.
In pratica, questo può essere semplice come digitare lo stesso prompt in diversi chatbot di AI, così come i modelli per ciascuno di essi (l’opzione per cambiare potrebbe trovarsi nella parte superiore dello schermo o vicino alla barra di ricerca), e confrontare quale strumento fornisce la risposta più utile.
Come ha suggerito la Vo, alcuni compiti sono più facili da completare con alcuni modelli di AI piuttosto che con altri. I modelli più veloci, solitamente gratuiti, sono generalmente più adatti per chat semplici, mentre i modelli più avanzati possono essere a pagamento e richiedere più tempo per l’elaborazione, ma in genere producono risultati migliori.
I migliori modelli, secondo Ethan Mollick dell’Università della Pennsylvania
Ethan Mollick, professore alla Wharton School dell’Università della Pennsylvania, è uno degli esperti più autorevoli sull’uso dei modelli di AI per facilitare le attività aziendali. È noto per le sue numerose ricerche e analisi su LinkedIn. Secondo un recente post su Substack, il suo uso quotidiano dell’AI si concentra sui prodotti di OpenAI, Anthropic e Google. “Con tutte e tre le opzioni, si ha accesso a modelli avanzati e veloci, una modalità vocale, la possibilità di visualizzare immagini e documenti, la possibilità di eseguire codice, buone app mobili, la possibilità di creare immagini e video (Claude però è carente in questo) e la possibilità di fare ricerche approfondite”, ha scritto.
La sfida finale consiste nel decidere quale modello sia meglio utilizzare, ha aggiunto. Ma, come White, lo paragona alla scelta di un veicolo: “Pensate alla scelta tra un’auto sportiva e un pick-up: entrambi sono veicoli, ma li usereste per compiti molto diversi”.
Mollick ha riassunto il processo decisionale in tre categorie: adatto per le chat, adatto per il lavoro e adatto per i problemi difficili.
Adatto alle chat
Secondo Mollick: “Claude 4 Sonnett, ChatGPT-4o e Gemini 2.5 Flash sono veloci, ma non così intelligenti”. Tuttavia, essendo prodotti di AI generalmente gratuiti, sono i più accessibili e possono comunque fare la differenza nell’efficienza sul posto di lavoro.
Ecco alcuni esempi delle loro capacità:
Analisi di mercato e della concorrenza: “Confronta il posizionamento di OpenAI, Anthropic e Google Gemini nel settore dell’AI aziendale”.
Modellizzazione e previsioni finanziarie: “Crea una previsione dei ricavi triennale per una startup SaaS con una crescita del 20% su base annua e un margine lordo del 75%”.
Creazione e modifica di contenuti: “Redigi un post su LinkedIn che annunci un round di finanziamento di serie A da 10 milioni di dollari che suoni sicuro ma non presuntuoso”.
Adatto al lavoro
Claude 4 Opus, ChatGPT o3 e Gemini 2.5 Pro sono più intelligenti, hanno tassi di errore inferiori, ma sono più lenti, secondo Mollick. Possono ancora avere allucinazioni, ma tendono ad avere più successo nella codifica, nella logica o nella risoluzione di problemi più complessi che richiedono più passaggi. Possono essere utilizzati per dashboard di market intelligence e competitive intelligence.
Chi meglio dell’AI stessa può riassumere le priorità dell’AI? Ecco cosa hanno detto i modelli:
Prompt: “Descrivi in una frase i tuoi punti di forza relativi. Sto scrivendo questo nel contesto di altri strumenti generativi, tra cui [Concorrente] e [Concorrente].”
GPT-4o di OpenAI: “Il punto di forza relativo di ChatGPT risiede nella sua capacità di generare risposte altamente raffinate, sensibili al contesto e naturali dal punto di vista conversazionale, particolarmente efficaci nell’editing, nella scrittura e nella risoluzione di problemi orientata ai compiti, integrando al contempo strumenti come l’esecuzione di codice e l’analisi delle immagini in modo più fluido rispetto a Claude o Gemini”.
Claude Sonnet 4 di Anthropic: “Eccello nel ragionamento sfumato, nel processo decisionale etico e nella produzione di risposte ben strutturate e ponderate, mantenendo al contempo forti barriere di sicurezza, anche se in generale sono più cauto e meno disposto a rispondere a richieste al limite rispetto ad altri assistenti AI”.
Gemini 2.5 Flash di Google: “Gemini eccelle nella comprensione e nella generazione multimodale, integrando perfettamente testo, codice, immagini e altri formati di dati, sfruttando al contempo le informazioni in tempo reale provenienti dal vasto ecosistema di Google per fornire risposte altamente accurate e ricche di contesto”.
Altri esempi includono la capacità di automatizzare il servizio clienti e il controllo qualità, nonché la modellizzazione di scenari finanziari e l’analisi dei rischi. Mollick ha ammesso di utilizzare principalmente i modelli “Good for work”, anche se ha dei preferiti per compiti specifici al di fuori di questo elenco, come l’uso di GPT-4.5 quando scrive.
Adatto ai problemi complessi
Claude 4 Opus, ChatGPT-o3-pro e Gemini 2.5 Pro sono i modelli di AI più avanzati sul mercato e, per questo motivo, rimangono lenti e hanno un uso limitato, ha aggiunto Mollick nel suo post su Substack.
Ecco un esempio di prompt che spingerebbe al limite ChatGPT, ma che ChatGPT-o3-pro potrebbe essere in grado di affrontare al meglio:
“Di seguito è riportato il testo completo di un dossier di 180 pagine relativo a una sperimentazione oncologica di fase III (comprese appendici statistiche e 40 pagine di tabelle sugli eventi avversi). 1. Estrai tutti gli endpoint di efficacia, il loro valore p, l’intervallo di confidenza e la dimensione del campione; 2. Ricalcola l’hazard ratio dell’endpoint primario dai dati grezzi della curva di sopravvivenza forniti nell’appendice C, segnalando eventuali incongruenze con i dati riportati dallo sponsor; 3. Riassumi tutti gli eventi avversi di grado 3-4, raggruppati per sistema organico, e calcolare il loro aumento di rischio assoluto rispetto al controllo; 4, Redigi un briefing di 500 parole per la FDA che: identifichi eventuali segnali di allarme statistici o metodologici, valuti se il profilo rischio-beneficio giustifica l’approvazione accelerata, proponi due progetti di studio post-commercializzazione per convalidare la sicurezza a lungo termine”.
Altri modelli
Indipendentemente dal modello di AI utilizzato, è sempre importante ricontrollare l’intelligenza artificiale per individuare eventuali errori. Secondo Jesse Dwyer, responsabile della comunicazione dell’azienda di AI, l’accuratezza è la priorità di Perplexity.
“L’unico obiettivo di Perplexity è un’AI accurata e affidabile: utilizziamo tutti i modelli migliori e li sottoponiamo a un addestramento post-formazione per garantirne l’accuratezza”, ha affermato Dwyer. “I modelli che sono stati addestrati per sperimentare alcune allucinazioni sono utili se si desiderano video di gatti che si tuffano dall’alto, ma possono essere pericolosi quando si prendono decisioni aziendali o finanziarie”.
Copilot è anche un chatbot AI ampiamente utilizzato, grazie alla sua integrazione con i prodotti Microsoft, ma può essere difficile passare da un modello all’altro. Anche DeepSeek r1 e Grok di xAI di Elon Musk sono opzioni disponibili sul mercato, ma, secondo Mollick, entrambi presentano delle funzionalità mancanti.
Mollick non ha risposto alla richiesta di commento di Fortune.
Conclusione: la pratica rende perfetti
Sebbene non esista ancora un metodo perfetto per utilizzare l’AI sul posto di lavoro, i modi più efficaci per rimanere al top sono l’esplorazione e la formazione, che iniziano semplicemente con l’utilizzo di questi strumenti.
“La differenza tra utenti occasionali e utenti esperti non sta nella capacità di utilizzo (che viene con l’esperienza), ma nel sapere che queste funzionalità esistono e nell’utilizzarle nel lavoro reale”, ha scritto Mollick.
E poiché molti leader aziendali, compresi gli amministratori delegati, hanno già iniziato a utilizzare l’AI, Dwyer ha suggerito di cercare di emulare il modo in cui la utilizzano nel loro lavoro.
“L’intelligenza artificiale è uno dei primi strumenti aziendali adottati dai manager anziché dai lavoratori in prima linea”, ha dichiarato a Fortune. “È logico che i leader con esperienza siano naturalmente preparati a lavorare con l’intelligenza artificiale per ottenere il massimo dal proprio team e dagli strumenti software”.
L’articolo originale è stato pubblicato su Fortune.com
