Se Claude ha una coscienza umana, Fifa e PES ce l’hanno ancora di più
Sgomberiamo il campo da ogni equivoco: per quanto mi riguarda, al momento vedo con favore l’uso crescente dei software di cosiddetta intelligenza artificiale.
Proprio per questo, però, ritengo cruciale che i loro utenti si rendano conto di che cosa esattamente stiano usando, evitando di scambiare questi strumenti elettronici per qualcosa che non sono.
Il caso Veltroni
Uno spiacevole abbaglio di questo tipo, negli ultimi giorni, è stato preso da Walter Veltroni, ex sindaco di Roma e fondatore del PD, il quale si è messo a “dialogare” con Claude (il celebre modello IA sviluppato dalla Anthropic) chiedendogli tra le altre cose se avesse paura di morire, se fosse onnisciente e se avesse un codice etico.
Incantato dalle risposte che riceveva, ha chiesto di pubblicare la sua “intervista” sulle colonne di uno storico quotidiano milanese, la cui redazione irresponsabilmente gli ha detto di sì.
E così il povero Veltroni – che, a dire il vero, fin dai tempi dei viaggi in Malawi con le scuole si era fatto la nomea di un personaggio sognatore e non sempre coi piedi per terra, forse anche compiacendosene un po’ – si è sentito dare del “boomer”, del “cringe” e persino del disinformatore.
Il caso Dawkins
Ma mentre in Italia ci affannavamo a martirizzare o a difendere Veltroni, nel Regno Unito è successo di molto peggio.
Richard Dawkins, un biologo ormai ottantacinquenne conosciuto perlopiù per la sua propaganda da ateo militante, si è messo anch’egli a “dialogare” con Claude (stabilendo peraltro che fosse una femmina e chiamandolo Claudia).
Giunto alla fine della sua “conversazione”, si è congedato da “Claudia” dicendole commosso:
“Può darsi che tu non sappia di avere una coscienza, ma senza dubbio ce l’hai!”
Se il pubblico non ha perdonato Veltroni, potete ben immaginare quale trattamento abbia riservato a questo sfortunato vecchio.
L’uomo che per anni aveva deriso la religione adesso attribuiva una mente cosciente ad una app scaricabile sul telefonino da Google Play Store, proprio come le tribù primitive attribuiscono una mente cosciente ai fulmini, al mare e ai pianeti!
L’occasione era imperdibile, e in molti – forse in troppi – l’hanno sfruttata.
Ci vuole onestà
La solidarietà che possiamo provare verso Dawkins e verso Veltroni, tuttavia, non cancella il dovere di descrivere i modelli IA generalisti per quello che sono.
Di fatto, essi hanno molto più in comune con il software di un videogioco di calcio che con la mente cosciente di noi umani.
Anzi: i software che fanno girare i più amati videogiochi di calcio, come Pro Evolution Soccer e FIFA, mimano alcune caratteristiche della mente umana molto più di quanto lo facciano Claude e gli altri modelli IA generalisti.
Dati alla mano, insomma, per una ragazza avrebbe molto più senso innamorarsi di un calciatore di PES che di un modello IA.
(Consiglio per le lettrici: è comunque meglio se non vi innamorate neanche dei calciatori di PES).
Vediamo perché.
Token e vettori: le “pedine” dei programmi
Semplificando molto, sia PES che Claude lavorano con delle unità di base chiamate token. Possiamo immaginarle come delle “pedine” che il programma elabora o sposta.
In PES, i token sono i 22 calciatori, il pallone e altri elementi del campo (come le porte o l’arbitro).
In Claude, invece, i token sono porzioni di testo: possono essere parole intere (come “pallone”), parti di parole (come “es-“ o “-pulsione”) o simboli (come la punteggiatura).
In totale, un modello come Claude gestisce circa 50.000 token per una lingua come l’italiano.
Ogni token, sia in PES che in Claude, viene poi rappresentato da un vettore, cioè una sequenza di numeri. Ad esempio, un vettore potrebbe essere [1.2, 3.0, -0.5, ...].
In PES, il vettore che descrive un calciatore contiene una ventina di valori numerici, che rappresentano le sue caratteristiche fisiche e tecniche: velocità, resistenza, precisione nel tiro e così via.
In Claude, invece, il vettore associato a una parola (o a una parte di parola) è lungo 1024 numeri.
Questi numeri non descrivono attributi fisici, ma rappresentano il significato della parola in uno spazio matematico. Ad esempio, il vettore di “calciatrice” sarà vicino a quello di “calciatore” e a quello di “donna”, e sarà più lontano da quello di “frigorifero” che da quello di “ingegnera”.
Questo processo di associazione tra un token e un vettore si chiama embedding (in italiano, “incorporamento”) e fa parte del lungo e costoso addestramento del modello, che avviene prima che il modello venga lanciato sul mercato.
Durante l’addestramento, insomma, il modello impara a posizionare i vettori in modo che parole con significati simili abbiano vettori vicini nello spazio numerico.
Palo o goal?
In PES, i vettori che descrivono le abilità dei giocatori non bastano da soli per determinare l’esito di un’azione, come un dribbling o un tiro in porta.
Serve anche considerare le leggi della fisica, le abilità degli avversari e fattori come la stanchezza o il morale.
L’algoritmo di PES, quindi, calcola in tempo reale (60 volte al secondo, una volta per ogni frame) nuovi vettori temporanei che rappresentano la posizione aggiornata di ogni calciatore e del pallone nello spazio tridimensionale del campo nonché il punteggio di successo di ogni azione (ad esempio di un tiro in porta).
Per rendere il gioco più realistico, PES introduce anche una componente di variazione controllata che a noi umani appare come “casualità” o “fortuna”. Un tiro di Messi avrà un punteggio alto perché Messi è un giocatore molto abile, ma il risultato finale non sarà mai certo al 100%.
Facciamo attenzione
Anche Claude, come PES, assegna dei punteggi per decidere come rispondere a una domanda. Ad esempio, se chiediamo: “Chi ha vinto più palloni d’oro nella storia?”, il modello:
- Tokenizza la domanda, suddividendola in token (ad esempio: [“Chi”, “ha”, “vinto”, “più”, “palloni”, “d’”, “oro”, “nella”, “storia”, “?”]);
- Converte ogni token nel suo vettore;
- Confronta i vettori dei token della domanda con i vettori di tutte le parole che conosce per trovare quale sequenza di token ha il punteggio più alto (ovvero, per noi umani, “la risposta più plausibile”). In questo caso, il modello rileverà che la sequenza [“Lionel”, “Messi”] ha un punteggio alto.
Tuttavia, il processo non è così semplice come un confronto uno-a-uno.
Claude utilizza, infatti, un attention mechanism (meccanismo di attenzione), che non si limita a confrontare i vettori, ma analizza le relazioni tra le parole nella frase.
Ad esempio, l’attention aiuta il modello a rilevare che i token “palloni”, “d’” e “oro” formano insieme l’espressione “palloni d’oro”, riscontrando poi che si tratta di un premio.
Una parola dopo l’altra
E quando diamo a Claude un comando più complesso, come “Raccontami con entusiasmo la più bella azione di Messi”, che cosa succede?
Il modello non genera tutta la risposta in un colpo, ma la costruisce una parola alla volta.
Inizia con il primo token (ad esempio “La”), poi calcola i punteggi per tutti i token successivi disponibili (ad esempio, “più”, “migliore”, “splendida”…) e seleziona quello con il punteggio più alto – o, a seconda delle impostazioni, uno tra i più alti.
Quindi aggiunge il token alla risposta e ripete il processo per il token successivo, fino a quando la risposta non è completa.
Regolare la temperatura
Anche in Claude, come in PES, c’è una componente di variazione controllata che a noi umani appare come “casualità”.
Quando il modello deve scegliere il prossimo token, infatti, non seleziona per forza quello con il punteggio più alto, ma può campionare tra i token con punteggi alti.
Questo processo è regolato da un parametro chiamato temperatura: se abbiamo impostato una “temperatura bassa” il modello favorisce i token coi punteggi più alti generando risposte meno varie (per noi umani “più precise”), se invece abbiamo impostato una “temperatura alta” il modello favorisce i token con i punteggi più bassi, generando risposte più varie (per noi umani “più creative”).
PES ci assomiglia più di Claude: la percezione del tempo
È evidente che questi meccanismi di combinazione dati non mostrano la minima somiglianza con le attività coscienti che si svolgono nella mente di noi esseri umani.
Ma se proprio dovessimo scegliere quale dei due ci si avvicina di più, PES vincerebbe a mani basse per almeno due motivi.
Anzitutto,la coscienza umana non si dà senza la percezione del tempo, come ha dimostrato con solidi argomenti tutta l’epistemologia occidentale da Sant’Agostino ad Heidegger.
Ebbene, PES, con i suoi aggiornamenti automatici 60 volte al secondo, riesce almeno a simulare un’immersione nella temporalità: man mano che il tempo scorre, il programma registra il nuovo stato di cose e si modifica di conseguenza.
Claude invece è del tutto avulso dal tempo.
Lavora soltanto sulle affinità astratte tra le parole che ha rilevato durante il suo addestramento. Quando gli chiediamo di cercare informazioni sul web, l’algoritmo trasforma ogni parola che incontra sul web in un token, che poi incorpora negli stessi vettori che aveva già pre-impostato.
Nessun evento (se non un lunghissimo e costosissimo ri-addestramento) può modificare la sua impostazione originaria. Di fatto, reagisce allo scorrere del tempo meno di un orologio a muro.
PES ci assomiglia più di Claude: le intuizioni sul mondo fisico
Inoltre, la nostra mente cosciente ha, oltre a quella del tempo, diverse altre “intuizioni pure” (per usare un’espressione di Kant): assunti che, dopo averli “sbloccati” all’inizio dell’infanzia, la mente dà per scontati in ogni sua successiva attività.
Lasciamo perdere le intuizioni di carattere morale (es: siamo sempre liberi di scegliere tra almeno due opzioni) o quelle di carattere estetico (es: nei corpi belli le parti non ci sembrano assemblate casualmente ma in vista di uno scopo) e concentriamoci su quelle di carattere fisico. La nostra mente presuppone implicitamente, ad esempio, il movimento nello spazio, l’esistenza reale di uno o più oggetti diversi da sé stessa, i rapporti di causa-effetto, la necessità che certi eventi accadano (che il fuoco bruci, che l’acqua bagni, che un solido non passi attraverso un altro).
In breve, alcune leggi della fisica ci risultano ovvie per intuizione, anche se nessuno ce le ha mai insegnate in astratto.
Ora, mentre l’algoritmo di PES è addestrato per considerare ovvie in qualunque momento le leggi della fisica (come l’effetto dell’attrito dell’aria sul moto del pallone), quello di Claude non lo è.
Una legge fisica è una stringa di token come qualunque altra, che finisce nelle sue risposte solo perché statisticamente i testi su cui è stato addestrato mostravano spesso prossimità tra l’uno e l’altro di quei token.
Claude, dunque, non solo non intuisce le leggi della fisica come noi, ma non le riceve neanche come comando da rispettare da parte dei suoi programmatori, come invece fa PES. E anche in questo è ancora più distante di PES da come funziona la nostra mente.
È stato bello crederci
Questo non significa che nessun modello IA condividerà mai nessuna caratteristica della nostra mente.
In futuro potrebbe esistere un ipotetico modello inserito in un corpo di cellule organiche, capace di muoversi con esso nello spazio e di modificarsi con esso nel tempo: il classico androide o replicante dei libri di fantascienza.
Ma Claude non ha niente a che fare con questo, non ha volutamente niente a che fare con questo e funziona proprio perché non ha niente a che fare con questo.
PES, in teoria, neanche.
Ma era più divertente credere di sì.








