lunedì 16 dicembre 2019

L'imperfezione dei linguaggi. Machine Translation e lingua Aymara

(Ripubblico qui un articolo che avevo pubblica su www.bloom.it il 27 agosto 2003. Mi pare ancora attuale. Anche se racconta di software degli Anni Ottanta del secolo scorso),

Mi ricapita in mano un libro di Umberto Eco dedicato alla ‘lingua perfetta’.1 Ragionando attorno all’idea di Europa, ci si può interrogare sulla differenza delle lingue, ponendo l’accento sulle difficoltà organizzative che ne conseguono. E naturalmente potremmo anche generalizzare: la globalizzazione dell’economia, così come il World Wide Web ci impongono l’esigenza di una unica lingua.
Questa esigenza deve convivere con il fatto che le lingue corrispondono in fondo alle culture, corrispondono a diversi atteggiamenti di fondo e a diverse letture del mondo, atteggiamenti e letture del mondo che non possono essere rimossi, non possono essere ridotti ad unità ‘per legge’, o per volontà politica.
Ecco quindi la necessità di ‘tradurre’: lo scambio da un mondo linguistico ad un altro porta con sé sempre una perdita di senso; potremmo dire anche che, al limite, la traduzione è una operazione impossibile: rendere veramente il significato in un’altra lingua è una operazione che può dare risultati solo parziali, si può esprimere il significato espresso in un lingua straniera solo attraverso analogie, come quando i primi spagnoli giunti in America non trovarono di meglio che chiamare ‘pigna’ uno strano, ignoto frutto del Nuovo Mondo, l’ananasso.
Si può dunque dire che una vera traduzione sarebbe possibile se non traducessimo da una lingua all’altra, ma traducessimo da ogni lingua in una lingua terza, idioma puramente veicolare, destinato mai a sostituirsi, ma semplicemente ad aggiungersi alla lingua originaria di ognuno.
Solo la lingua originaria è veramente portatrice di senso, la lingua veicolare si aggiunge e permette lo scambio tra diversi. Uno scambio efficace per garantire una prima comprensione, ma consapevolmente insufficiente, come accade quando si traduce la poesia: si lascia sempre accanto il testo nella lingua originale, perché è dato per scontato che la poesia è in fondo intraducibile, la traduzione non può rendere tutto. Ora, noi usiamo come lingua veicolare l’inglese, o meglio, appunto un basic english. Lo facciamo in mancanza di meglio. Perché l’inglese non nasce come lingua veicolare –come ogni vera lingua nasconde veri significati dietro l’apparenza– e quindi è in fondo inadatta allo scopo. Più adatto sarebbe l’esperanto, o simili lingue.
Insomma, secondo Eco (ed altri) una lingua veicolare ‘ottima’ è una lingua artificiale. Pensata già in origine come lingua aggiuntiva: come è stato detto, una LIA, Lingua Internazionale Ausiliaria. Risultano evidenti i vantaggi: pensiamo alla Babele delle lingue che è l’Unione Europea, pensiamo alla complessità organizzativa ed ai costi legati alla traduzione di ogni testo ufficiale nelle diverse lingue degli stati membri. Pensiamo al fatto che la traduzione di tutto ‘solo’ in inglese costituirebbe una semplificazione, un vantaggio pratico, ma un ingiustificato privilegio per uno degli stati membri.
Resta, naturalmente, la difficoltà insita nel progettare una simile lingua. E resta, ancora più grave, la difficoltà insita nell’imporre, politicamente e culturalmente e praticamente, l’uso di una simile lingua.
Si può poi aggiungere, a complicare il quadro, un ulteriore aspetto: se si pensa ad una lingua veicolare, intesa non come sostituzione ma come aggiunta, tesa a rendere comprensibile un contenuto a chi non conosce la lingua nella quale il contenuto è originariamente espresso, allora si deve potere ritener percorribile, almeno in linea di principio, la via della ‘traduzione automatica’, affidata al software. In questo caso l’interlingua potrà essere pensata come una lingua estremamente formalizzata, nel senso dei ‘linguaggi di programmazione’, una lingua cioè destinata ad essere compresa dal computer. Una lingua di natura algoritmica, capace di tradurre i concetti espressi in ogni lingua naturale, anche le sottigliezze, senza bisogno di fastidiose perifrasi.
Non senza fondamento dunque Ursula K. Le Guin –che è qualcosa di più di una scrittrice di fantascienza, potremmo dire una antropologa di un possibile futuro – immagina un domani in cui la lingua veicolare “lingua franca dei commercianti di tutto il mondo, dei viaggiatori e di quanti intendevano comunicare con persone di un’altra lingua madre” è proprio un evoluto linguaggio di programmazione.2
Si potrebbe pensare che questa lingua, di indiscutibile utilità, possa forse essere immaginata, ma sia difficile o impossibile da progettare. Non è così. Di fatto, già oggi la questione si pone con grande forza: notevoli investimenti sono dedicati allo sviluppo di machine translation system. Esempi in qualche misura efficaci sono disponibili a tutti noi come complemento ai motori di ricerca.
Ma c’è davvero bisogno di inventare qualcosa di nuovo? Studiosi –per primo il matematico e computer scientist boliviano Iván Guzmán de Rojas– sostengono di no. Questa lingua, forse, esiste da quattromila anni, è l’idioma di indios andini, abitanti nei pressi delle rive del lago Tititcaca, l’aymara.
C’è però un paradosso: l’ aymara (ci riferiamo qui in particolare alla sua versione formalizzata da Iván Guzmán de Rojas, l’Atamiri3), come forse ogni possibile ‘interlingua’ – può esprimere ogni concetto espresso in lingue mutuamente intraducibili – ma proprio a causa della sua ‘perfezione’ questa lingua risulta poi difficilmente traducibile nei nostri imperfetti, e diversamente sfumati linguaggi naturali.
Cosicché anche per questa via si torna alla circostanza fattuale che vuole ogni traduzione niente più che una più o meno soddisfacente perifrasi. Insomma, siamo in grado di comunicare, ma sempre in maniera imperfetta. Questo vale per la comunicazione tra uomo ed uomo, ma anche tra uomo e macchina, e tra macchina e macchina.
Proprio per questo divengono sempre più importanti le metafore e la ridondanza. Comunichiamo attraverso una Babele di linguaggi: la probabile comprensione, più che attraverso una possibile ‘esattezza’, passa attraverso l’accettazione della complessità, della possibilità del fraintendimento. Meglio abbondare, meglio ripetere, meglio conservare anche quello che appare scarto, meglio esprimere lo stesso contenuto attraverso modalità differenti. Forse le perifrasi non vanno considerate un fastidio, ma una necessità. Forse lì, dove si deve ricorrere a perifrasi, si annida il senso più profondo.

1 Umberto Eco, La ricerca della lingua perfetta, Roma-Bari, Laterza, 1993. (Appartiene alla collana ‘Fare l’Europa’ prodotta in coedizione insieme ad altre quattro casi editrici europee). Avevo snobbato questo libro, un po’ perché secondo me dopo il Trattato di semiotica e Il nome della rosa aveva esaurito la sua vena migliore, un po’ per un limite specifico che attribuisco alla La ricerca della lingua perfetta: non contiene nemmeno una citazione di un personaggio che a mio modo di vedere in questa storia non dovrebbe mancare: l’umanista spagnolo Elio Antonio de Nebrija. Negli stessi giorni in cui Colombo perorava la sua causa di fronte regina Isabella, Nebrija perorava un progetto diverso ma complementare. Spiegava alla regina che per edificare un impero insieme alla spada, e prima della spada, serve la lingua. Una lingua normalizzata, intesa come strumento di dominio e di controllo. Lo spagnolo nacque così: lingua ‘moderna’ in quanto codificata, imposta per legge, fondata su una grammatica ed un dizionario chiusi, stabiliti dall’autorità.
2 Ursula K. Le Guin, Always Coming Home, 1985; trad. it.Sempre la valle, Mondadori, 1986. E’ il TOK “che poteva essere pronunciato, oltre che battuto sulle tastiere”.
3 Esperti di machine translation system e di interlingue formalizzate hanno messo in discussione il legame tra aymara e Atamiri. In effetti, l’Atamiri è frutto delle capacità progettuali di Guzmán de Rojas, matematico. Ma è proprio Guzmán de Rojas ad affermare che la stuttura profonda dell’Atamiri è la struttura profonda dell’aymara. Per sconfermare questa affermazione si dovrebbe conoscere l’aymara meglio di Guzmán de Rojas. In lingua aymara, Atamiri significa “comunicatore”. http://www.aymara.org/biblio/5RepMatrC.pdf ; www.atamiri.cc/es/AtamiriSolution/History/ .

venerdì 6 dicembre 2019

Come narrare l'Intelligenza Artificiale al cittadino

Una narrazione in sei passi. E' la traccia che ho seguito il 3 dicembre 2019, nel primo dei due incontri sul tema L'Intelligenza Artificiale come risorsa civile o come furto di cittadinanza, presso la Casa della Cultura di Milano. Qui il video dell'incontro.

Uno. Il cittadino è un essere umano. Non un organismo vivente, non un animale, non una macchina.  Sembra un'affermazione scontata, ma non lo è.
C'è infatti la pretesa, già nella cibernetica, di imporre una unica definizione -organismi- capace di abbracciare alla stessa stregua esseri umani e macchine. Accettare questa definizione significa togliere le basi per qualsiasi discorso relativo alla cittadinanza.

Due. Il latino cives, 'cittadino', da una radice che parla di 'insediamento': processo, percorso verso un luogo.
Oggi questo modo di intendere la cittadinanza è particolarmente vero. Siamo tutti gettati in un novo mondo digitale, un mondo sconosciuto. L'ansia è inevitabile. L'ansia accettata, elaborata può trasformarsi in responsabilità. Responsabilità di scoprire come essere cittadini nel mondo digitale.
Questo vale anche per i tecnici, costruttori di strumenti e mondi digitali. Eppure tecnici e costruttori, salvo eccezioni, lavorano 'fuori dal mondo', considerandosi esentati dalle responsabilità del cittadino.

Tre. Intelligenza Artificiale: è una espressione ombrello che copre ambiti differenti.
Possiamo fissare due punti. Primo punto: l'Intelligenza Artificiale nasce alla metà degli Anni Cinquanta del secolo scorso come 'imitazione e simulazione dell'intelligenza umana'. Secondo punto: l'Intelligenza Artificiale appare sessanta anni dopo come ambigua oscillazione tra l'aiuto all'essere umano e la  sostituzione dell'essere umano.

Quattro. Il senso dell'intelligenza umana può essere avvicinato a partire dalla storia della parola. Il latino legere è 'raccogliere'. Ancestrale attività umana. L'essere umano ancestrale, cacciatore-raccoglitore, è rappresentato da due verbi latini: capere, 'afferrare la preda', da cui capire, e appunto legere. Raccogliere frasche. Inter legere. Inter: tra. trascegliere, scegliere tra le frasche raccolte. Sottilmente diverso è il verbo ex legere, da cui eleggere, ma anche scegliere. Ex: tirar fuori, estrarre.
Il verbo latino intelligere si accompagna a vari verbi che contribuiscono a dare il senso dell'umana intelligenza. Cogitare: agitare insieme, dove agitare riprende in modo più intenso il senso del verbo agere, 'agire. Considerare: 'stare con le stelle': astronomia e astrologia come vie per conoscere. Contemplare: 'osservare uno spazio celeste delimitato'. Pensare: derivato da pendere... Fino a putare,
da cui computazione, computer.
Il putare , tra tutti questi verbi, ci parla di uno solo tra i tanti diversi aspetti del pensiero umano, testimoniato dai diversi verbi. Ci parla solo di di riduzionismo e razionalità. Sta infatti per 'potare': quindi progettare come la pianta sarà, piegare per così dire la natura al disegno, considera ridondante, e quindi destinato all'eliminazione ciò non appare immediatamente legato ad una funzione.

Cinque. Si può ritenere che l'Era Digitale è la fase storica in cui si invera definitivamente l'Illuminismo. Illuminismo come ragione tecnica. Tecnica figlia della ragione.
Proprio nei tempi digitali la via dell'affidamento ai lumi della ragione mostra i suoi pericoli: le macchine sono più razionali degli esseri umani; la pura ragione porta alla sostituzione dell'essere umano con la macchina. La storia e la cultura dell'essere umano mostrano come serva controbilanciare la ragione con la saggezza. Se la macchina a suo modo intelligente può essere più razionale dell'essere umano, all'essere umano conviene cercare una via impraticabile per la macchina: la via della saggezza.
Si può ricordare il percorso di Goethe, che incapace di arrendersi a una lettura esclusivamente 'razionale' dell'Illuminismo torna a leggere Shakespeare, e sopratutto Spinoza. Nel decennio 1770-1780 appare il concetto dell'Illuminismo e allo stesso tempo si afferma la Rivoluzione Industriale. La natura appare materia prima da sfruttare. Spinoza, cent'anni prima aveva ricordato agli esseri umani il loro appartenere alla Natura.
Se si sente oggi necessità di 'sostenibilità' è perché l'ansia di progresso -visibile oggi in forma estrema nell'innovazione digitale- ha rotto un equilibrio al quale l'essere umano era abituato.

Sei. Nel 1945 Vannevar Bush scriveva As we may think. Immaginava come l'essere  umano avrebbe potuto pensare, se supportato da una macchina in grado di sostenerlo fornendogli fonti, permettendogli di connetterle tra loro, incrementando l'umana capacità di costruire reti di senso, e di muoversi nel conoscere come si muove il pioniere nel bosco, seguendo tracce.
Nel 1950 Alan Turing propone l'altra via. Scrive, in conclusione del suo articolo Computing Machinery and Intelligence: "We may hope that machines will eventually compete with men in all purely intellectual fields". Tante parole sono state spese a proposito di Intelligenza Artificiale. Tante vie si sono seguite nel tentare di svilupparla. Ma già qui, nell'articolo che apre il campo, si dice già che l'Intelligenza Artificiale si presenta forse anche come aiuto all'essere umano, ma è, fin dalle origini, potenziale sostituzione dell'essere umano.
Se il terreno 'puramente intellettuale' porta a dover competere con la macchina, converrà all'essere umano coltivare altri terreni, come quello della saggezza, dove la macchina non si propone come competitore. Perché la macchina di Turing, di Leibniz, si propone di imitare l'essere umano, o di competere con lui, sul piano della ragione, del riduzionistico potare. La macchina di Turing non si candida ad essere saggia. Invece di imporre a noi stessi di stare sugli stessi terreni su cui può stare la macchina, a noi esseri umani conviene scegliere i terreni sui quali la competizione della macchina è assente. Ci conviene per questo giocare sul terreno della saggezza.