David H. Wolpert, La Stampa 7/4/2010, pagina 27 E 30, 7 aprile 2010
RICOMINCIO DALLA TEORIA DEI GIOCHI
Tre dei più potenti campi scientifici sviluppati nel XX secolo sono la teoria dei giochi, le macchine per l’apprendimento automatico e la teoria del controllo.
La teoria dei giochi è l’analisi del comportamento di esseri umani che interagiscono in rapporto a un obiettivo: dà quindi la possibilità di prevedere molti tipi di azione. Questa teoria, però, utilizza tecniche ancora primitive.
Il campo dell’apprendimento automatico, invece, fornisce tecniche di gran lunga più potenti per la previsione del comportamento di un sistema, a partire da una serie di dati relativi al sistema stesso. Di conseguenza, estendendo questi saperi alle interazioni umane, si dovrebbe avere a disposizione uno strumento di analisi molto più efficace.
La teoria del controllo, infine, ci dice come utilizzare le previsioni sui comportamenti di un sistema per poterlo controllare. E’ evidente, perciò, che, se si vogliono mettere «sotto la lente» le azioni di un gruppo di umani, si devono combinare le tre tecniche.
Tradizionalmente, questi tre campi sono stati considerati come entità separate. Io, invece, vorrei dimostrare come possono combinarsi. Si tratta di una realtà ibrida, che fornisce nuove e potenti tecniche per prevedere e controllare il comportamento di specifici «agenti».
Non importa se al centro ci sono individui, gruppi o sistemi artificiali: questo nuovo settore può contribuire a gestirli tutti. Un esempio sono gli operatori delle centrali elettriche o delle linee di trasmissione nelle reti di energia. L’obiettivo di ciascuno - è chiaro - punta a massimizzare il profitto. Per controllare il sistema, quindi, è necessario progettare i protocolli adeguati con cui gli agenti interagiscono. L’obiettivo è spingere tutti gli operatori a creare un comportamento collaborativo capace di evitare i rischi di blackout.
Un secondo esempio è il «Tactical collision avoidance system». E’ un sistema montato sugli aerei che emette un allarme, se rileva il pericolo di collisione con un altro jet. In questo caso, gli agenti sono i piloti: tutti vogliono evitare manovre improvvise e, ovviamente, rischi mortali. Controllare i comportamenti significa rivedere una serie di dettagli legati alle procedure di volo. Lo scopo è farlo in un modo che stimoli i piloti ad agire con i comportamenti più adeguati.
Un terzo esempio è la «consulenza» in battaglia, mentre gli agenti sono gli eserciti nemici. Anche stavolta gli obiettivi sono complessi: si vuole obbedire ai comandi, ma allo stesso tempo non si vuole morire. Il parametro di controllo sono gli ordini che dà il comandante, mentre lo scopo del controllore è suggerire le raccomandazioni giuste, che garantiscano le maggiori chances di vittoria.
Un quarto esempio riguarda gli agenti artificiali. Ogni agente è una squadra di robot, incaricata di costruire una base marziana. In gioco ci sono specifici algoritmi di apprendimento, mentre gli obiettivi sono impostati dal controllore: ideare i comportamenti e le logiche di comunicazione. Altri esempi, poi, riguardano i sistemi economici: uno è la regolamentazione di mercati con un numero limitato di imprese. Qui a rappresentare gli agenti sono le società stesse, che producono tutte lo stesso bene. L’obiettivo è massimizzare il profitto, mentre il parametro di controllo è la regolamentazione. Quanto all’obiettivo, consiste nel fissare le regole per fare in modo che le singole imprese, mentre perseguono il profitto, riducano i prezzi.
E’ chiaro, perciò, che, quando si combinano la teoria dei giochi, l’apprendimento automatico e la teoria del controllo, ci sono molte applicazioni. Citerò tre progetti.
Primo. Eliminare le vibrazioni nell’ala di un aeroplano, controllando una serie di micro-flaps. L’idea è trattarli come tanti «agenti» diversi nell’«economia» complessiva dell’ala. In altre parole, le tecniche finalizzate all’analisi dei comportamenti umani in ambito economico possono essere sfruttate nel campo dell’ingegneria.
Secondo. Analizzare le proprietà di un modello razionale con cui governare una società. E’ significativo che in molte situazioni in cui si deve interagire con altri individui si possa ottenere un vantaggio comportandosi da ingenui. La ragione è che, quando le altre persone capiscono di avere un interlocutore di questo tipo, si adeguano. Così, la modificazione del comportamento ha conseguenze positive. Questo modello di razionalità limitata può servire, tra l’altro, per gestire un aumento delle tasse.
Terzo. E’ il problema di come gestire lo spazio aereo nel caso di un’interruzione improvvisa. Una soluzione può essere quella di ideare una «fascia dinamica» degli orari in un aeroporto in modo che le alterazioni degli slots si traducano nel massimo vantaggio per il maggior numero possibile di passeggeri. combinando i sistemi di apprendimento automatico con la teoria dei giochi che si può ottenere una risposta adeguata.