BIG DATA E DEEP LEARNING

Big Data e Deep Learning


Dottor Alfred Spitzer, «Solitudine Digitale»

Dall’inizio di questo secolo gli stati del mondo occidentale “civilizzato” raccolgono i dati personali dei loro cittadini in proporzioni mai conosciute finora. Una delle fonti fondamentali di questi dati siamo noi stessi! Siamo noi che forniamo i dati, sia con il pieno consenso, sia del tutto inavvertitamente: che siano le nostre email e le nostre telefonate ad essere lette o ascoltate, le nostre abitudini d’acquisto a essere registrate (per mezzo delle tessere fedeltà), i nostri movimenti (non solo) nei luoghi pubblici a essere monitorati per mezzo di telecamere, dei nostri smartphone o del software della nostra auto, o che siano i nostri sentimenti e stati d’animo essere non solo registrati e analizzati, ma ormai anche manipolati per mezzo di FacebookTwitter, non fa differenza.

Prima ci preoccupavamo di ciò che sapevano sul nostro conto l’Agenzia delle Entrate o la Motorizzazione Civile. Oggi vengono raccolti, memorizzati e analizzati i dati sul nostro conto da numerose aziende e dallo Stato, in proporzioni tali che la furia catalogatrice della Stasi sembra a confronto un semplice “caffè tra signore”.
Non c’è da meravigliarsi se ormai il termine Big Data ha assunto un retrogusto sgradevole.
Il motivo che si adduce per giustificare tale furia catalogatrice è l’aumento degli attacchi terroristici: per evitarli, l’intera società deve reagire con una maggior vigilanza al fine di garantire la sicurezza interna.

Big Data e Deep Learning
Non è solo la raccolta dei dati personali ad aver conosciuto una crescita esponenziale, ma anche la possibilità di una loro analisi. E’ stato solo con lo sviluppo dei più moderni programmi di elaborazione dati che si è reso possibile interpretare i dati che uno smartphone fornisce con tutti i suoi sensori (sensori per i gesti, i movimenti, la velocità, la temperatura, l’umidità eccetera), con il microfono, le videocamere e il sistema di navigazione satellitare.
Perché solo quando l’enorme massa di dati in entrata può essere anche automaticamente analizzata si ha una reale possibilità di spiare gli uomini sulla Terra.
Non c’è da meravigliarsi quindi se quasi in contemporanea all’arrivo dello smartphone siano stati fatti i necessari progressi nell’ambito dell’elaborazione dati. Tali progressi sono conosciuti con il nome di Big Data e Deep Learning.

Il concetto di Big Data è ambiguo e i suoi contorni non solo sono sfocati, ma anche in continuo mutamento. In ogni caso si tratta di quantità di dati talmente esorbitanti che non è possibile avere una visione di insieme senza l’aiuto di strumenti meccanici e per i quali non bastano più nemmeno i consueti processi di elaborazione dati digitale.
Si dice che la quantità di dati disponibili prodotti in tutto il mondo, raddoppia ogni due o tre anni, ma si dimentica che questo dipende non da ultimo dal fatto che ci sono sempre più macchine fotografiche che scattano in continuazione foto, con una definizione sempre maggiore, che la nostra comunicazione – mail, telefonate, messaggi ecc. – viene osservata e memorizzata sempre meglio, e che i sensori più disparati forniscono in maniera del tutto automatica dati per qualsiasi cosa (a partire dal meteo fino alle nostre pulsazioni), mentre prima ci limitavamo ad assistere i fenomeni naturali senza registrarli. Con Big Data s’intende senz’altro anche questo aspetto del nostro mondo tecnologizzato.

Big Data si riferisce comunque soprattutto alle possibilità di salvataggio e interpretazione dei dati in giganteschi centri dati che sorgono nelle vicinanze di corsi dei fiumi e/o di centrali elettriche, perché calcolatori e sistemi di immagazzinamento dati sviluppano un fabbisogno energetico molto elevato, non da ultimo per il raffreddamento.


Le banche dati contengono così tante informazioni che estrarre quelle rilevanti somiglia davvero all’estrazione di metalli in una miniera. Per questo la ricerca all’interno di grandi quantità di dati viene chiamata Data Mining.
Le possibili conseguenze di tutto ciò le ha scoperte a proprie spese una quindicenne americana incinta…

L’incredibile storia della ragazza incinta
La ragazza non aveva ancora informato i genitori della sua gravidanza, quando ricevette posta da un supermercato locale: pubblicità di vestiti pre-maman, fasciatoi e molti, molti visi di bebè…
Il padre, che non aveva trovato affatto divertente la cosa si recò furibondo al supermercato chiedendo di parlare con il manager: «Mia figlia ha trovato questo nella cassetta postale (…)  va ancora a scuola e voi le ha mandate coupon per vestiti da bebè e culle? Volete che mia figlia rimanga incinta
Il manager si scusò e anche dopo qualche giorno telefonò di persona per scusarsi nuovamente. Ma la voce del padre adesso suonava affranta: «ho fatto una chiacchierata a quattrocchi con mia figlia.  Ho scoperto che a casa nostra succedevano cose di cui non sapevo nulla. Partorirà ad agosto. Sono io che devo scusarmi con lei».
Cos’era accaduto?

Nei supermercati degli Stati Uniti esistono da molto tempo coupon, sconti e carte socio che hanno essenzialmente la funzione di raccogliere informazioni sul cliente: età, sesso, stato di famiglia, figli, domicilio, guadagno; le carte di credito utilizzate, le pagine web consultate sono note ai negozi tanto quanto le preferenze tra le marmellate, il caffè o i fazzoletti di carta, oppure le particolarità della dieta (vegetariana, vegana, intollerante al lattosio o al glutine, ecc.).
Se le informazioni possedute dai supermercati non sono per loro sufficienti, ne comprano altre: «sull’appartenenza etnica, sulle precedenti occupazioni, sulle riviste lette, se si è stati inadempienti o se si è separati, in che anno si è comprato casa, che scuola si è frequentata o che università, di cosa si parla o si scrive online, quali sono le posizioni politiche, ecc.»

La catena di supermercati Target, la seconda più grande negli USA, è tra le prime che provano a scoprire per mezzo del Data Mining quali delle proprie clienti siano in stato di gravidanza.
Per far ciò si confrontano gli acquisti di migliaia di donne che si sa essere incinte, con gli acquisti delle donne non incinte. Da tale confronto risulta che le donne in stato di gravidanza, a partire circa dall’inizio del loro quarto mese, comprano prodotti per la pelle senza l’aggiunta di profumi e, nei primi 5 mesi di gravidanza, acquistano integratori alimentari come calcio, magnesio e zinco.
«Sono molte le clienti che comprano saponi e ovatta, ma quando la cliente inizia all’improvviso a comprare molti saponi inodori, confezione extralarge di ovatta, lozioni per il bucato a mano e strofinacci, è probabilmente vicina alla data del parto».
In questo modo, sulla base di circa 25 prodotti acquistati da una donna, è possibile non soltanto assegnare un punteggio di previsione della gravidanza, ma anche calcolare una finestra relativamente ristretta sul giorno della nascita.

Su questa base è possibile raggiungere i clienti con pubblicità molto mirate e tanto più efficaci se si pensa che la gravidanza e la nascita di un figlio sono sempre fasi di cambiamenti radicali, in cui si definiscono alcune vecchie abitudini.
Così è successo quello che doveva succedere…
Dopo che l’incidente della ragazza quindicenne è stato reso pubblico sul «New York Times»[1], ci si è resi conto che la strategia adottata non era affatto una buona strategia di marketing. Eppure chi crede che il supermercato abbia abbandonato il suo calcolo delle previsioni di gravidanza si sbaglia.
Adesso lo fa soltanto in maniera più subdola, stampando un tosaerba accanto al pannolino sul coupon, in modo che la cosa dia meno nell’occhio: la cliente crede che tutti ricevano lo stesso coupon e considera la pubblicità dei pannolini un caso…

 

Alfred Spitzer, medico psichiatra è stato visiting professor a Harvard e attualmente dirige la Clinica psichiatrica e il Centro per le Neuroscienze e l’Apprendimento dell’Università di Ulm.
Autore di numerosi saggi tra cui «Demenza Digitale»

Note

[1] «How company learn your secrets», «New York Times», 16 febbraio 2016, https://www.nytimes.com/2012/02/19/magazine/shopping-habits.html

Un commento su “BIG DATA E DEEP LEARNING”

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.