Dato anonimo e dato personale

Sono dati personali tutte le informazioni che identificano o rendono identificabile (quindi, direttamente o indirettamente), una persona fisica.

Partendo dalla stessa definizione di dato personale si può quindi desumere che cosa si intende quando, invece, si parla di dato anonimo (o comunque non personale), ovvero quello che non consente mai di identificare un determinato individuo.

Elemento centrale è infatti la collegabilità tra il dato e la persona fisica.

Sebbene possa sembrare univoco tale collegamento, questo è in realtà molto variabile in funzione della presenza di eventuali e ulteriori elementi, come ad esempio il soggetto che opera il collegamento e il contesto nel quale esso opera.

È proprio per questo motivo che, ad uno sguardo più approfondito, l’anonimità risulta essere una caratteristica alquanto relativa e, appunto, estremamente variabile.

Sebbene in molteplici tipologie di trattamento, incluse quelle relative ai Big Data, non sia richiesto l’utilizzo dei dati personali, è tuttavia necessario che sia sempre accertata la natura degli stessi, in modo da poter identificare la cornice normativa entro la quale operare e poter adottare, in tal senso, le misure più opportune.

La dinamicità della relazione intercorrente tra “dato personale e non personale” impone un’attenzione particolare ed è richiesta ai fini di una corretta individuazione del regime normativo da applicare.

La linea di demarcazione tra dato personale e dato anonimo non è peraltro sempre agevole da tracciare anche in ragione della possibilità, grazie all’utilizzo delle nuove tecnologie, di riconnettere informazioni apparentemente anonime a singoli individui, a seguito di peculiari operazioni di trattamento che utilizzano sistemi di Intelligenza Artificiale.

Il nostro corso “Intelligenza Artificiale, Big Data e Diritto” approfondisce la questione soprattutto da un punto di vista giuridico. Iscrivetevi se siete interessati!

Tecniche di anonimizzazione

Semplificando, le due macro categorie di tecniche di anonimizzazione sono la randomizzazione e la generalizzazione:

(i) la prima consiste nell’introduzione, alternativamente, o di statistical noise – con il quale si altera l’accuratezza del dato – o di uno shuffling dei descrittori riferibili ad un individuo, con il quale si permutano gli attributi dello stesso con quelli di un altro soggetto;

(ii) la seconda si riferisce invece alla modifica della scala di rappresentazione di determinati descrittori: per esempio, sostituendo l’indicazione del comune di residenza con l’indicazione della regione o dello Stato.

Attraverso l’anonimizzazione lo scopo che si persegue è dunque quello di de-personalizzare un dato in un modo – teoricamente – irreversibile: tuttavia, un’effettiva anonimizzazione è messa a dura prova quando vengono in gioco sofisticate tecnologie, causando un duplice ordine di problemi: da un lato, un possibile singleouting attraverso il collegamento tra un dato anonimo e un dato contenuto in un ulteriore database e, dall’altro, la possibile deduzione di nuove informazioni partendo da due o più dati anonimi (i cd. dati inferiti).

Inoltre, la tecnica di anonimizzazione da applicare dipenderà dalla peculiare finalità del caso di specie, in quanto non tutte le tecniche sono idonee a perseguire il duplice scopo di non consentire l’identificazione e, al contempo, conservare il valore del dato: valore che non può comunque essere sacrificato, pena il venir meno della sua utilità ai fini del trattamento.

Conclusioni

Una netta dicotomia tra dato anonimo e dato personale non sembra dunque corrispondere alla realtà dei trattamenti effettuati con l’utilizzo delle nuove tecnologie e in particolare con l’utilizzo dei sistemi di Intelligenza Artificiale: quello che pare esserci è, piuttosto, una progressiva sfumatura che va dall’anonimato all’identificazione, lasciando sempre una – seppur residuale – componente di identificabilità in molte raccolte di dati ritenute anonime.

Nell’era in cui la privacy sembra essere messa sempre più a dura prova, molto spesso si sente parlare di raccolta di dati in forma anonima per scongiurare paure o allarmismi riguardo ai trattamenti posti in essere; tuttavia, per le ragioni esposte sopra, è comunque doverosa un’adeguata e approfondita conoscenza dei meccanismi attuati e dei sempre presenti rischi di re-identificazione.

Da questa consapevolezza ne discendono, dunque, due corollari: anzitutto, è necessario prevenire e sanare le intrinseche vulnerabilità di ogni processo di anonimizzazione, anche attraverso un eventuale accostamento di più tecniche, per assicurare così un risultato affidabile; inoltre, l’anonimizzazione non dovrebbe essere considerata un’operazione una tantum, bensì oggetto di esame periodico e di continuo aggiornamento.

Copiare i tag ed inserire il testo all’interno:

Inserire il testo qui

Dato anonimo e dato personale