Dati

Dopo aver individuato e definito un problema, si passa alla raccolta dei dati che lo riguardano. Edward De Bono nel suo famoso metodo dei “Sei cappelli per pensare”, e nel meno noto ma altrettanto geniale “Sei scarpe per agire”, quando si affronta un problema da risolvere o un intervento da fare, raccomanda di indossare per primi il cappello bianco per cercare i dati, e le scarpe grigie per andare in giro a raccoglierli. Per De Bono i dati sono informazioni, fatti e cifre di cui va verificata l’esattezza e l’attendibilità, evitando opinioni, sensazioni, impressioni. Il dato può essere sempre vero, generalmente vero, frequente, casuale, raro, falso. Può essere di prima mano, se uno racconta ciò che ha visto, di seconda mano se riferisce ciò che ha sentito dire. L’informazione primaria è quella contenuta nel documento raccolto, secondaria se rimanda ad un altro documento, come un indicatore o un link.

Un dato è ciò che viene proposto come oggetto di osservazione e studio, un elemento del problema: in un ragionamento i “dati di fatto”, per esempio, consistono in ciò che è dimostrato dai fatti e accertato dall’esperienza; in mancanza dei dati non si può avviare un ragionamento serio. Il dato è ciò che si presenta alla conoscenza prima di qualsiasi elaborazione. In un problema rappresenta i valori noti (la lunghezza dei lati del rettangolo) con cui bisogna arrivare ai valori nuovi che rispondono alla domanda formulata dal problema ben definito: date altezza e larghezza di un rettangolo, qual è l’area?
I dati sono rappresentazioni non interpretate di un fenomeno, un evento, un fatto, espresse con simboli semplici o combinati, oppure in qualsiasi altra forma contenuta da un supporto. Possono assumere la forma di testi composti di lettere e numeri, immagini fisse e in movimento, suoni, oggetti tridimensionali. Possono essere registrati su supporti fisici o virtuali in modo analogico o digitale, trasmessi in rete o contenuti in raccoglitori remoti (cloud) consultabili ovunque e con qualunque dispositivo adatto.

I segnali digitali vanno codificati per renderli comprensibili all’uomo; un esempio sono le lettere e numeri del codice ASCII.
L’informazione è ciò che si ottiene da un insieme di dati interpretati in modo da renderli significativi. I dati possono essere interpretati con onestà, o manipolati per ottenere l’informazione che si vuole, per esempio confrontando dati non omogenei. Spesso i dati sono del tutto diversi dal sentire comune, condizionato da interpretazioni propagandistiche e manipolatorie. Tipica è la discrepanza fra la paura crescente di essere derubati e le statistiche calanti di furti.
Un data base è un insieme di dati omogeneo per contenuti e per formato, interrogabile con chiavi o ricerche di accesso. Se la raccolta di dati è molto grande, condivisibile e persistente, è una banca dati.
Un metadato è un dato che rimanda ad un altro dato o lo accompagna, è un’informazione che descrive un insieme di dati. Per esempio in un libro abbiamo il testo, gli elementi paratestuali (numeri di pagina, indici, note), la scheda editoriale, il numero di codice ISBN che lo identifica, il prezzo. Se consideriamo il testo come dato, tutto il resto appartiene ai metadati. Questi servono soprattutto a cercare informazioni, trovarle, filtrare i criteri di ricerca per scegliere quelle più utili e pertinenti. Metadati personali sono per esempio l’indirizzo postale e il numero di codice fiscale, o anche il numero di scarpe.

Tutti noi oggi emettiamo lunghe scie di dati con i nostri smartphone, con i pagamenti elettronici, con le ricerche web, con i navigatori satellitari, con tutto quello che facciamo nella nostra vita pubblica e privata. I grandi flussi di dati, opportunamente selezionati e interpretati da potenti algoritmi dotati di intelligenza artificiale, costituiscono una materia prima informativa di grande valore per i processi di big data analytics.