Data warehouse
Un data warehouse o magazzino di dati è un insieme di dati selezionati, trasformati e archiviati con sistemi di tipo ETL, per utilizzarli con programmi di supporto alle decisioni, business intelligence, analisi dei dati. I dati sono raccolti per temi, per renderli più funzionali ai progetti e ai settori a cui sono destinati.
Il data warehouse descrive il processo di acquisizione, trasformazione e distribuzione di informazioni provenienti dall’interno e dall’esterno delle aziende, e si differenzia dai sistemi gestionali che servono ad automatizzare le operazioni di routine.
Il data warehouse deve essere
- integrato: i dati confluiti da più sistemi di diversa natura vanno unificati come criteri, significati, unità di misura;
- orientato al soggetto: contiene dati relativi a temi, applicazioni e funzioni specifici, aggregati e osservabili con prospettive multidimensionali;
- variabile nel tempo: le informazioni relative alle aree di interesse abbracciano un periodo di tempo piuttosto lungo, e sono aggiornate fino ad una data precedente al momento in cui si utilizza il sistema, per fornire visioni storiche, a differenza delle visioni di un sistema transazionale, aggiornate in tempo reale;
- non volatile: i dati sono accessibili in sola lettura e non modificabili, per renderli sempre utilizzabili e solidi.
I data warehouse si usano nel controllo di gestione, nell’analisi e simulazione dei rischi, come supporto alle vendite e ai call center, nelle analisi di mercato e nelle strategie di marketing, nell’e-commerce, nell’engineering di prodotto. All’interno di un data warehouse si possono individuare diversi data mart, raccoglitori specializzati di dati riferiti ad un tema specifico. Se un data warehouse è paragonabile ad un supermercato alimentare che a sua volta fa parte di un centro commerciale, un data mart è simile al reparto dei vini in bottiglia o del pesce surgelato.