English
mercoledì 18 ottobre 2017 ..:: Business Intelligence ::.. Registrazione  Login

Premessa
Business Intelligence è un termine introdotto nel 1989 da Howard Dresner, di Gartner Group, per descrivere un insieme di concetti e metodologie atti a sostenere il processo decisionale.
Esso non è altro che una evoluzione del concetto di DSS (Decision Support System). un'efficace fusione di intelligenza umana e (diremmo oggi) di tecnologie dell'informazione che interagiscono fortemente tra loro per risolvere problemi complessi.
Secondo Mintzberg, studioso di fama internazionale e creatore della teoria del "Loop Manageriale", i manager non hanno tempo per organizzarsi e studiare la propria attività; ne discende che essi operano in modo disorganizzato; ergo sono sempre molto occupati.
La Business Intelligence ha come obiettivo quello di concentrare gli sforzi dei manager ad analizzare informazioni per prender decisioni in tempi rapidi senza perder tempo per recuperarle.
Le aziende hanno al loro interno un patrimonio informativo dove sono presenti in grande quantità le informazioni necessarie per permettere loro di effettuare le giuste scelte.
Tali informazioni devono però essere adeguatamente analizzate, mediante apposite tecniche e strumenti di analisi;è quello che si propone di fare la business intelligence.
All'interno dei sistemi informativi aziendali, sono presenti enormi quantità di dati. Tali dati potrebbero permettere agli analisti e a quanti devono prendere decisioni di meglio comprendere i fenomeni legati all'andamento aziendale: ad esempio il comportamento dei clienti e le loro tendenze.
Questo può portare ad azioni per migliore la soddisfazione del cliente, proponendo servizi mirati, ovvero al mantenimento del cliente stesso.

Questa miniera di dati è però nella maggior parte dei casi difficilmente accessibile in quanto disseminata su sistemi eterogenei, dedicati a compiti specifici (ad esempio le applicazioni gestionali). Inoltre la consultazione dei dati nel loro formato originario è estremamente difficoltosa.
Nel migliore dei casi i dati sono archiviati in database relazionali nei quali la velocità di elaborazione e la compattezza si scontrano con la facilità di interpretazione.
Recuperare informazioni anche relativamente semplici comporta in genere la creazione di query che incrocino i dati di diverse tabelle. Tale attività richiede l'intervento di tecnici specializzati. Ciò contrasta con la semplicità di interrogazione richiesta dagli analisti, che devono poter esaminare i dati in autonomia, scoprire relazioni, effettuare simulazioni.

Data Warehouse

Per poter analizzare nel loro complesso questi dati si deve pertanto procedere ad una attività di raccolta in un unico repository aziendale.

Ecco quindi nascere l'idea del data warehouse.
Un data warehouse ha quindi diverse finalità :
" -raccogliere le informazioni dalle diverse fonti
" -renderle fra loro omogenee
" -renderle facilmente consultabili anche da parte di personale non tecnico

In altre parole il datawarehouse consente di rendere disponibili le informazioni presso coloro che devono prendere le decisioni rendendoli autonomi nella fase di analisi.
La complessità di realizzazione e le dimensioni dei database che possono scaturire da queste operazioni portano spesso a considerare soluzioni parziali, basate su data mart dipartimentali, capaci di soddisfare le esigenze di specifiche unità di business.
Un datawarehouse aziendale può successivamente essere creato come aggregazione di data mart dipartimentali (a volte si procede con un percorso inverso, generando data mart specifici da un datawarehouse aziendale).

La realizzazione di un Data Warehouse

La costruzione di un datawarehouse non è semplice.
E' infatti necessario :
" -individuare le fonti dei dati
" -definire le procedure di recupero dati ed aggiornamento
" -definire le procedure di pulizia dei dati
" -definire le procedure di "standardizzazione" dei dati
" -definire le procedure di integrazione dei dati
" -definire il livello di dettaglio e di aggregazione dei dati
" -definire le procedure di filtraggio dei dati (solo le informazioni che servono)
" -definire le procedure e gli strumenti per di interrogazione
" -definire le procedure per la distribuzione

Considerando che le fonti dati sono diverse e possono subire variazioni nel tempo, è necessario conservare traccia delle attività che vengono svolte sui singoli dati.
Ecco quindi l'esigenza di disporre nel datawarehouse, oltre ai dati veri e propri anche dei metadati, cioè delle informazioni relative ai dati.
Tali informazioni riguardano ad esempio :

" -la provenienza
" -le modalità di memorizzazione
" -le relazioni gerarchiche
" -lo stato di aggiornamento
" -i criteri di accesso
Va inoltre definito un glossario comune di termini per tutti gli operatori.

Associato al concetto di analisi di un datawarehouse vi è quello della rappresentazione multidimensionale dei dati.

I modelli OLAP (Online Analytical Processing - Elaborazione analitica on line) possono essere di varia natura :

" -basati su database relazionali (ROLAP), nei quali le relazioni vengono definite mediante delle fact table; adatti a database di grosse dimensioni.
" -basati su modelli multidimensionali, normalmente detti cubi (MOLAP), adatti a database di dimensioni non rilevanti.
" -mediante una combinazione ibrida dei due precedenti Hybrid OLAP (HOLAP)

Tali strumenti consentono di effettuare con estrema semplicità delle analisi complesse e multidimensionali dei dati.
Questo significa che non vengono relazionati fra loro due sole entità per volta, (ad esempio clienti per regione), ma un numero maggiore di entità (ad esempio clienti per regione e per anno), rappresentati in un uno spazio multidimensionale. Questi strumenti permettono di aggregare le informazioni con semplici operazioni da parte dell'utente, che in realtà comportano dal lato dell'applicazione, la creazione di query anche molto complesse. In particolare gli attuali strumenti di operatività individuale consentono ai "knowledge worker" di consultare operare autonomia senza il supporto dei tecnici EDP.
Questo aumenta enormemente la produttività e l'accesso alle informazioni da parte di quanti ne hanno effettivamente la necessità, senza la mediazione e la perdita di tempo collegata al ricorso di tecnici specialistici.