DMD – DATA MEANING DISCOVERY

Il riconoscimento automatico del significato dei dati

La rapida e continua evoluzione dei grandi sistemi IT ha portato negli anni ad un vertiginoso aumento della complessità su diversi fronti, compreso quello relativo al “patrimonio dati”. L’elevatissima quantità di informazioni gestite, la tendenza a sviluppare sempre meno applicazioni custom e ad acquisire pacchetti software, l’impossibilità di garantire il know-how attraverso funzioni e strumenti di data administration adeguati, hanno reso difficile, se non impossibile, il mantenimento nel tempo della conoscenza, soprattutto sul piano funzionale, del significato dei dati stessi. Il tutto può essere aggravato da una non sempre corretta progettazione delle basi dati che può portare alla collocazione di alcune informazioni critiche dal punto di vista della sicurezza e della privacy, in entità insospettabili o quantomeno difficili da rintracciare.

Queste carenze costituiscono una debolezza soprattutto in questo momento dove è particolarmente elevata l’attenzione sul trattamento di alcuni dati, nello specifico quelli cosiddetti personali o “sensibili”, soggetti a politiche di privacy in base alle normative vigenti (GDPR, General Data Protection Regulation – Regolamento UE 2016/679).

Per questi motivi è nata una forte esigenza di disporre di strumenti che supportino le organizzazioni IT nell’individuare ed ottenere in tempi brevi e con il minimo sforzo possibile la conoscenza dei dati che sottostanno ai processi di business. 

La soluzione Data Meaning Discovery

  • Data Meaning Discovery (DMD) è la soluzione RES IT studiata per il riconoscimento automatico del significato dei dati al fine di supportare DBA, Data Administrator, Sviluppatori applicativi e più in generale chiunque si trovi nella necessità di utilizzare archivi di cui non detiene la conoscenza, anche solo parzialmente.
  • Data Meaning Discovery permette di individuare il significato dei dati in maniera totalmente automatica, assegnando per ogni dominio e classe individuata la relativa probabilità di appartenenza.
  • Data Meaning Discovery può essere di grande aiuto quando si devono affrontare tematiche di individuazione e offuscamento di dati personali o sensibili, ma anche in caso di progetti di analisi di impatto, di archiviazione/svecchiamento dati e di Quality Assurance degli stessi. DMD infine è anche un utile complemento ad altri strumenti di RES Suite, quali ad esempio Daisy.

Funzionalità di Data Meaning Discovery

Data Meaning Discovery: è un sistema automatico di riconoscimento del significato dei dati che, a partire dai cataloghi dei DBMS più diffusi o da semplici file, individua le colonne o i campi richiesti (ad es. nomi, cognomi, indirizzi, codici fiscali, ma con i giusti dizionari potenzialmente qualsiasi tipo di informazione) analizzando il contenuto dei dati presenti sugli archivi ed individuando la percentuale di probabilità di appartenenza del dato stesso ad un determinato dominio.

Le analisi, dalle prestazioni molto elevate anche su volumi di dati rilevanti, vengono effettuate utilizzando algoritmi matematico-statistici e sfruttando una serie di look-up table in dotazione al sistema, che possono essere agevolmente ampliate o implementate dagli utenti. I risultati ottenuti possono infine essere verificati e validati per giungere ad una classificazione certa del dato stesso.

Data Meaning Discovery è in grado di analizzare:

  • Data Base relazionali (Oracle, SQLServer, DB2, MySql)
  • File delimitati strutturati (ad es. CSV)
  • File sequenziali generici

Data Meaning Discovery rende fruibili le rilevazioni dell’analisi, tramite:

  • Report di sintesi per ogni classe di dati per cui è stato richiesto il riconoscimento
  • Il Data Meaning Discovery Repository in cui vengono capitalizzati i dati rilevati in forma strutturata e persistente, aperta ad interrogazioni ed elaborabile ai fini decisionali