Skip to main content

Kuva

Image

People working on couch
Blogi

Mistä tiedot tulevat ja minne menevät?

Sisältökappaleet

Image

Mika Naatula

Text

Tiedon jäljitettävyyttä on lupailtu jo pitkään, mutta tulokset ovat olleet laihanlaisia. Maaliskuussa järjestetyn Enterprise Data World 2019 -konferenssissa nähtiin vihdoin jotain uutta. Mika Naatula, joka toimii Enfolla teknologiajohtajana, bloggasi tiedon jäljitettävyyden viimeisimmistä tuulista.

 

Tietojärjestelmien monimutkaistumisen ja tietojen toisiokäytön lisääntymisen myötä tietojen jäljitettävyys vaikeutuu. Kuitenkin kansainväliset säännökset, kuten GDPR ja IFRS asettavat yhä tiukempia vaatimuksia tietojen jäljitettävyydelle. Mitä laajemmin tietoja hyödynnetään, sitä tärkeämpää on hallita erilaisten järjestelmämuutosten vaikutus hyödynnettävään tietoon. Käyttäjän näkökulmasta on usein hyvinkin oleellista ymmärtää, mistä tiedot ovat peräisin. Jäljitettävyyden lupaus on jo elänyt pitkään toimittajien kalvoilla, mutta parhaimmillaankin automatisoitu tiedon ”sukujuurien” selvittäminen eli data lineage on toteutunut melko rajoitetusti, useimmiten vain saman tuoteperheen sisällä.

Innovaatioita automatisoinnissa

Maaliskuun lopulla osallistuin Bostonissa järjestettyyn Enterprise Data World 2019 -konferenssiin, jossa näkyi vihdoinkin selkeä edistysaskel tällä tärkeällä tiedonhallinnan osa-alueella. Perinteisten isojen toimittajien, kuten IBM:n, lisäksi markkinoilla on nyt koko joukko uusia innovatiivisia tuotteita, jotka automatisoivat tiedon jäljitystä myös varsin heterogeenisissä järjestelmissä. Raaka-aineeksi tiedon jäljitykseen kelpaavat tuotteesta riippuen monet erilaiset metatietolähteet. Tietojen alkulähteelle tai tietovirtapurojen hännille voidaan päästä hyödyntämällä yleisimpien dataintegraatio-ohjelmistojen ja BI-työkalujen tuottamia metatietoa, tietokantojen tallennettuja proseduureja, tietokantanäkymiä sekä käytön tuottamia lokitiedostoja. Tiedon jäljitys kytkeytyy monesti muuhun metatietohallintaan, kuten tietohakemistoihin (Data Catalog)

Tässäkin pätee tuttu vanha totuus, aloitetaan tärkeimmistä kohdista ja edetään pienin askelin kohti tavoitetta, joka on täydellinen läpinäkyvyys tietojen alkuperään ja käyttöön.

Author

Mika Naatula

Author's title

Teknologiajohtaja

Text

Data Catalog -yhteistyötä

Hyvinä esimerkkeinä tiedon jäljitettävyyden erikoisohjelmistoista toimivat Octopai, Metacenter ja Manta. Kaksi viimeksi mainittua tekevät selvästi yhteistyötä johtavien Data Catalog -tuotetoimittajien kanssa. Metacenterin valmistajan edustaja suositteli kahdenkeskisessä keskustelussa tuotteensa täydentämistä Alationin Data Catalogilla, mutta referenssejä löytyy myös yhdessä Collibran kanssa toimimisesta. Manta tuntuu luottavan ja suosittelevan Collibraa. Tuotteilla on osittaista päällekkäisyyttä, mutta ne myös täydentävät hyvin toisiaan. Octopai ei suosittele erityisesti mitään data catalog -tuotetta, mutta heilläkin lupauksena on tuottaa kattava tietojen jäljitettävyys täydentämään kolmannen osapuolen tuotteissa hallittavia sisältökuvauksia, tai toteuttaa erillisprojektina pelkkä tietojen jäljitys. 

Mielestäni tässäkin pätee tuttu vanha totuus, aloitetaan tärkeimmistä kohdista ja edetään pienin askelin kohti tavoitetta, joka on täydellinen läpinäkyvyys tietojen alkuperään ja käyttöön. On ilo todeta, että vihdoinkin tuotteet alkavat olla sillä tasolla, että mutkikkaammankin järjestelmän tietojen jäljitys on nyt mahdollista ja järkevääkin laittaa kuntoon. 

 
Mika Naatula työskentelee Enfolla teknologiajohtajana.

Jaa