Skip to main content

Kuva

Cloud services laptop Enfo
Blogi

Data hub – mihin sitä tarvitaan, koska meillä on jo tietovarasto ja tietoallas?

Sisältökappaleet

Mika Naatula Data hub Enfo

Text

Data hub on tuoreimpia lisäyksiä tiedonhallinnan arkkitehtuurin peruskomponentteihin. Aihe herättää keskustelua: mihin data hubia tarvitaan, jos käytössä on jo tietovarasto (data warehouse) ja tietoallas (data lake)? Jokaisella näistä on oma, tärkeä roolinsa tiedonhallinnan arkkitehtuurissa.

Data hubit palvelevat laadukkaan ja ajantasaisen datan jakelijana. Data hub voi sisältää yhtenäistettyä tietoa useammasta tietolähteestä, mutta data hubin tehtävä ei ole niinkään tiedon jatkojalostaminen vaan sen jakelu ja laadun varmistaminen. Data hub on oiva paikka hoitaa vaikkapa eri järjestelmissä ylläpidettyjen perustietojen jakelua organisaation sisällä tai oman organisaation tuottamien tietojen hallittua jakelua ulkoisille sidosryhmille. Data hub ei missään nimessä ole arkisto, sillä sen sisältämien tietojen aikaulottuvuus rajoittuu tuoreisiin tapahtumiin. Pitkälle taaksepäin ulottuva tapahtumahistoria jää tietoaltaan ja tietovaraston puolelle.

Data hubin tehtävä ei ole tiedon jatkojalostaminen vaan sen jakelu ja laadun varmistaminen.

Author

Mika Naatula

Author's title

CTO, Enfo

Text

Tietoallas mahdollistaa datan innovatiivisen käytön

Tietoaltaat palvelevat tutkivaa datan hyödyntämistä ja arkistointia. Tietoaltaat sisältävät monimuotoista dataa, joka talletetaan ensisijaisesti suoraan tietolähteestä saadussa muodossa. Tallennusrakenne järjestetään tietolähteiden mukaan. Tämän ns. raakadatan hyödyntäminen vaatii yleensä käsittelyä, mutta mahdollistaa monenlaista innovatiivista käyttöä. Kokeellinen analytiikka ja koneoppimismallit voivat hyödyntää tietoaltaan dataa ja tietoaltaan data-alustan tarjoamaa tiedonkäsittelykykyä. Tietoallas voi palvella tietovaraston tietojen arkistona ja esikäsittelyssä, ja sieltä voidaan tuottaa saatuja validoituja analyysituloksia edelleen hyödynnettäväksi ja jaeltavaksi.

Tietovarasto on tiedonhallinnan työjuhta

Tietovarastot palvelevat analytiikkaa. Ne sisältävät ensisijaisesti määrämuotoista, laadukasta, yhtenäistettyä dataa, joka tukee etenkin ennakoitavissa olevaa analytiikkaa ja raportointia. Tietovarastossa tiedot sisältävät tyypillisesti aikaulottuvuuden. Tämä mahdollistaa analytiikkaa yli pitkienkin aikajaksojen ja jopa yli erilaisten tiedonsaannin epäjatkuvuuskohtien, kuten perusjärjestelmien vaihdosten. Usein tietoa jalostetaan alemman tason tiedoista, ja latausten perustekniikka pohjaa eräajoihin. Tietovarasto on tiedonhallinnan vanha kunnon työjuhta, joka kaipaa kaverikseen monimuotoista ja vielä tiukemmin ajantasaista dataa.

Data hub voi perustua eri teknologioihin – paras vaihtoehto löytyy asiantuntijan avulla

Enfon asiakkaat ovat ottaneet data hubin vastaan tervetulleena komponenttina, joka selkeyttää tiedonhallinnan arkkitehtuuria. Olemme rakentaneet data hub -ratkaisuja palvelemaan järjestelmäintegraation välivarastona sekä täydentämään tietovarasto- ja tietoallasratkaisuja.

Olemme rakentaneet data hub -ratkaisuja palvelemaan järjestelmäintegraation välivarastona sekä täydentämään tietovarasto- ja tietoallasratkaisuja.

Author

Mika Naatula

Author's title

CTO, Enfo

Text

Moni miettii, mille teknologiapohjalle oman organisaation data hub -ratkaisua kannattaisi rakentaa. Olisiko se teknisesti perinteinen relaatiokanta, jokin toisen tyyppinen tietokanta, vaiko ehkä sittenkin datan virtualisointia? Entä miten data hub suhtautuu erillisiin masterdata-järjestelmiin, ja voisiko sen rakentaa masterdata-tuotteeseen pohjautuen? Nämä pohdinnat ratkeavat parhaiten kokeneiden tiedonhallinnan asiantuntijoiden avustuksella.

Mika Naatula on Enfon Information Management -liiketoiminnan teknologiajohtaja. Hän on toiminut yli 20 vuotta datan hallinnoinnin ja analytiikan parissa, missionaan parempi datan hyödynnettävyys kestävän hallinnoinnin keinoin.

Jaa