Skip to main content

Kuva

People working on high table
Artikkeli

Datan virtualisointi – ratkaisu datan hallintaan?

Sisältökappaleet

Text

Datamäärien kiihtyvä kasvu asettaa haasteita datan hallittavuudelle, saatavuudelle ja käytettävyydelle. Perinteisesti ongelmaa on pyritty ratkomaan datan kopiointiin perustuvilla ratkaisuilla, kuten tietovarastoinnilla ja erilaisilla tietoaltailla, mutta nämä ovat nyt saaneet rinnalleen datan virtualisoinnin. 

”Datan virtualisoinnissa hajallinen data eri järjestelmistä saadaan näyttämään yhtenäiseltä, aivan kuin se olisi yhdessä järjestelmässä”, selventää Enfon informaatiohallinnan yksikön teknologiajohtaja Mika Naatula. ”Datan virtualisointi mahdollistaa datan muokkaamisen ja noutamisen fyysisestä tallennuksesta riippumatta yhtenäisillä periaatteilla. Perinteisestä tietovarastoinnista ja ELT:stä tai ETL:stä poiketen periaatteellinen ero on siinä, että tässä ratkaisussa data lähtökohtaisesti pidetään alkulähteellään ja noudetaan vasta sitten, kun sitä tarvitaan.”

”IBM:llä ja Oraclella oli jo 1980-luvulla käytössä ratkaisuja, joilla saman tietokantatuotteen sisällä voitiin tehdä virtualisointia eri paikasta toiseen”, jatkaa Enfon johtava konsultti Johannes Almiala. ”Nyt kuitenkin sekä tuotteet että infrastruktuuri ovat muuttuneet. Esimerkiksi infrassa on viime aikoina tapahtunut valtava muutos pilvipalvelupohjaisten järjestelmien käytössä ja niissä emme välttämättä aina pääse datan alkulähteille kyselemään tietoja samaan tapaan kuin perinteisissä konesalisovelluksissa.”

”Tietojen muutoksista saadaan ehkä tuotettua muutosjono, joka pitäisi tallentaa tietoaltaaseen, mutta tätä ei välttämättä haluta tai kyetä tekemään. Virtualisoimalla kyselyt virtualisointikerroksen alle niitä voidaan käyttää aivan kuin tiedot olisivat tietoaltaassa tai konesalissa”, Almiala kuvaa.

Korvaako datan virtualisointi tietoaltaan tai tietovaraston?

Almialan mukaan virtualisointi ei korvaa tietoallasta, mutta se voi korvata formalisoidun perinteisen tietovarastokerroksen. ”Tietoaltaan rooli on merkittävä, koska sinne voidaan tallentaa historiallinen aikasarjatieto, jota ei välttämättä sovelluskerroksilta ole saatavissa.”

Image

Naatula

Jos aloitamme täysin puhtaalta pöydältä, virtualisointia voi tilanteesta riippuen harkita yksittäisenä ratkaisuna operatiivisten järjestelmien päälle.

Author

Mika Naatula

Author's title

CTO, Enfo

Text

”Hyvä esimerkki tästä on esimerkiksi IoT-tyyppinen data, kuten toimiston lämpötila-anturi”, Naatula jatkaa. ”Se saattaa syöttää lämpötilatietoa IoT-järjestelmän yli ja sen avulla voidaan reaaliaikaisesti kontrolloida ilmastointijärjestelmää, mutta data ei välttämättä tallennu mihinkään. Jos halutaan tehdä pidemmälle meneviä optimointeja, laskea järjestelmien kapasiteetteja tai tehdä tähän päälle analytiikkaa, niin datan pitää tallentua johonkin.”

Naatulan mielestä on tilanneriippuvaista, korvaako datan virtualisointi tietoaltaan tai tietovaraston. ”Jos analytiikan ja raportoinnin tarpeisiin on rakennettuna hyvät alustajärjestelmät ja organisaatiossa saattaa ehkä olla useitakin tietovarastojärjestelmiä, virtualisointi toimii tässä päällä hyvänä täydentävänä kerroksena. Jos sen sijaan aloitamme täysin puhtaalta pöydältä, virtualisointia voi tilanteesta riippuen harkita yksittäisenä ratkaisuna operatiivisten järjestelmien päälle.”

Millaisia tuotteita datan virtualisointiin löytyy?

Naatula kertoo havainneensa, että Suomessa datan virtualisointiin hyödynnetään muutamia eri tuotteita. ”Virtualisointiin erikoistunutta Denodoa voisi kutsua klassikkotuotteeksi, ja esimerkiksi IBM:ltä löytyy Cloud Pak for Data -niminen tuote. TIBCOn Data Virtualization -tuote puolestaan on maailmanluokan ratkaisu datan virtualisointiin.”

”Analyytikkojen raporteissa on nähtävillä myös Informatican ratkaisu”, Almiala täydentää. ”Se ei kuitenkaan ole täysin puhdas virtualisointi vaan enemmänkin integraatiohubi, joka vahvasti pohjautuu lähdejärjestelmistä saatuun, välimuistiin tallennettuun tietoon.”

Markkinajohtaja TIBCOn tuote on suuren mittakaavan yrityskäyttöön soveltuva järjestelmä, joka on skaalattava, turvallinen ja luotettava. Sillä voidaan muun muassa tehdä kokeellisia järjestelmiä ja prototyyppejä nopeasti ja tehokkaasti, testata ideoita sekä hoitaa osa datan preparoinnista nopeammin ja tehokkaammin. 

Image

Datan virtualisointi - Johannes Almiala

Tämä istuu todella hyvin tiedonhallinnan kokonaisarkkitehtuuriin.

Author

Johannes Almiala

Author's title

Johtava konsultti, Enfo

Text

”TIBCOn tuote mahdollistaa olemassa olevan datan infrastruktuurin tehokkaan hyödyntämisen”, Naatula kertoo. ”Se voi käyttää alla olevia isoja data-alustoja, mutta se sisältää myös oman MPP- eli Massive Parallel Process -käsittelymoottorin. Suunnittelija voi siis päättää, tehdäänkö käsittelyä datan virtualisointimoottorissa itsessään, vai laitetaanko se alla olevien data-alustojen tehtäväksi. Voisi kiteyttää, että tuote tarjoaa reaaliaikaisen ja ajantasaisen alustan datan hyödyntämiselle”, Naatula summaa.

Almiala täydentää: ”TIBCOn tuote auttaa saamaan datan tarjolle Googlen tapaan. Eli datakatalogin käyttäjä etsii hakutermillä vaikkapa asiakastietoa, ja katalogi kertoo, millaisia lähteitä on tiedossa. Datan provisiointi virtualisoinnin läpi suoraan lähteistä käyttäjille sopii erittäin hyvin tähän käyttötarkoitukseen.”

Tuotteesta löytyy esimerkiksi dataprofilointiin toiminnot, joiden avulla datasetit saadaan helposti yhdistettyä toisiinsa. Tästä on hyötyä etenkin bimodaalisessa kehityksessä, jossa prototyypinomaisesti yhdistetään lähteitä ja katsotaan, miten ne toimivat yhteen toistensa kanssa.

”Virtualisointiympäristöä voidaan myös skaalata lähes lineaarisesti tarpeen mukaan”, Naatula kertoo. ”Lisäksi tuotteesta löytyy monipuolinen cache-toiminnallisuus – data voidaan toisin sanoen tuoda virtuaalimoottoriin esimerkiksi halutulla frekvenssillä ja voidaan myöskin päättää, että tietyt käsittelyt laitetaan käsiteltäviksi alemmille kerroksille. TIBCOn ratkaisussa on valmiit integraatiopinnat erilaisiin järjestelmiin, sovelluspalvelimiin, tietokantoihin sekä sanomajonoihin ja lisäksi siitä löytyy julkaisurajapinnat.”

”Tämä istuu todella hyvin tiedonhallinnan kokonaisarkkitehtuuriin”, Almiala sanoo. ”Tuote mahdollistaa paljon joustavuutta kehitysvaiheessa, ja sen päälle voidaan rakentaa monipuolisesti erilaisia ratkaisuja. Gartner onkin ennustanut, että vuoden 2020 loppuun mennessä puolella yrityksistä olisi käytössään jonkinlainen virtualisointi”, Almiala päättää.

Artikkeli perustuu 21.4.2020 pidettyyn webinaariin, ” Datan virtualisointi - ratkaisu datan hallintaan”. Lataa webinaaritallenne katsottavaksesi.

Kiinnostuitko aiheesta? Tutustu myös toiseen webinaariimme, Moderni Data Science -alusta liiketoiminnan tukena
 

Enfo toimii TIBCOn strategisena kumppanina ja jälleenmyy TIBCOn ratkaisuja yksinoikeudella Pohjoismaissa ja Baltiassa. Lue lisää palveluistamme tai jätä meille yhteydenottopyyntö.

Jaa