Spartan tiedonhallinnan sanasto

Tavoitteenamme on luoda ymmärrystä.

Tämä sanasto on tarkoitettu niin tiedonhallinnan ammattilaisille, liiketoiminnan päättäjille, kuin kaikille muille aiheen parissa työskenteleville. Sanaston tarkoituksena on auttaa luomaan yhteinen ymmärrys eri toimijoiden välille.

Yhteinen ymmärrys on ensiaskel kehityksen toteuttamiseksi yhtenä rintamana.


Ehdota uutta termiä

Perustermit

Data

Eng.: Data

Määritelmä: Tiedon esitysmuoto. Järjestelmän sisällä olevaa, sinne tulevaa, tai sieltä lähtevää tietovirtaa. Data voi olla esimerkiksi numeerista tai symbolipohjaista tietoa, dokumentteja tai asiakirjoja, tai tietovirtoja.

Eli yleistäen, kaikki tieto joka organisaation sähköisissä järjestelmissä on tai liikkuu, on dataa. Niin tiedostot työasemilla ja verkkolevyillä, erilaissa järjestelmissä oleva tieto, kuin kaikki mitä näiden välillä liikkuu.

Informaatio

Määritelmä: Joukko tietoa/dataa (ks. määritelmä ”Data”), joka on tarkoitettu kommunikoitavaksi.

Erään määritelmän mukaan informaatio on ”dataa jolla on konteksti”. Toisin sanoen, dataa esitettynä ihmisen ymmärtämässä muodossa.

Tiedonhallinta

Eng.: Information Management

Määritelmä: Tiedonhallinta luo edellytykset hyödyntää dataa osana organisaation toimintaa. Se on määrätietoista toimintaa, jossa tietoa hallitaan organisaation aineettomana pääomana. Lähtökohtana on usein digitalisaation edesauttaminen tai mahdollistaminen.

Digitalisaatio

Eng.: Digitalization

Määritelmä: Termillä viitataan yleisesti digitaalisen teknologien yleistymiseen työ- ja arkielämässä, sekä näiden teknologioiden vaikutuksiin päivittäisisissä toimintatavoissa ja toiminnan mahdollisuuksissa.

Digitalisaatioon voidaan liittää muun muassa seuraavat ilmiöt:

  • Sähköinen ja/tai automaattinen tiedonvälitys
  • Sähköiset, digitaaliset järjestelmät
  • Eri toimijoiden tarjoamat digitaaliset asiointimahdollisuudet
  • Esineiden internet
  • Digitaalisen ja fyysisen maailman keskinäinen vuorovaikutus

Erilaisia tietotyyppejä

Metatieto

Eng.: Metadata

Määritelmä: Tietoa, joka kuvaa tiedon sisältöä, rakennetta, kontekstia tai muuta tietoon liittyvää ominaisuutta.

Metadata on rakenteista tietoa, joka mahdollistaa muun muassa tiedon laadinnan, rekisteröinnin, luokittelun, käyttöön saamisen, siirtämisen, jakamisen, tietojärjestelmien välisen tiedon liikutettavuuden, säilyttämisen ja hävittämisen.

Esimerkkejä metadatasta ovat muun muassa tiedot tiedoston luontiajankohdasta, sijainnista ja vaikkapa muutoshistoriasta.

Ydintieto

Eng.: Master Data

Määritelmä: Muuttumatonta tai harvakseltaan muuttuvaa perustietoa johon organisaation toiminta pohjautuu. Ydintiedon tarkka määritelmä riippuu organisaatiosta ja tarkastelunäkökulmasta.

Esimerkiksi vaikkapa saman organisaation asiakas- ja taloushallinnon toimialueiden ydintiedot voivat olla osaltaan päällekkäisiä, osaltaan eriäviä ja joiltain osin jopa ristiriitaisia (esimerkiksi asiakkaan tai osoitteen määritelmä).

Asiakastieto

Eng.: Customer Data

Määritelmä: Organisaation ylläpitämää sen asiakkaita koskevaa tietoa. Asiakastietoa hyödynnetään usein esimerkiksi myynnin, markkinoinnin, toimituksen ja laskutuksen toimenpiteiden kohdentamiseen ja seuraamiseen.

Tuotetieto

Eng.: Product Data

Määritelmä: Organisaation ylläpitämää, sen tuotteita koskevaa, tietoa. Tuotetieto voi liittyä esimerkiksi yhden tai useamman tuotteen suunnitteluun, valmistukseen, varastointiin, toimitukseen tai ylläpitoon, tai koostua useista tällaisista näkökulmista.


Tiedonhallinnan käsitteitä

Ydintiedon hallinta

Eng.: Master Data Management (MDM)

Määritelmä: Organisaation tai sen osan keskeisen yhteiskäyttöisen ydintiedon (master data) keskitettyä ja tarkoituksenmukaista käsittelyä ja hallintaa. Usein tavoitteena kohteena olevan tiedon yhdenmukaistaminen sen eri käsittelijöiden välillä, näin mahdollistaen sen parempi käytettävyys ja hyödynnettävyys.

Asiakastiedon hallinta

Eng.: Customer Relationship Management (CRM)

Määritelmä: Organisaation asiakkaisiin liittyvän tiedon keskitettyä ja tarkoituksenmukaista käsittelyä ja hallintaa.

Asiakastietoa käsitellään usein tarkoitusta varten suunnitelluissa CRM-ohjelmistoissa, joissa käsiteltäviä asiakastietoja voivat olla esimerkiksi asiakkaan luokittelut (prospekti, asiakas, entinen asiakas, ym.), asiakkaan kontaktitiedot, sekä merkinnät asiakkaaseen kohdistuneista toimenpiteistä.

Esimerkkejä tunnetuista CRM-järjestelmistä ovat muun muassa Salesforce, Microsoft Dynamics ja Netsuite.

Tuotetiedon hallinta

Eng.: Product Data Management (PDM) / Product Lifecycle Management (PLM)

Määritelmä: Organisaation tuotteisiin liittyvän tiedon keskitettyä ja tarkoituksenmukaista käsittelyä ja hallintaa.

Tuotetiedon hallintaan liittyy usein läheisesti käsite ’tuotteen elinkaari’. Tuotteen elinkaareen voi kuulua esimerkiksi tuotteen määrittely, suunnittelu, valmistus, varastointi, toimitus, huolto ja kunnossapito. Tuotetiedon hallintaa voi kohdistua erilaisiin tietoihin läpi tuotteen elinkaaren.

Sisällön hallinta

Eng.: Enterprise Content Management (ECM)

Määritelmä: Organisaation digitaalisten tietosisältöjen ja niihin liittyvien metatietojen, integraatioiden, elinkaaren ja vastaavien seikkojen, keskitettyä ja tarkoituksenmukaista hallintaa.

Tietosisältöjen elinkaareen voi kuulua esimerkiksi tiedon luominen, vastaanottaminen, käyttäminen, jakaminen, seuranta, siirtäminen, talteenotto ja säilyttäminen. Elinkaaren hallintaan sisältyy siihen liittyviä toimenpiteitä koskevan tiedon tallettaminen todennettavalla tavalla.

Tiedon hallintamalli

Eng.: Information/Data Governance Model

Määritelmä: Kuvaus käytössä olevista tai suunnitelluista prosesseista, toimenpiteistä ja ohjeistuksista, sekä näihin liittyvistä rooleista ja vastuista, joiden avulla tietoa ja tietoon liittyviä järjestelmiä hallinnoidaan osana organisaation toimintaa.

Tietomigraatio

Eng.: Information/Data Migration

Määritelmä: Tiedon tai tietojoukon siirto järjestelmästä toiseen siten, että tiedon keskeiset ominaisuudet (muun muassa autenttisuus, eheys, luotettavuus ja käytettävyys) säilyvät.


Tieto- ja prosessimallit

Käsitemalli

Eng.: Conceptual Model

Määritelmä: Organisaation tai sen osan keskeisiä käsitteitä ja niiden välisiä riippuvuuksia ja vuorovaikutussuhteita kuvaava kokonaisuus.

Looginen malli

Eng.: Logical Model

Määritelmä: Toiminnan tarpeista johdettu organisaation tai sen osan käsittelemää tietoa, ja sen käsittelyn eri vaiheisiin liittyviä prosesseja, kuvaava kokonaisuus.

Tietomalli

Eng.: Information/Data Model

Määritelmä: Organisaation tai sen osan käsittelemään tietoon liittyviä käsitteitä, rakenteita, vuorovaikutussuhteita (esimerkiksi relaatioita ja rajapintoja) sekä digitaalisia, fyysisiä ja/tai hallinnollisia sijainteja kuvaava kokonaisuus.

Prosessi

Eng.: Process

Määritelmä: Sarja yhdessä määriteltyjä suoritettavia toimenpiteitä, jotka tähtäävät tiettyyn lopputulokseen.

Prosessikartoitus

Eng.: Process Mapping

Määritelmä: Prosessikartoitus tähtää organisaation tai sen osan ydin- ja tukiprosessien kuvaamiseen. Kartoittamalla ja kuvaamalla (mallintamalla) prosessit, tuodaan kartoituksen kohteen toimintatavat ja niihin liittyvä informaatio (informaatioprosessit) näkyviksi, usein prosessikuvauksen muodossa.

Prosessikuvaus

Eng.: Process Description

Määritelmä: Kuvallinen tai sanallinen havainnollistus prosessista. Prosessikartoituksen lopputulos, tai osa siitä.

Tietovirta

Eng.: Information/Data Flow

Määritelmä: Prosessiin kuuluvan tai prosessien välisen tiedon vaihdon, tietovarannon hyödyntämisen, tietoon vaikuttavan ulkopuolisen lähteen tai vaikuttimen, tai prosessin lopputuloksen kuvaus.

Skeema

Eng.: Scheme

Määritelmä: Metatietoelementtien välisten suhteiden kuvaus. Useimmiten skeemaan sisältyy määrittely metatiedon käytön ja hallinnan säännöistä, sekä elementtien semanttisesta merkityksestä, syntaksista ja pakollisuudesta.

Skeema voi olla esimerkiksi tilanne, jossa asiakastietojärjestelmään voidaan syöttää henkilön nimi, puhelinnumero sähköpostiosoite, joista nimi on asetettu pakolliseksi tiedoksi henkilön lisäyksen yhteydessä.


Tieto- ja järjestelmäarkkitehtuurit

Kokonaisarkkitehtuuri

Eng.: Enterprise Architecture

Määritelmä: Kuvaus organisaation toimintaprosessien, niiden käyttämän tiedon, ja tiedon käsittelyyn käytettyjen järjestelmien keskinäisen toiminnan kokonaisuudesta.

Tietoarkkitehtuuri

Eng.: Information/Data Architecture

Määritelmä: Kuvaus organisaation tai sen osan käyttämän tiedon koostamisesta, organisoinnista, luokittelusta ja välittämisestä.

Tietoarkkitehtuuri tarkastelle organisaation tietotarpeita, tietopääomaa, tietojen välisiä suhteita, tiedon arvoketjuja, tiedon rakenteita, sekä tiedon organisointia ja hallintaa. Tietoarkkitehtuurin tavoitteena on usein luoda yhteinen näkemys tarkastelukohteen keskeisestä tietopääomasta ja sen käyttäytymisestä, ja näin helpottaa tiedon löytämistä, välittämistä ja hallintaa.

Tietoarkkitehtuurissa pääosassa on nimenomaan tieto. Tietoarkkitehtuuri voi kuvata esimerkiksi sitä, missä sijaitsevat tiedot organisaation sopimuksista, asiakkaista, laskutuksesta tai vaikkapa varaston kappalemääristä.

Järjestelmäarkkitehtuuri

Eng.: System Architecture

Määritelmä: Kuvaus organisaation tai sen osan käyttämän tiedon käsittelyprosesseissa tarvittavista tietojärjestelmistä.

Käytännössä siis teknisen tason kuvaus siitä, miten yrityksen tietojärjestelmät toimivat. Voi olla esimerkiksi prosessikuvaus siitä, miten tieto liikkuu vaikkapa CRM-, taloushallinto-, ja raportointijärjestelmien välillä.


Tiedon ominaisuuksia ja kuvauksia

(Tieto)Entiteetti

Eng.: (Information/Data) Entity

Määritelmä: Yhdestä tai useammasta osasta syntyvä yhteenkuuluva itsenäinen tietojoukko. Kokonaisuus, joka voidaan hahmottaa ja jolla on ominaisuuksia ja vuorovaikutussuhteita.

Esimerkiksi tietojärjestelmä tai sen yksittäinen metatietoryhmä kaikkine arvoineen; vaikkapa CRM-järjestelmässä oleva asiakastieto, joka koostuu useammista osatiedoista kuten nimi, osoite, y-tunnus, kontaktihenkilöt, muutoshistoria, ym.

Elinkaari

Eng.: Lifecycle

Määritelmä: Tiedon elinkaari alkaa sen luomisessa ja käsittelyn käynnistyessä, päättyessään tiedon pysyvään säilyttämiseen tai hävittämiseen. Tiedon elinkaareen voi kuulua esimerkiksi tiedon luominen, muokkaaminen, käsittely, jakaminen, rajoittaminen, arkistointi ja poistaminen.

Laatu

Eng.: Quality

Määritelmä: Laadukas tieto on oikeaa, autenttista ja jäljitettävissä. Tiedon laadun voidaan katsoa koostuvan erilaisista osatekijöistä, joita voivat olla muun muassa saatavuus, jäljitettävyys, eheys, käytettävyys ja oikea-aikaisuus.

Saatavuus

Eng.: Availability

Määritelmä: Tiedon tulee olla saatavilla sille asetettujen käyttöoikeuksien ja/tai käytön rajoitusten mukaisesti. Saatavuuteen liittyy myös ajallinen ja laadullinen näkökulma: tiedon tulee olla saatavilla tiettyyn aikaan ja tietyssä muodossa.

Esimerkiksi vanhentunut tai lukukelvoton tieto, vaikkakin sinänsä saatavilla, voi olla käyttötarpeeseen nähden hyödytöntä.

Jäljitettävyys

Eng.: Traceability

Määritelmä: Jäljitettävyys tarkoittaa sitä, että tietoon kohdistuneet tapahtumat läpi sen elinkaaren ovat luotettavasti selvitettävissä ja todennettavissa. Jäljitettävyys luo perustan myös tiedon eheyden varmistamiselle.

Jäljitettävyyteen ja eheyteen voidaan katsoa kuuluvaksi myös sen erottaminen, ovatko tietoon kohdistuneet muutokset ihmisen toiminnan vai automatiikan seurausta.

Eheys

Eng.: Integrity

Määritelmä: Eheys tarkoittaa tiedon todistettavaa muuttumattomuutta, tai siihen kohdistuvien muutosten tapahtumista vain ennalta määrätyissä puitteissa. Eheyteen voidaan katsoa kuuluvaksi tiedon (tai tietojärjestelmän) aitous, väärentämättömyys, sisäinen ristiriidattomuus, kattavuus, ajantasaisuus, oikeellisuus ja käyttökelpoisuus, sekä se, että näihin kohdistuneet muutokset ovat tapahtuneet voimassaolevien käyttövaltuuksien puitteissa.

Eheydestä voidaan puhua joko teknisessä tai semanttisessa kontekstissa. Tekninen eheys viittaa tiedon tekniseen, absoluuttiseen, sisältöön. Semanttinen eheys taas viittaa tiedon merkitykseen; ymmärrykseen tiedosta osana laajempaa kontekstia.

Esimerkki tiedon eheyteen liittyvästä ongelmasta voi olla vaikkapa tilanne, jossa asiakastietojärjestelmään on kirjattu yrityksen nimi, mutta ei y-tunnusta. Tämä puutos aiheuttaa ongelman tilanteessa, jossa laskutusosasto yrittää muodostaa laskua johon y-tunnusta vaaditaan. Vastaavassa tilanteessa ongelmia seuraa myös, mikäli asiakkaan osoitetieto osoittautuu vanhentuneeksi tai vääräksi, jolloin lasku lähetetään väärään osoitteeseen ja sen maksu viivästyy tai estyy kokonaan.

Käytettävyys

Eng.: Usability

Määritelmä: Tiedon käytettävyys viittaa tiedonsaannin helppouteen. Tämä on riippuvaista siitä, miten tieto on löydettävissä, saatavissa esille, esitettävissä ja tulkittavissa. Käytettävyys liittyy läheisesti tiedon saatavuuteen, mutta tämän lisäksi siihen vaikuttavat myös muun muassa tiedon tunnistettavuus ja löydettävyys.

Tiedon käytettävyyttä perinteisesti heikentävä ongelma on niin kutsuttu siiloutuminen. Haluttu/tarvittu tieto voi olla olemassa, mutta se on piilotettuna osaston tai järjestelmän muodostamaan ”siiloon”, johon ulkopuolisilla tahoilla ei syystä tai toisesta ole pääsyä tai näkyvyyttä.

Oikea-aikaisuus

Eng.: Timeliness

Määritelmä: Tiedon oikea-aikaisuus viittaa toisaalta sen ajantasaisuuteen, toisaalta sen saatavilla olemiseen ja käytettävyyteen tietyn aikaraamin puitteissa. Lisäksi oikea-aikaisuus liittyy näiden osatekijöiden suhteeseen: oikeaan aikaan saatavilla olevan tiedon tulee olla myös ajantasaisuudeltaan relevanttia suhteessa tarpeeseen.

Tiedon oikea-aikaisuus on tärkeää etenkin, mikäli tietoa halutaan käyttää tiedolla johtamiseen. Jos vaikkapa talousraportin valmistuminen kestää useita kuukausia, on sen julkaisuhetkellä sisältämän tiedon oikea-aikaisuus heikolla tasolla suhteutettuna sen pohjalta mahdollisesti nousevaan liiketoiminnan muutostarpeeseen.


Teknologioita ja menetelmiä

Tilasto

Eng.: Statistics

Määritelmä: Kokoelma tyypillisesti jotakin asiaa, ilmiötä tai prosessia kuvaavaa jalostettua tietoa.

Tilasto voi olla sidottu yksittäiseen ajankohtaan, tai sisältää tarkastelun kohteen historiaa ja/tai kehittymistä kuvaavaa tietoa. Sisältäessään historiatietoa tilasto voi myös pyrkiä joko suoraan tai epäsuorasti indikoiden antamaan ennusteen tarkastelun kohteen arvioidusta kehityksestä.

Tilasto voi olla esimerkiksi listaus yrityksen kuukauden aikana tapahtuneista myyntitapahtumista tai vaikkapa jalkapallopelien tuloksista.

Analytiikka

Eng.: Analytics

Määritelmä: Analytiikkaa voidaan kuvata kokoelmaksi menetelmiä ja työskentelytapoja, joiden tavoitteena on jalostaa ja muodostaa kerätystä tiedosta kattavampaa informaatiota ja malleja.

Mallien tavoitteena voi olla joko menneiden tapahtumien syy-seuraus-suhteiden ymmärtäminen, tulevien tapahtumien ennakoiminen tai molemmat samanaikaisesti.

(Ohjelmisto)Robotiikka

Eng.: (Software) Robotics

Määritelmä: Puhtaasti digitaalisessa kontekstissa robotiikka viittaa ohjelmistoihin tai ohjelmiston määrityksiin (skripti), jotka tekevät automaattisesti tiettyjä ennalta määrättyjä tehtäviä.

Tällaisia tehtäviä voivat yksinkertaisimmillaan olla esimerkiksi samankaltaisina toistuvien toimintojen automatisointi, tietomassojen läpikäynti, tiedon jalostaminen sekä tietoa koskevien mallien luominen. Esimerkkejä monimutkaisemmista ohjelmistorobotiikan sovellutuksista ovat muun muassa osakkeiden robottikauppa tai internetin sekä erilaisten tietokantojen hakurobotit.

Tekoäly

Eng.: Artificial Intelligence (AI)

Määritelmä: Tekoäly (tai keinoäly) on tietokone tai tietokoneohjelma, joka kykenee tekemään älykkäinä pidettäviä toimintoja. Tekoälyn tarkempi määrittely on avoin, koska älykkyyttä itsessään on vaikea määritellä.

Myös rajanveto tilastollisen analyysin, robotiikan ja keinoälyn välillä on tästä syystä ajoittain haasteellinen. Erottavana tekijänä näiden välillä käytetään monesti tekoälyn kykyä ajatella ja oppia, siinä missä ohjelmistorobotti luottaa puhtaasti sille ennalta määriteltyihin malleihin ja toimintatapoihin.

Koneoppiminen

Eng.: Machine Learning

Määritelmä: Koneoppiminen tarkoittaa, että tarkkojen sääntöjen sijasta tietokoneelle tai ohjelmalle annetaan kyky ja resurssit oppia esimerkeistä. Suuri osa tekoälyä hyödyntävistä sovelluksista perustuu koneoppimiseen.

Lohkoketju

Eng.: Blockchain

Määritelmä: Lohkoketju on teknologia, jossa tietoon tai tietojoukkoon liittyvät transaktiotiedot jaetaan kaikkien transaktioihin osallistuvien tahojen kesken. Näin ne voidaan todentaa monesta rinnakkaisesta lähteestä.

Teknologia mahdollistaa sen, että hajautetussa tiedon siirtämisen tai käsittelyn järjestelmissä eri osapuolet voivat luottaa sen sisältämään tietoon, vaikka ne eivät luottaisikaan toisiinsa.

Lohkoketjun kenties tunnetuin sovellutuskohde ovat sähköiset niin kutsutut kryptovaluutat. Nämä perustuvat hajautetusti arkistoituun tietoon valuutan omistuksista ja omistusten muutoksista. Jokaisesta muutoksesta tulee merkintä, eräänlainen kuitti, joka kopioituu automaattisesti kaikille osallisille, kyseistä valuuttaa omistaville tahoille. Valuutan luotettavuus perustuu sille, että yksittäinen taho ei käytännössä voi manipuloida omistustietoja, sillä uskottavan manipuloinnin toteuttaminen vaatisi samojen muutosten tekemistä yksitellen kaikille, jotka valuuttaa omistavat.

Tietovarastot

Eng.: Data Storage, Data Warehouse, Data Lake

Määritelmä: Tietovarastoksi kutsutaan tietokantaa, tai useimmiten tietokantojen kokoelmaa, johon on tallennettu organisaatiota tai sen osaa koskevaa tietoa.

Englanninkieliset termit Data Storage ja Data Warehouse viittaavat pääsääntöisesti jäsenneltyä, tiettyä tarkoitusta varten kerättyä tietoa sisältäviin varastoihin.

Data Lake taas useimmiten viittaa varastoon johon tietoa kerätään välttämättä vielä tietämättä sen lopullista käyttötarkoitusta. Mahdollisimman paljon tietoa eri paikoista tuodaan siis saataville samaan paikkaan (Data Lake), josta sitä sitten lähdetään poimimaan ja jalostamaan erilaisiin tarpeisiin.

Data Lake:ssä tiedon jäsentely ja rakenne voi olla vaihtelevaa. Data Lake:n ylläpitäminen tähtää usein koneoppimisen ja/tai tekoälyn kehittämiseen tai hyödyntämiseen.

ETL

Eng.: ETL; Extract, Transform, Load

Määritelmä: ETL terminä viittaa kokonaisuuteen, johon liittyy tiedon siirtäminen, muokkaaminen ja lataaminen. Tieto siis haetaan lähdejärjestelmästä, sitä muokataan tarpeen mukaan, ja se ladataan (siirretään) edelleen tietovarastoon.

ETL-prosessi voi esimerkiksi lukea tuntikirjaus-Excelin yrityksen verkkolevyltä (Extract), muuntaa sen sisältämät tiedot tekstimuotoon (Transform), ja tämän jälkeen syöttää ne palkanlaskentajärjestelmään (Load).


Yhteenveto lyhenteistä

MDM

Määritelmä: Master Data Management, ks. Ydintiedon hallinta

CRM

Määritelmä: Customer Relationship Management, ks. Asiakastiedon hallinta

PDM / PLM

Määritelmä: Product Data Management, Product Lifecycle Management, ks. Tuotetiedon hallinta

ECM

Määritelmä: Enterprise Content Management, ks. Sisällönhallinta

AI

Määritelmä: Artificial Intelligence, ks. Tekoäly

ML

Määritelmä: Machine Learning, ks Koneoppiminen


Lisätietoa

Lisää määritelmiä tiedonhallintaan ja dataan liittyen löydät muun muassa seuraavista paikoista:

Sanastokeskus, tietotekniikan termitalkoot: http://www.tsk.fi/tsk/termitalkoot/fi/hakemistot-267.html

Ari Hovi Oy:n blogi: https://www.arihovi.com/3274-2/#

Ite wiki, digitalisoinnin opas: https://www.itewiki.fi/opas