Spartan tiedonhallinnan sanasto

Tavoitteenamme on luoda ymmärrystä.

Tämä sanasto on tarkoitettu niin tiedonhallinnan ammattilaisille, liiketoiminnan päättäjille, kuin kaikille muille aiheen parissa työskenteleville. Sanaston tarkoituksena on auttaa luomaan yhteinen ymmärrys eri toimijoiden välille. Yhteinen ymmärrys on ensiaskel kehityksen toteuttamiseksi yhtenä rintamana.

Jos haluat nähdä miten nämä asiat toteutuvat käytännössä, lue lisää palveluistamme tai katso asiakastarinamme.

Ehdota uutta termiä

Ehdota termiä

Perustermit

Data

Eng. data

Data on tiedon esitysmuoto, joka voi esiintyä esim. erilaisina tietovirtoina järjestelmissä. Tämä tieto voi olla numeerista, symbolipohjaista, dokumentteja tai asiakirjoja, ja se voi liikkua erilaisten sähköisten järjestelmien välillä.

Data voi sisältää esimerkiksi tiedostoja, jotka ovat tallennettuna työasemille ja verkkolevyille, sekä tietoa erilaisissa järjestelmissä ja niiden välillä tapahtuvia tietovirtoja. Yleisesti ottaen kaikki organisaation sähköisissä järjestelmissä oleva tai liikkuva tieto voidaan määritellä dataksi.

Tieto

Eng. information

Tieto on informaatiota tai dataa (ks. määritelmä ”Data”), joka on esitetty ihmisen ymmärtämässä muodossa ja tarkoitettu kommunikointiin. Se sisältää kontekstin, joka mahdollistaa sen merkityksen ymmärtämisen ja hyödyntämisen.

Tiedonhallinta

Eng. information management

Tiedonhallinta luo edellytykset hyödyntää dataa osana organisaation toimintaa. Se on määrätietoista toimintaa, jossa tietoa hallitaan organisaation aineettomana pääomana. Lähtökohtana on usein digitalisaation edesauttaminen tai mahdollistaminen.

Digitalisaatio

Eng. digitalization

Termillä viitataan yleisesti digitaalisten teknologioiden yleistymiseen työ- ja arkielämässä, sekä näiden teknologioiden vaikutuksiin päivittäisisissä toimintatavoissa ja toiminnan mahdollisuuksissa.

Digitalisaatioon voidaan liittää muun muassa seuraavat ilmiöt:

  • Sähköinen ja/tai automaattinen tiedonvälitys
  • Sähköiset, digitaaliset järjestelmät
  • Eri toimijoiden tarjoamat digitaaliset asiointimahdollisuudet
  • Esineiden internet
  • Digitaalisen ja fyysisen maailman keskinäinen vuorovaikutus

Erilaisia tietotyyppejä

Metatieto

Eng. metadata

Tietoa, joka kuvaa tiedon sisältöä, rakennetta, kontekstia tai muuta tietoon liittyvää ominaisuutta.

Metadata on rakenteista tietoa, joka mahdollistaa muun muassa tiedon laadinnan, rekisteröinnin, luokittelun, käyttöön saamisen, siirtämisen, jakamisen, tietojärjestelmien välisen tiedon liikutettavuuden, säilyttämisen ja hävittämisen. Esimerkkejä metadatasta ovat tiedot tiedoston luontiajankohdasta, sijainnista ja muutoshistoriasta.

Ydintieto

Eng. master data

Ydintieto / master data on muuttumatonta tai harvakseltaan muuttuvaa perustietoa, johon organisaation toiminta pohjautuu. Ydintieto on tavallisesti organisaatiolle yhteistä tietoa, kuten esim. kustannuspaikkatiedot tai tuotetiedot, joita useat eri organisaation yksiköt hyödyntävät. Ydintiedon tarkka määritelmä riippuu organisaatiosta ja tarkastelunäkökulmasta. Ydintietoa ei ole organisaation tapahtumatieto (transaktiotieto), kuten esim. ostolaskudata.

Viitetieto

Eng. reference data

Viitetieto on usein ydintietoa luokittelevaa ja täydentävää tietoa. Siinä missä ydintieto kuvaa liiketoiminnaan tietokokonaisuuksia osa-alueittain (asiakas, tuote, tili, kustannuspaikka jne.), viitetiedot voivat palvella kaikkia näitä ydintiedon osa-alueita.

Esimerkkejä viitetiedosta ovat maakoodit, postikoodit, valuutat ja valuuttakoodit, toimialakoodit, aikamääreet ja muuntokertoimet (1m = 100cm). Viitetiedoissa olevaa maakoodia voidaan siis käyttää tuotemasterdatassa tuotteen tuotantomaana, sekä asiakasmasterdatassa asiakkaan kotimaana.

Asiakastieto

Eng. customer data

Organisaation ylläpitämää sen asiakkaita koskevaa tietoa. Asiakastietoa hyödynnetään usein esimerkiksi myynnin, markkinoinnin, toimituksen ja laskutuksen toimenpiteiden kohdentamiseen ja seuraamiseen.

Asiakastieto on yrityksen liiketoiminnan ydintietoa / master dataa.

Tuotetieto

Eng. product data

Organisaation (ja joissain tapauksissa myös toimittajien) ylläpitämää tuotteita koskevaa tietoa. Tuotetieto voi liittyä esimerkiksi yhden tai useamman tuotteen suunnitteluun, valmistukseen, varastointiin, myyntiin, markkinointiin, toimitukseen tai ylläpitoon, tai koostua useista tällaisista näkökulmista.


Tiedonhallinnan käsitteitä

Ydintiedon hallinta

Eng. master data management, MDM

Organisaation tai sen osan keskeisen yhteiskäyttöisen ydintiedon (master data) keskitettyä ja tarkoituksenmukaista käsittelyä ja hallintaa. Usein tavoitteena on kohteena olevan tiedon yhdenmukaistaminen sen eri käsittelijöiden välillä, mahdollistaen sen paremman käytettävyyden ja hyödynnettävyyden.

Asiakastiedon hallinta

Eng. customer information management

Organisaation asiakkaisiin liittyvän tiedon tarkoituksenmukaista käsittelyä ja hallintaa.

Asiakastietoa käsitellään usein tarkoitusta varten suunnitelluissa CRM-ohjelmistoissa sekä erillisissä asiakas-MDM:ssä, joissa käsiteltäviä asiakastietoja voivat olla esimerkiksi asiakkaan luokittelut (prospekti, asiakas, entinen asiakas, ym.), asiakkaan kontaktitiedot, sekä merkinnät asiakkaaseen kohdistuneista toimenpiteistä.

Tuotetiedon hallinta

Eng. product data management, PDM / product lifecycle management, PLM / product information management, PIM

Organisaation tuotteisiin liittyvän tiedon keskitettyä ja tarkoituksenmukaista käsittelyä ja hallintaa.

Osa tuotetiedosta on yrityksen liiketoiminnan ydintietoa / master dataa, ja muita tuotehallinnan osa-alueita voidaan hallita muissa niihin tarkoitetuissa järjestelmissä (PDM = product data management, PLM = product lifecycle management tai PIM = product information management). Kaksi ensimmäistä liittyy yleensä tuotteen suunnitteluun, valmistukseen ja kokoonpanoon – jälkimmäinen myyntiin, markkinointiin ja tuotetiedon jakeluun organisaation ulkopuolelle.

Sisällön hallinta

Eng. enterprise content management, ECM

Organisaation digitaalisten tietosisältöjen ja niihin liittyvien metatietojen, integraatioiden, elinkaaren ja vastaavien seikkojen, keskitettyä ja tarkoituksenmukaista hallintaa.

Tietosisältöjen elinkaareen voi kuulua esimerkiksi tiedon luominen, vastaanottaminen, käyttäminen, jakaminen, seuranta, siirtäminen, talteenotto ja säilyttäminen. Elinkaaren hallintaan sisältyy siihen liittyviä toimenpiteitä koskevan tiedon tallettaminen todennettavalla tavalla.

Dokumentinhallinta

Eng. document management

Dokumentinhallinnalla tarkoitetaan sitä, miten organisaatiossa säilytetään, hallinnoidaan ja jaetaan sähköisiä dokumentteja.

Asianhallinta

Eng. case management

Asianhallinta tarkoittaa organisaation toimintaprosesseihin sisältyvien asioiden ja niihin liittyvien asiakirjojen käsittelyn ohjaamista niiden koko elinkaaren ajan. Asianhallinta pyrkii tehostamaan asioiden valmistelua, käsittelyä, päätöksentekoa, julkaisemista, arkistointia ja hävittämistä sekä asiakirjallisten tietojen hallintaa.

Tiedonhallintamalli

Eng. information / data governance model

Kuvaus käytössä olevista tai suunnitelluista prosesseista, toimenpiteistä ja ohjeistuksista, sekä näihin liittyvistä rooleista ja vastuista, joiden avulla tietoa hallinnoidaan osana organisaation toimintaa.

Tietojen hallinnointi

Eng. data governance

Data governance on toimintatapa, joka varmistaa, että organisaatiossa tiedot ovat laadukkaita, luotettavia, turvallisia ja tehokkaasti hallittuja. Se kattaa säännöt, vastuut, prosessit ja tekniikat, jotka takaavat, että tieto on saavutettavaa ja liiketoiminnan tarpeita parhaalla mahdollisella tavalla palvelevaa. Data governance auttaa luomaan läpinäkyvyyttä tiedon käyttöön, varmistaa sen oikeellisuuden ja auttaa päätöksenteossa. Data governance on ennen kaikkea organistoitumista tiedon ympärille olemassa olevia organisaatiorakenteita hyödyntäen.

Data governancelle ei ole olemassa vakiintunutta selkeää suomenkielistä termiä.

Tietosuoja

Eng. data protection / privacy protection

Tietosuoja on perusoikeus, joka turvaa rekisteröidyn oikeuksien ja vapauksien toteutumisen henkilötietojen käsittelyssä. Tietosuojan tarkoituksena on osoittaa, milloin ja millä edellytyksillä henkilötietoja voidaan käsitellä.

Tietomigraatio

Eng. information / data migration

Tiedon tai tietojoukon siirto järjestelmästä toiseen siten, että tiedon keskeiset ominaisuudet (muun muassa autenttisuus, eheys, luotettavuus ja käytettävyys) säilyvät.

Datakatalogi

Eng. data catalog

Datakatalogin avulla helpotetaan tiedon hyödynnettävyyttä tarjoamalla kokonaiskuva organisaation tietoihin sekä mahdollistetaan oikean tiedon löytyminen esim. analytiikka- tai raportointitarpeisiin. Datakatalogi ylläpitää organisaation tietoja kartoittamalla tiedot, kuvaamalla tiedot metatietojen avulla sekä järjestämällä tiedot.

Data lineage

Eng. data lineage

Data lineage visualisoi datan alkuperää, kulkua ja muutoksia sen elinkaaren aikana eri tietojärjestelmissä. Se auttaa organisaatioita ymmärtämään mistä data tulee, miten se muuttuu ja miten sitä käytetään eri liiketoimintatarkoituksiin. Data lineage on tärkeä tietojohtamisen ja tiedonhallinnan työkalu, joka auttaa varmistamaan mm. datan laadun ja jäljitettävyyden.

Data lineagelle ei ole olemassa vakiintunutta selkeää suomenkielistä termiä.

Sanasto

Eng. glossary

Sanasto sisältää määritelmiä ja selityksiä liiketoimintaan olennaisesti liittyvistä termeistä ja käsitteistä. Sanasto auttaa määrittelemään ne selkeästi ja siten parantaa viestintää eri sidosryhmien välillä. Se varmistaa, että kaikki osapuolet ymmärtävät ja käyttävät käsitteitä samalla tavalla, vähentäen mahdollisia väärinkäsityksiä ja epäselvyyksiä.

Sanasto voidaan tehdä käsitteellisellä tai loogisella tasolla.


Tieto- ja prosessimallit

Käsitemalli

Eng. conceptual model

Käsitemalli kuvaa liiketoiminnalle tärkeät korkean tason tietokokonaisuudet tai tietoryhmät, sisältäen muun muassa käsitteet, sanastot ja termit liiketoiminnan ymmärtämällä tavalla kuvattuna​.

Looginen malli

Eng. logical model

Käsitteiden ja niiden muodostamien tietokokonaisuuksien tarkempi kuvaus, jossa myös tietoon liittyvät eri ominaisuudet näytetään attribuutti/tietokenttinä. Yksityiskohtaisempia tietoja teknologiasta riippumattomalla tavalla esitettynä​.

Fyysinen malli

Eng. physical model

Tietokantojen toteutus (skeema) tietokantojen tietorakenteista. Teknologiasta riippuvainen, voi olla sarakkeellinen, relaatiopohjainen tai mikä tahansa muu toteutus.

Tietomalli

Eng. information / data model

Organisaation tai sen osan käsittelemään tietoon liittyviä käsitteitä, rakenteita, vuorovaikutussuhteita (esimerkiksi relaatioita ja rajapintoja) sekä digitaalisia, fyysisiä ja/tai hallinnollisia sijainteja kuvaava kokonaisuus.

Prosessi

Eng. process

Sarja yhdessä määriteltyjä suoritettavia toimenpiteitä, jotka tähtäävät tiettyyn lopputulokseen.

Prosessikartoitus

Eng. process mapping

Prosessikartoitus tähtää organisaation tai sen osan ydin- ja tukiprosessien kuvaamiseen. Kartoittamalla ja kuvaamalla (mallintamalla) prosessit, tuodaan kartoituksen kohteen toimintatavat ja niihin liittyvä informaatio (informaatioprosessit) näkyviksi, usein prosessikuvauksen muodossa.

Prosessikuvaus

Eng. process description

Kuvallinen tai sanallinen havainnollistus prosessista. Prosessikartoituksen lopputulos tai osa siitä.


Synonyymi:
prosessimalli

Tietovirta

Eng. information / data flow

Prosessiin tai järjestelmien väliin kuuluva tiedonvaihto, joka voidaan toteuttaa esimerkiksi teknisellä integraatiolla tai manuaalisesti. Usein kuvataan otsikolla, entiteetillä tai vieläkin yksityiskohtaisemmin mitä tietoa siirretään, sekä mikä on tietovirran lähde sekä kohde.

Skeema

Eng. scheme

Metatietoelementtien välisten suhteiden kuvaus. Useimmiten skeemaan sisältyy määrittely metatiedon käytön ja hallinnan säännöistä, sekä elementtien semanttisesta merkityksestä, syntaksista ja pakollisuudesta.

Skeema voi olla esimerkiksi tilanne, jossa asiakastietojärjestelmään voidaan syöttää henkilön nimi, puhelinnumero, sähköpostiosoite, mutta niistä vain nimi on asetettu pakolliseksi tiedoksi henkilön lisäyksen yhteydessä.


Tieto- ja järjestelmäarkkitehtuurit

Kokonaisarkkitehtuuri

Eng. enterprise architecture, EA

Kuvaus organisaatioyksiköiden, ihmisten, kyvykkyyksien, toimintaprosessien ja niiden käyttämän tiedon, sekä tietojärjestelmien keskinäisistä suhteista ja toiminnasta kokonaisuutena.

Kokonais-/yritysarkkitehtuuri on tapa kehittää organisaation toimintaa kokonaisuutena. Se yhdistää strategian ja liiketoimintatavoitteet IT-ympäristön kehittämiseen.

 

Synonyymi: yritysarkkitehtuuri

Tietoarkkitehtuuri

Eng. information / data architecture

Kuvaus organisaation tai sen osan käyttämän tiedon koostamisesta, organisoinnista, luokittelusta ja välittämisestä.

Tietoarkkitehtuuri tarkastelee organisaation tietotarpeita, tietopääomaa, tietojen välisiä suhteita, tiedon arvoketjuja, tiedon rakenteita, sekä tiedon organisointia ja hallintaa. Tietoarkkitehtuurin tavoitteena on usein luoda yhteinen näkemys tarkastelukohteen keskeisestä tietopääomasta ja sen käyttäytymisestä, ja näin helpottaa tiedon löytämistä, välittämistä ja hallintaa.

Tietoarkkitehtuurissa pääosassa on nimenomaan tieto. Tietoarkkitehtuuri voi kuvata esimerkiksi sitä, missä tiedot organisaation sopimuksista, asiakkaista, laskutuksesta tai vaikkapa varaston kappalemääristä sijaitsevat.

Järjestelmäarkkitehtuuri

Eng. system architecture

Kuvaus organisaation tai sen osan käyttämän tiedon käsittelyprosesseissa tarvittavista tietojärjestelmistä.

Käytännössä siis teknisen tason kuvaus siitä, miten yrityksen tietojärjestelmät toimivat. Järjestelmäarkkitehtuuri voi olla esimerkiksi prosessikuvaus siitä, miten tieto liikkuu vaikkapa CRM-, taloushallinto-, ja raportointijärjestelmien välillä.


Tiedon ominaisuuksia ja kuvauksia

Entiteetti

Eng. entity

Yhdestä tai useammasta osasta syntyvä, yhteenkuuluva itsenäinen tietojoukko. Kokonaisuus, joka voidaan hahmottaa ja jolla on ominaisuuksia sekä vuorovaikutussuhteita. Esimerkkejä mahdollisista entiteeteistä ovat esim. asiakas, tilaus tai organisaatioyksikkö.

Entiteettejä hyödynnetään usein käsitemallinnuksessa kuvaamaan kokonaisuuksia ja näiden välisiä suhteita/relaatioita.

 

Synonyymi: tietoentiteetti, tietojoukko

Tiedon elinkaari

Eng. information lifecycle

Tiedon elinkaari alkaa sen luomisesta käsittelyn käynnistyessä ja päättyy tiedon pysyvään säilyttämiseen tai hävittämiseen. Tiedon elinkaareen voi kuulua useita vaiheita, kuten tiedon luominen, muokkaaminen, käsittely, jakaminen, rajoittaminen, arkistointi ja poistaminen.

Laatu

Eng. quality

Laadukas tieto on oikeaa, autenttista ja jäljitettävissä. Tiedon laadun voidaan katsoa koostuvan erilaisista ominaisuuksista (dimensiot), joita voivat olla muun muassa saatavuus, jäljitettävyys, eheys, käytettävyys ja oikea-aikaisuus.

Saatavuus

Eng. availability

Tiedon tulee olla saatavilla sille asetettujen käyttöoikeuksien ja/tai käytön rajoitusten mukaisesti. Saatavuuteen liittyy myös ajallinen ja laadullinen näkökulma, jolloin tiedon tulee olla saatavilla tiettyyn aikaan ja tietyssä muodossa.

Esimerkiksi vanhentunut tai lukukelvoton tieto, vaikkakin sinänsä saatavilla oleva, voi olla käyttötarpeeseensa nähden hyödytöntä.

Jäljitettävyys

Eng. traceability

Jäljitettävyys tarkoittaa sitä, että tietoon kohdistuneet tapahtumat läpi sen elinkaaren ovat luotettavasti selvitettävissä ja todennettavissa. Jäljitettävyys luo perustan myös tiedon eheyden varmistamiselle.

Jäljitettävyyteen ja eheyteen voidaan katsoa kuuluvaksi myös sen erottaminen, ovatko tietoon kohdistuneet muutokset ihmisen toiminnan vai automatiikan seurausta.

Eheys

Eng. integrity

Eheys tarkoittaa tiedon todistettavaa muuttumattomuutta, tai siihen kohdistuvien muutosten tapahtumista vain ennalta määrätyissä puitteissa. Eheyteen voidaan katsoa kuuluvaksi tiedon (tai tietojärjestelmän) aitous, väärentämättömyys, sisäinen ristiriidattomuus, kattavuus, ajantasaisuus, oikeellisuus ja käyttökelpoisuus sekä se, että näihin kohdistuneet muutokset ovat tapahtuneet voimassaolevien käyttövaltuuksien puitteissa.

Eheydestä voidaan puhua joko teknisessä tai semanttisessa kontekstissa. Tekninen eheys viittaa tiedon tekniseen, absoluuttiseen, sisältöön. Semanttinen eheys taas viittaa tiedon merkitykseen, ymmärrykseen tiedosta osana laajempaa kontekstia. Esimerkki tiedon eheyteen liittyvästä ongelmasta voi olla vaikka tilanne, jossa asiakastietojärjestelmään on kirjattu yrityksen nimi, mutta ei y-tunnusta. Tämä puutos aiheuttaa ongelman tilanteessa, jossa laskutusosasto yrittää muodostaa laskua johon y-tunnusta vaaditaan. Vastaavassa tilanteessa ongelmia seuraa myös, mikäli asiakkaan osoitetieto osoittautuu vanhentuneeksi tai vääräksi, jolloin lasku lähetetään väärään osoitteeseen ja sen maksu viivästyy tai estyy kokonaan.

Käytettävyys

Eng. usability

Tiedon käytettävyys viittaa tiedonsaannin helppouteen. Tämä riippuu siitä, miten tieto on löydettävissä, saatavissa esille, esitettävissä ja tulkittavissa. Käytettävyys liittyy läheisesti tiedon saatavuuteen, mutta tämän lisäksi siihen vaikuttavat myös muun muassa tiedon tunnistettavuus ja löydettävyys.

Tiedon käytettävyyttä perinteisesti heikentävä ongelma on niin kutsuttu siiloutuminen. Haluttu/tarvittu tieto voi olla olemassa, mutta se on piilotettuna osaston tai järjestelmän muodostamaan ”siiloon”, johon ulkopuolisilla tahoilla ei syystä tai toisesta ole pääsyä tai näkyvyyttä.

Oikea-aikaisuus

Eng. timeliness

Tiedon oikea-aikaisuus viittaa toisaalta sen ajantasaisuuteen, toisaalta sen saatavilla olemiseen ja käytettävyyteen tietyn aikaraamin puitteissa. Lisäksi oikea-aikaisuus liittyy näiden osatekijöiden suhteeseen: oikeaan aikaan saatavilla olevan tiedon tulee olla myös ajantasaisuudeltaan relevanttia suhteessa tarpeeseen.

Tiedon oikea-aikaisuus on tärkeää etenkin, mikäli tietoa halutaan käyttää tiedolla johtamiseen. Jos vaikkapa talousraportin valmistuminen kestää useita kuukausia, on sen julkaisuhetkellä sisältämän tiedon oikea-aikaisuus heikolla tasolla suhteutettuna sen pohjalta mahdollisesti nousevaan liiketoiminnan muutostarpeeseen.


Teknologioita ja menetelmiä

Tilasto

Eng. statistic

Kokoelma tyypillisesti jotakin asiaa, ilmiötä tai prosessia kuvaavaa jalostettua tietoa.

Tilasto voi olla sidottu yksittäiseen ajankohtaan, sisältää tarkastelun kohteen historiaa ja/tai kehittymistä kuvaavaa tietoa. Sisältäessään historiatietoa tilasto voi myös pyrkiä joko suoraan tai epäsuorasti indikoiden antamaan ennusteen tarkastelun kohteen arvioidusta kehityksestä. Tilasto voi olla esimerkiksi listaus yrityksen kuukauden myyntitapahtumista tai vaikka jalkapallopelien tuloksista.

Analytiikka

Eng. analytics

Analytiikkaa voidaan kuvata kokoelmaksi menetelmiä ja työskentelytapoja, joiden tavoitteena on jalostaa ja muodostaa kerätystä tiedosta kattavampaa informaatiota ja malleja.

Mallien tavoitteena voi olla joko menneiden tapahtumien syy-seuraus-suhteiden ymmärtäminen, tulevien tapahtumien ennakoiminen tai molemmat samanaikaisesti.

Business intelligence

Eng. business intelligence, BI

Business Intelligence tuottaa historiaan perustuvia, nykyisiä ja ennustavia näkemyksiä liiketoiminnasta. Näitä näkemyksiä voidaan käyttää liiketoiminnan päätöksenteon tukena. Järjestelmällisesti toteutettuna tämä toiminta pyrkii tarjoamaan analyyttisen tavan kuvata ja tutkia yrityksen vahvuuksia ja heikkouksia.

Business Intelligence -ominaisuuksia sisältävät, tai tarkoitusta varten luodut, ohjelmistot voivat tarjota erilaisia tapoja opiskella, havainnollistaa ja visualisoida suuria tietomääriä erilaisista lähteistä päätöksenteon tueksi.

Robotiikka

Eng. robotics

Puhtaasti digitaalisessa kontekstissa robotiikka viittaa ohjelmistoihin tai ohjelmiston määrityksiin (skripti), jotka tekevät automaattisesti tiettyjä ennalta määrättyjä tehtäviä. Tunnetaan myös lyhenteellä RPA (robotic process automation).

Tällaisia tehtäviä voivat yksinkertaisimmillaan olla esimerkiksi samankaltaisina toistuvien toimintojen automatisointi, tietomassojen läpikäynti, tiedon jalostaminen sekä tietoa koskevien mallien luominen. Esimerkkejä monimutkaisemmista ohjelmistorobotiikan sovellutuksista ovat muun muassa osakkeiden robottikauppa tai internetin sekä erilaisten tietokantojen hakurobotit.

 

Synonyymi: ohjelmistorobotiikka

Tekoäly

Eng. artificial intelligence, AI

Tekoäly (tai keinoäly) on tietokone tai tietokoneohjelma, joka kykenee tekemään älykkäinä pidettäviä toimintoja. Tekoälyn tarkempi määrittely on avoin, koska älykkyyttä itsessään on vaikea määritellä ja tekoälyn merkitys on vaihdellut 1950-luvulta tähän päivään.

Myös rajanveto tilastollisen analyysin, robotiikan ja keinoälyn välillä on tästä syystä ajoittain haasteellinen. Erottavana tekijänä näiden välillä käytetään monesti tekoälyn kykyä ajatella ja oppia, siinä missä ohjelmistorobotti luottaa puhtaasti sille ennalta määriteltyihin malleihin ja toimintatapoihin. Tekoälyn alaluokkina on mm. luova tekoäly (generative AI/GenAI) ja koneoppiminen. Ensin mainittu pohjautuu tekoälymalleille, joita on opetettu luomaan tekstiä, kuvaa, ääntä tai näiden yhdistelmiä opetetun aineiston perusteella. Luova tekoäly ei siis itse luo mitään uniikkia, vaan se hyödyntää ja yhdistelee olemassa olevaa dataa.

Luova tekoäly

Eng. generative AI, GenAI

Luova tekoäly tarkoittaa sitä, että tekoälymalli pystyy luomaan jotain teksti- tai kuvamuotoista vastinetta ihmisten antamille komennoille (prompt). Termi on synnyttänyt keskustelua luovuuden merkityksestä, koska tekoälyn kieli- ja kuvamallit on opetettu laajoilla olemassa olevilla tietomassoilla, joita mallit hyödyntävät vastauksissaan. Esimerkiksi jos pyytää kuvaa järvimaisemasta, kuvamalli ei tiedä mitään järvenrantaa, josta kuvaa alkaisi tekemään. Sen sijaan se tunnistaa termeillä laajasta opetusaineistostaan kuvia, jotka edustavat järvimaisemaa ja tarkentaa sitä käyttäjän komentojen mukaan. Eli absoluuttisesti uuden luomisen sijaan, se yhdistelee olemassa olevaa.

Kielimallit

Eng. language models

Laajoja kielimalleja käytetään luovassa tekoälyssä kielen ymmärtämiseen ja tuottamiseen. Nämä kyvyt on saatu aikaan opettamalla malleja laajoilla tekstiaineistoilla. Kielimallista riippuen opetus on yleensä vahvistettua tai ohjaamatonta oppimista. Vuonna 2023 laajalle yleisölle tunnetuimmat kielimallit ovat OpenAI:n GPT-mallit (keskustelumuotoinen ChatGPT), PalM (Google & Bard) sekä Llama (Meta). Kielimallien ja käyttöliittymien avulla ChatGPT:n kaltaisilla palveluilla kuka tahansa voi keskustella tekoälyn kanssa ja pyytää siltä esim. kielikäännöksiä, tiivistelmiä, poikkeavuuksien havainnointia, kielenhuoltotarkistuksia tai vastauksia erinäisiin kysymyksiin.

Kielimalleista keskustellessa törmätään usein aiheisiin eettisyydestä, luotettavuudesta sekä opetusaineiston tarkoituksenmukaisuudesta.

Koneoppiminen

Eng. machine learning

Koneoppiminen tarkoittaa, että tarkkojen sääntöjen sijasta tietokoneelle tai ohjelmalle annetaan kyky ja resurssit oppia esimerkeistä. Suuri osa tekoälyä hyödyntävistä sovelluksista perustuu koneoppimiseen.

Koneoppimista on kolmenlaista; ohjattua, ohjaamatonta ja vahvistettua oppimista.

Tietovarastot

Eng. data storage, data warehouse, data lake

Tietovarastoksi kutsutaan tietokantaa tai useimmiten tietokantojen kokoelmaa, johon on tallennettu organisaatiota tai sen osaa koskevaa tietoa.

Englanninkieliset termit Data Storage ja Data Warehouse viittaavat pääsääntöisesti jäsenneltyä, tiettyä tarkoitusta varten kerättyä tietoa, sisältäviin varastoihin.
Data Lake useimmiten viittaa varastoon, johon tietoa kerätään tietämättä välttämättä sen lopullista käyttötarkoitusta. Eri paikoista tuodaan mahdollisimman paljon tietoa saataville samaan paikkaan (Data Lake), josta sitä sitten lähdetään poimimaan ja jalostamaan erilaisiin tarpeisiin.

Data Lakessa tiedon jäsentely ja rakenne voivat vaihdella. Data Laken ylläpitäminen tähtää usein koneoppimisen ja/tai tekoälyn kehittämiseen tai hyödyntämiseen.

ETL/ELT

Eng. ETL/ELT

ETL terminä viittaa kokonaisuuteen, johon liittyy tiedon siirtäminen, muokkaaminen ja lataaminen. Tieto siis haetaan lähdejärjestelmästä, sitä muokataan tarpeen mukaan, ja se ladataan (siirretään) edelleen tietovarastoon. ETL-prosessi voi esimerkiksi lukea tuntikirjaus-Excelin yrityksen verkkolevyltä (extract), muuntaa sen sisältämät tiedot tekstimuotoon (transform), ja tämän jälkeen syöttää ne palkanlaskentajärjestelmään (load).

ELT-prosessit (extract, load, transform) ovat yleistyneet pilvipalveluiden myötä ja niissä data tuodaan ensin kohdejärjestelmään ja muokataan vasta sen jälkeen.

DataOps / DevOps

Eng. DataOps / DevOps

DataOps ja DevOps on jatkuvan kehittämisen hallintamalli sähköisten palveluiden tuotantoon. DataOps ja DevOps pyrkivät automatisoimaan kehitykseen, testaamiseen ja ylläpitoon liittyvät IT-palvelutoiminnot. Osa-alueita: ketterät projektimenetelmät, tehtävänhallinta, versionhallinta, testausprosessit ja automaatio.


Yhteenveto lyhenteistä

MDM

Master Data Management, ks. Ydintiedon hallinta

CRM

Customer Relationship Management, ks. Asiakastiedon hallinta

PDM / PLM / PIM

Product Data Management, Product Lifecycle Management, Product Information Management, ks. Tuotetiedon hallinta

ECM

Enterprise Content Management, ks. Sisällönhallinta

BI

Business Intelligence, ks. Business Intelligence

AI

Artificial Intelligence, ks. Tekoäly

ML

Machine Learning, ks. Koneoppiminen


Lisätietoa

Lisää määritelmiä tiedonhallintaan ja dataan liittyen löydät muun muassa seuraavista paikoista:

Sanastokeskus, tietotekniikan termitalkoot

Sanastokeskus, TEPA-termipankki

Ari Hovi Oy:n blogi 

Ite wiki, digitalisoinnin opas

Finto, Tietotermit-sanasto