Spartan tiedonhallinnan sanasto
Tavoitteenamme on luoda ymmärrystä.
Tämä sanasto on tarkoitettu niin tiedonhallinnan ammattilaisille, liiketoiminnan päättäjille, kuin kaikille muille aiheen parissa työskenteleville. Sanaston tarkoituksena on auttaa luomaan yhteinen ymmärrys eri toimijoiden välille. Yhteinen ymmärrys on ensiaskel kehityksen toteuttamiseksi yhtenä rintamana.
Jos haluat nähdä miten nämä asiat toteutuvat käytännössä, lue lisää palveluistamme tai katso asiakastarinamme.
Perustermit
Data
Tieto
Tiedonhallinta
Digitalisaatio
Erilaisia tietotyyppejä
Metatieto
Ydintieto
Viitetieto
Asiakastieto
Tuotetieto
Tiedonhallinnan käsitteitä
Ydintiedon hallinta
Asiakastiedon hallinta
Tuotetiedon hallinta
Sisällönhallinta
Dokumentinhallinta
Asianhallinta
Tiedonhallintamalli
Tietojen hallinnointi
Tietosuoja
Tietomigraatio
Datakatalogi
Data lineage
Sanasto
Tieto- ja prosessimallit
Käsitemalli
Looginen malli
Fyysinen malli
Tietomalli
Prosessi
Prosessikartoitus
Prosessikuvaus
Tietovirta
Skeema
Tieto- ja järjestelmä-
arkkitehtuurit
Kokonaisarkkitehtuuri
Tietoarkkitehtuuri
Järjestelmäarkkitehtuuri
Tiedon ominaisuuksia ja kuvauksia
Entiteetti
Tiedon elinkaari
Laatu
Saatavuus
Jäljitettävyys
Eheys
Käytettävyys
Oikea-aikaisuus
Teknologioita ja menetelmiä
Tilasto
Analytiikka
Business Intelligence
Robotiikka
Tekoäly
Luova tekoäly
Kielimallit
Koneoppiminen
Tietovarastot
ETL/ELT
DataOps / DevOps
Ehdota uutta termiä
Perustermit
Data
Eng. data
Data on tiedon esitysmuoto, joka voi esiintyä esim. erilaisina tietovirtoina järjestelmissä. Tämä tieto voi olla numeerista, symbolipohjaista, dokumentteja tai asiakirjoja, ja se voi liikkua erilaisten sähköisten järjestelmien välillä.
Data voi sisältää esimerkiksi tiedostoja, jotka ovat tallennettuna työasemille ja verkkolevyille, sekä tietoa erilaisissa järjestelmissä ja niiden välillä tapahtuvia tietovirtoja. Yleisesti ottaen kaikki organisaation sähköisissä järjestelmissä oleva tai liikkuva tieto voidaan määritellä dataksi.
Tieto
Eng. information
Tieto on informaatiota tai dataa (ks. määritelmä ”Data”), joka on esitetty ihmisen ymmärtämässä muodossa ja tarkoitettu kommunikointiin. Se sisältää kontekstin, joka mahdollistaa sen merkityksen ymmärtämisen ja hyödyntämisen.
Tiedonhallinta
Eng. information management
Tiedonhallinta luo edellytykset hyödyntää dataa osana organisaation toimintaa. Se on määrätietoista toimintaa, jossa tietoa hallitaan organisaation aineettomana pääomana. Lähtökohtana on usein digitalisaation edesauttaminen tai mahdollistaminen.
Digitalisaatio
Eng. digitalization
Termillä viitataan yleisesti digitaalisten teknologioiden yleistymiseen työ- ja arkielämässä, sekä näiden teknologioiden vaikutuksiin päivittäisisissä toimintatavoissa ja toiminnan mahdollisuuksissa.
Digitalisaatioon voidaan liittää muun muassa seuraavat ilmiöt:
- Sähköinen ja/tai automaattinen tiedonvälitys
- Sähköiset, digitaaliset järjestelmät
- Eri toimijoiden tarjoamat digitaaliset asiointimahdollisuudet
- Esineiden internet
- Digitaalisen ja fyysisen maailman keskinäinen vuorovaikutus
Erilaisia tietotyyppejä
Metatieto
Eng. metadata
Tietoa, joka kuvaa tiedon sisältöä, rakennetta, kontekstia tai muuta tietoon liittyvää ominaisuutta.
Metadata on rakenteista tietoa, joka mahdollistaa muun muassa tiedon laadinnan, rekisteröinnin, luokittelun, käyttöön saamisen, siirtämisen, jakamisen, tietojärjestelmien välisen tiedon liikutettavuuden, säilyttämisen ja hävittämisen. Esimerkkejä metadatasta ovat tiedot tiedoston luontiajankohdasta, sijainnista ja muutoshistoriasta.
Ydintieto
Eng. master data
Ydintieto / master data on muuttumatonta tai harvakseltaan muuttuvaa perustietoa, johon organisaation toiminta pohjautuu. Ydintieto on tavallisesti organisaatiolle yhteistä tietoa, kuten esim. kustannuspaikkatiedot tai tuotetiedot, joita useat eri organisaation yksiköt hyödyntävät. Ydintiedon tarkka määritelmä riippuu organisaatiosta ja tarkastelunäkökulmasta. Ydintietoa ei ole organisaation tapahtumatieto (transaktiotieto), kuten esim. ostolaskudata.
Viitetieto
Eng. reference data
Viitetieto on usein ydintietoa luokittelevaa ja täydentävää tietoa. Siinä missä ydintieto kuvaa liiketoiminnaan tietokokonaisuuksia osa-alueittain (asiakas, tuote, tili, kustannuspaikka jne.), viitetiedot voivat palvella kaikkia näitä ydintiedon osa-alueita.
Esimerkkejä viitetiedosta ovat maakoodit, postikoodit, valuutat ja valuuttakoodit, toimialakoodit, aikamääreet ja muuntokertoimet (1m = 100cm). Viitetiedoissa olevaa maakoodia voidaan siis käyttää tuotemasterdatassa tuotteen tuotantomaana, sekä asiakasmasterdatassa asiakkaan kotimaana.
Asiakastieto
Eng. customer data
Organisaation ylläpitämää sen asiakkaita koskevaa tietoa. Asiakastietoa hyödynnetään usein esimerkiksi myynnin, markkinoinnin, toimituksen ja laskutuksen toimenpiteiden kohdentamiseen ja seuraamiseen.
Asiakastieto on yrityksen liiketoiminnan ydintietoa / master dataa.
Tuotetieto
Eng. product data
Organisaation (ja joissain tapauksissa myös toimittajien) ylläpitämää tuotteita koskevaa tietoa. Tuotetieto voi liittyä esimerkiksi yhden tai useamman tuotteen suunnitteluun, valmistukseen, varastointiin, myyntiin, markkinointiin, toimitukseen tai ylläpitoon, tai koostua useista tällaisista näkökulmista.
Tiedonhallinnan käsitteitä
Ydintiedon hallinta
Eng. master data management, MDM
Organisaation tai sen osan keskeisen yhteiskäyttöisen ydintiedon (master data) keskitettyä ja tarkoituksenmukaista käsittelyä ja hallintaa. Usein tavoitteena on kohteena olevan tiedon yhdenmukaistaminen sen eri käsittelijöiden välillä, mahdollistaen sen paremman käytettävyyden ja hyödynnettävyyden.
Asiakastiedon hallinta
Eng. customer information management
Organisaation asiakkaisiin liittyvän tiedon tarkoituksenmukaista käsittelyä ja hallintaa.
Asiakastietoa käsitellään usein tarkoitusta varten suunnitelluissa CRM-ohjelmistoissa sekä erillisissä asiakas-MDM:ssä, joissa käsiteltäviä asiakastietoja voivat olla esimerkiksi asiakkaan luokittelut (prospekti, asiakas, entinen asiakas, ym.), asiakkaan kontaktitiedot, sekä merkinnät asiakkaaseen kohdistuneista toimenpiteistä.
Tuotetiedon hallinta
Eng. product data management, PDM / product lifecycle management, PLM / product information management, PIM
Organisaation tuotteisiin liittyvän tiedon keskitettyä ja tarkoituksenmukaista käsittelyä ja hallintaa.
Osa tuotetiedosta on yrityksen liiketoiminnan ydintietoa / master dataa, ja muita tuotehallinnan osa-alueita voidaan hallita muissa niihin tarkoitetuissa järjestelmissä (PDM = product data management, PLM = product lifecycle management tai PIM = product information management). Kaksi ensimmäistä liittyy yleensä tuotteen suunnitteluun, valmistukseen ja kokoonpanoon – jälkimmäinen myyntiin, markkinointiin ja tuotetiedon jakeluun organisaation ulkopuolelle.
Sisällön hallinta
Eng. enterprise content management, ECM
Organisaation digitaalisten tietosisältöjen ja niihin liittyvien metatietojen, integraatioiden, elinkaaren ja vastaavien seikkojen, keskitettyä ja tarkoituksenmukaista hallintaa.
Tietosisältöjen elinkaareen voi kuulua esimerkiksi tiedon luominen, vastaanottaminen, käyttäminen, jakaminen, seuranta, siirtäminen, talteenotto ja säilyttäminen. Elinkaaren hallintaan sisältyy siihen liittyviä toimenpiteitä koskevan tiedon tallettaminen todennettavalla tavalla.
Dokumentinhallinta
Eng. document management
Dokumentinhallinnalla tarkoitetaan sitä, miten organisaatiossa säilytetään, hallinnoidaan ja jaetaan sähköisiä dokumentteja.
Asianhallinta
Eng. case management
Asianhallinta tarkoittaa organisaation toimintaprosesseihin sisältyvien asioiden ja niihin liittyvien asiakirjojen käsittelyn ohjaamista niiden koko elinkaaren ajan. Asianhallinta pyrkii tehostamaan asioiden valmistelua, käsittelyä, päätöksentekoa, julkaisemista, arkistointia ja hävittämistä sekä asiakirjallisten tietojen hallintaa.
Tiedonhallintamalli
Eng. information / data governance model
Kuvaus käytössä olevista tai suunnitelluista prosesseista, toimenpiteistä ja ohjeistuksista, sekä näihin liittyvistä rooleista ja vastuista, joiden avulla tietoa hallinnoidaan osana organisaation toimintaa.
Tietojen hallinnointi
Eng. data governance
Data governance on toimintatapa, joka varmistaa, että organisaatiossa tiedot ovat laadukkaita, luotettavia, turvallisia ja tehokkaasti hallittuja. Se kattaa säännöt, vastuut, prosessit ja tekniikat, jotka takaavat, että tieto on saavutettavaa ja liiketoiminnan tarpeita parhaalla mahdollisella tavalla palvelevaa. Data governance auttaa luomaan läpinäkyvyyttä tiedon käyttöön, varmistaa sen oikeellisuuden ja auttaa päätöksenteossa. Data governance on ennen kaikkea organistoitumista tiedon ympärille olemassa olevia organisaatiorakenteita hyödyntäen.
Data governancelle ei ole olemassa vakiintunutta selkeää suomenkielistä termiä.
Tietosuoja
Eng. data protection / privacy protection
Tietosuoja on perusoikeus, joka turvaa rekisteröidyn oikeuksien ja vapauksien toteutumisen henkilötietojen käsittelyssä. Tietosuojan tarkoituksena on osoittaa, milloin ja millä edellytyksillä henkilötietoja voidaan käsitellä.
Tietomigraatio
Eng. information / data migration
Tiedon tai tietojoukon siirto järjestelmästä toiseen siten, että tiedon keskeiset ominaisuudet (muun muassa autenttisuus, eheys, luotettavuus ja käytettävyys) säilyvät.
Datakatalogi
Eng. data catalog
Datakatalogin avulla helpotetaan tiedon hyödynnettävyyttä tarjoamalla kokonaiskuva organisaation tietoihin sekä mahdollistetaan oikean tiedon löytyminen esim. analytiikka- tai raportointitarpeisiin. Datakatalogi ylläpitää organisaation tietoja kartoittamalla tiedot, kuvaamalla tiedot metatietojen avulla sekä järjestämällä tiedot.
Data lineage
Eng. data lineage
Data lineage visualisoi datan alkuperää, kulkua ja muutoksia sen elinkaaren aikana eri tietojärjestelmissä. Se auttaa organisaatioita ymmärtämään mistä data tulee, miten se muuttuu ja miten sitä käytetään eri liiketoimintatarkoituksiin. Data lineage on tärkeä tietojohtamisen ja tiedonhallinnan työkalu, joka auttaa varmistamaan mm. datan laadun ja jäljitettävyyden.
Data lineagelle ei ole olemassa vakiintunutta selkeää suomenkielistä termiä.
Sanasto
Eng. glossary
Sanasto sisältää määritelmiä ja selityksiä liiketoimintaan olennaisesti liittyvistä termeistä ja käsitteistä. Sanasto auttaa määrittelemään ne selkeästi ja siten parantaa viestintää eri sidosryhmien välillä. Se varmistaa, että kaikki osapuolet ymmärtävät ja käyttävät käsitteitä samalla tavalla, vähentäen mahdollisia väärinkäsityksiä ja epäselvyyksiä.
Sanasto voidaan tehdä käsitteellisellä tai loogisella tasolla.
Tieto- ja prosessimallit
Käsitemalli
Eng. conceptual model
Käsitemalli kuvaa liiketoiminnalle tärkeät korkean tason tietokokonaisuudet tai tietoryhmät, sisältäen muun muassa käsitteet, sanastot ja termit liiketoiminnan ymmärtämällä tavalla kuvattuna.
Looginen malli
Eng. logical model
Käsitteiden ja niiden muodostamien tietokokonaisuuksien tarkempi kuvaus, jossa myös tietoon liittyvät eri ominaisuudet näytetään attribuutti/tietokenttinä. Yksityiskohtaisempia tietoja teknologiasta riippumattomalla tavalla esitettynä.
Fyysinen malli
Eng. physical model
Tietokantojen toteutus (skeema) tietokantojen tietorakenteista. Teknologiasta riippuvainen, voi olla sarakkeellinen, relaatiopohjainen tai mikä tahansa muu toteutus.
Tietomalli
Eng. information / data model
Organisaation tai sen osan käsittelemään tietoon liittyviä käsitteitä, rakenteita, vuorovaikutussuhteita (esimerkiksi relaatioita ja rajapintoja) sekä digitaalisia, fyysisiä ja/tai hallinnollisia sijainteja kuvaava kokonaisuus.
Prosessi
Eng. process
Sarja yhdessä määriteltyjä suoritettavia toimenpiteitä, jotka tähtäävät tiettyyn lopputulokseen.
Prosessikartoitus
Eng. process mapping
Prosessikartoitus tähtää organisaation tai sen osan ydin- ja tukiprosessien kuvaamiseen. Kartoittamalla ja kuvaamalla (mallintamalla) prosessit, tuodaan kartoituksen kohteen toimintatavat ja niihin liittyvä informaatio (informaatioprosessit) näkyviksi, usein prosessikuvauksen muodossa.
Prosessikuvaus
Eng. process description
Kuvallinen tai sanallinen havainnollistus prosessista. Prosessikartoituksen lopputulos tai osa siitä.
Synonyymi: prosessimalli
Tietovirta
Eng. information / data flow
Prosessiin tai järjestelmien väliin kuuluva tiedonvaihto, joka voidaan toteuttaa esimerkiksi teknisellä integraatiolla tai manuaalisesti. Usein kuvataan otsikolla, entiteetillä tai vieläkin yksityiskohtaisemmin mitä tietoa siirretään, sekä mikä on tietovirran lähde sekä kohde.
Skeema
Eng. scheme
Metatietoelementtien välisten suhteiden kuvaus. Useimmiten skeemaan sisältyy määrittely metatiedon käytön ja hallinnan säännöistä, sekä elementtien semanttisesta merkityksestä, syntaksista ja pakollisuudesta.
Skeema voi olla esimerkiksi tilanne, jossa asiakastietojärjestelmään voidaan syöttää henkilön nimi, puhelinnumero, sähköpostiosoite, mutta niistä vain nimi on asetettu pakolliseksi tiedoksi henkilön lisäyksen yhteydessä.
Tieto- ja järjestelmäarkkitehtuurit
Kokonaisarkkitehtuuri
Eng. enterprise architecture, EA
Kuvaus organisaatioyksiköiden, ihmisten, kyvykkyyksien, toimintaprosessien ja niiden käyttämän tiedon, sekä tietojärjestelmien keskinäisistä suhteista ja toiminnasta kokonaisuutena.
Kokonais-/yritysarkkitehtuuri on tapa kehittää organisaation toimintaa kokonaisuutena. Se yhdistää strategian ja liiketoimintatavoitteet IT-ympäristön kehittämiseen.
Synonyymi: yritysarkkitehtuuri
Tietoarkkitehtuuri
Eng. information / data architecture
Kuvaus organisaation tai sen osan käyttämän tiedon koostamisesta, organisoinnista, luokittelusta ja välittämisestä.
Tietoarkkitehtuuri tarkastelee organisaation tietotarpeita, tietopääomaa, tietojen välisiä suhteita, tiedon arvoketjuja, tiedon rakenteita, sekä tiedon organisointia ja hallintaa. Tietoarkkitehtuurin tavoitteena on usein luoda yhteinen näkemys tarkastelukohteen keskeisestä tietopääomasta ja sen käyttäytymisestä, ja näin helpottaa tiedon löytämistä, välittämistä ja hallintaa.
Tietoarkkitehtuurissa pääosassa on nimenomaan tieto. Tietoarkkitehtuuri voi kuvata esimerkiksi sitä, missä tiedot organisaation sopimuksista, asiakkaista, laskutuksesta tai vaikkapa varaston kappalemääristä sijaitsevat.
Järjestelmäarkkitehtuuri
Eng. system architecture
Kuvaus organisaation tai sen osan käyttämän tiedon käsittelyprosesseissa tarvittavista tietojärjestelmistä.
Käytännössä siis teknisen tason kuvaus siitä, miten yrityksen tietojärjestelmät toimivat. Järjestelmäarkkitehtuuri voi olla esimerkiksi prosessikuvaus siitä, miten tieto liikkuu vaikkapa CRM-, taloushallinto-, ja raportointijärjestelmien välillä.
Tiedon ominaisuuksia ja kuvauksia
Entiteetti
Eng. entity
Yhdestä tai useammasta osasta syntyvä, yhteenkuuluva itsenäinen tietojoukko. Kokonaisuus, joka voidaan hahmottaa ja jolla on ominaisuuksia sekä vuorovaikutussuhteita. Esimerkkejä mahdollisista entiteeteistä ovat esim. asiakas, tilaus tai organisaatioyksikkö.
Entiteettejä hyödynnetään usein käsitemallinnuksessa kuvaamaan kokonaisuuksia ja näiden välisiä suhteita/relaatioita.
Synonyymi: tietoentiteetti, tietojoukko
Tiedon elinkaari
Eng. information lifecycle
Tiedon elinkaari alkaa sen luomisesta käsittelyn käynnistyessä ja päättyy tiedon pysyvään säilyttämiseen tai hävittämiseen. Tiedon elinkaareen voi kuulua useita vaiheita, kuten tiedon luominen, muokkaaminen, käsittely, jakaminen, rajoittaminen, arkistointi ja poistaminen.
Laatu
Eng. quality
Laadukas tieto on oikeaa, autenttista ja jäljitettävissä. Tiedon laadun voidaan katsoa koostuvan erilaisista ominaisuuksista (dimensiot), joita voivat olla muun muassa saatavuus, jäljitettävyys, eheys, käytettävyys ja oikea-aikaisuus.
Saatavuus
Eng. availability
Tiedon tulee olla saatavilla sille asetettujen käyttöoikeuksien ja/tai käytön rajoitusten mukaisesti. Saatavuuteen liittyy myös ajallinen ja laadullinen näkökulma, jolloin tiedon tulee olla saatavilla tiettyyn aikaan ja tietyssä muodossa.
Esimerkiksi vanhentunut tai lukukelvoton tieto, vaikkakin sinänsä saatavilla oleva, voi olla käyttötarpeeseensa nähden hyödytöntä.
Jäljitettävyys
Eng. traceability
Jäljitettävyys tarkoittaa sitä, että tietoon kohdistuneet tapahtumat läpi sen elinkaaren ovat luotettavasti selvitettävissä ja todennettavissa. Jäljitettävyys luo perustan myös tiedon eheyden varmistamiselle.
Jäljitettävyyteen ja eheyteen voidaan katsoa kuuluvaksi myös sen erottaminen, ovatko tietoon kohdistuneet muutokset ihmisen toiminnan vai automatiikan seurausta.
Eheys
Eng. integrity
Eheys tarkoittaa tiedon todistettavaa muuttumattomuutta, tai siihen kohdistuvien muutosten tapahtumista vain ennalta määrätyissä puitteissa. Eheyteen voidaan katsoa kuuluvaksi tiedon (tai tietojärjestelmän) aitous, väärentämättömyys, sisäinen ristiriidattomuus, kattavuus, ajantasaisuus, oikeellisuus ja käyttökelpoisuus sekä se, että näihin kohdistuneet muutokset ovat tapahtuneet voimassaolevien käyttövaltuuksien puitteissa.
Eheydestä voidaan puhua joko teknisessä tai semanttisessa kontekstissa. Tekninen eheys viittaa tiedon tekniseen, absoluuttiseen, sisältöön. Semanttinen eheys taas viittaa tiedon merkitykseen, ymmärrykseen tiedosta osana laajempaa kontekstia. Esimerkki tiedon eheyteen liittyvästä ongelmasta voi olla vaikka tilanne, jossa asiakastietojärjestelmään on kirjattu yrityksen nimi, mutta ei y-tunnusta. Tämä puutos aiheuttaa ongelman tilanteessa, jossa laskutusosasto yrittää muodostaa laskua johon y-tunnusta vaaditaan. Vastaavassa tilanteessa ongelmia seuraa myös, mikäli asiakkaan osoitetieto osoittautuu vanhentuneeksi tai vääräksi, jolloin lasku lähetetään väärään osoitteeseen ja sen maksu viivästyy tai estyy kokonaan.
Käytettävyys
Eng. usability
Tiedon käytettävyys viittaa tiedonsaannin helppouteen. Tämä riippuu siitä, miten tieto on löydettävissä, saatavissa esille, esitettävissä ja tulkittavissa. Käytettävyys liittyy läheisesti tiedon saatavuuteen, mutta tämän lisäksi siihen vaikuttavat myös muun muassa tiedon tunnistettavuus ja löydettävyys.
Tiedon käytettävyyttä perinteisesti heikentävä ongelma on niin kutsuttu siiloutuminen. Haluttu/tarvittu tieto voi olla olemassa, mutta se on piilotettuna osaston tai järjestelmän muodostamaan ”siiloon”, johon ulkopuolisilla tahoilla ei syystä tai toisesta ole pääsyä tai näkyvyyttä.
Oikea-aikaisuus
Eng. timeliness
Tiedon oikea-aikaisuus viittaa toisaalta sen ajantasaisuuteen, toisaalta sen saatavilla olemiseen ja käytettävyyteen tietyn aikaraamin puitteissa. Lisäksi oikea-aikaisuus liittyy näiden osatekijöiden suhteeseen: oikeaan aikaan saatavilla olevan tiedon tulee olla myös ajantasaisuudeltaan relevanttia suhteessa tarpeeseen.
Tiedon oikea-aikaisuus on tärkeää etenkin, mikäli tietoa halutaan käyttää tiedolla johtamiseen. Jos vaikkapa talousraportin valmistuminen kestää useita kuukausia, on sen julkaisuhetkellä sisältämän tiedon oikea-aikaisuus heikolla tasolla suhteutettuna sen pohjalta mahdollisesti nousevaan liiketoiminnan muutostarpeeseen.
Teknologioita ja menetelmiä
Tilasto
Eng. statistic
Kokoelma tyypillisesti jotakin asiaa, ilmiötä tai prosessia kuvaavaa jalostettua tietoa.
Tilasto voi olla sidottu yksittäiseen ajankohtaan, sisältää tarkastelun kohteen historiaa ja/tai kehittymistä kuvaavaa tietoa. Sisältäessään historiatietoa tilasto voi myös pyrkiä joko suoraan tai epäsuorasti indikoiden antamaan ennusteen tarkastelun kohteen arvioidusta kehityksestä. Tilasto voi olla esimerkiksi listaus yrityksen kuukauden myyntitapahtumista tai vaikka jalkapallopelien tuloksista.
Analytiikka
Eng. analytics
Analytiikkaa voidaan kuvata kokoelmaksi menetelmiä ja työskentelytapoja, joiden tavoitteena on jalostaa ja muodostaa kerätystä tiedosta kattavampaa informaatiota ja malleja.
Mallien tavoitteena voi olla joko menneiden tapahtumien syy-seuraus-suhteiden ymmärtäminen, tulevien tapahtumien ennakoiminen tai molemmat samanaikaisesti.
Business intelligence
Eng. business intelligence, BI
Business Intelligence tuottaa historiaan perustuvia, nykyisiä ja ennustavia näkemyksiä liiketoiminnasta. Näitä näkemyksiä voidaan käyttää liiketoiminnan päätöksenteon tukena. Järjestelmällisesti toteutettuna tämä toiminta pyrkii tarjoamaan analyyttisen tavan kuvata ja tutkia yrityksen vahvuuksia ja heikkouksia.
Business Intelligence -ominaisuuksia sisältävät, tai tarkoitusta varten luodut, ohjelmistot voivat tarjota erilaisia tapoja opiskella, havainnollistaa ja visualisoida suuria tietomääriä erilaisista lähteistä päätöksenteon tueksi.
Robotiikka
Eng. robotics
Puhtaasti digitaalisessa kontekstissa robotiikka viittaa ohjelmistoihin tai ohjelmiston määrityksiin (skripti), jotka tekevät automaattisesti tiettyjä ennalta määrättyjä tehtäviä. Tunnetaan myös lyhenteellä RPA (robotic process automation).
Tällaisia tehtäviä voivat yksinkertaisimmillaan olla esimerkiksi samankaltaisina toistuvien toimintojen automatisointi, tietomassojen läpikäynti, tiedon jalostaminen sekä tietoa koskevien mallien luominen. Esimerkkejä monimutkaisemmista ohjelmistorobotiikan sovellutuksista ovat muun muassa osakkeiden robottikauppa tai internetin sekä erilaisten tietokantojen hakurobotit.
Synonyymi: ohjelmistorobotiikka
Tekoäly
Eng. artificial intelligence, AI
Tekoäly (tai keinoäly) on tietokone tai tietokoneohjelma, joka kykenee tekemään älykkäinä pidettäviä toimintoja. Tekoälyn tarkempi määrittely on avoin, koska älykkyyttä itsessään on vaikea määritellä ja tekoälyn merkitys on vaihdellut 1950-luvulta tähän päivään.
Myös rajanveto tilastollisen analyysin, robotiikan ja keinoälyn välillä on tästä syystä ajoittain haasteellinen. Erottavana tekijänä näiden välillä käytetään monesti tekoälyn kykyä ajatella ja oppia, siinä missä ohjelmistorobotti luottaa puhtaasti sille ennalta määriteltyihin malleihin ja toimintatapoihin. Tekoälyn alaluokkina on mm. luova tekoäly (generative AI/GenAI) ja koneoppiminen. Ensin mainittu pohjautuu tekoälymalleille, joita on opetettu luomaan tekstiä, kuvaa, ääntä tai näiden yhdistelmiä opetetun aineiston perusteella. Luova tekoäly ei siis itse luo mitään uniikkia, vaan se hyödyntää ja yhdistelee olemassa olevaa dataa.
Luova tekoäly
Eng. generative AI, GenAI
Luova tekoäly tarkoittaa sitä, että tekoälymalli pystyy luomaan jotain teksti- tai kuvamuotoista vastinetta ihmisten antamille komennoille (prompt). Termi on synnyttänyt keskustelua luovuuden merkityksestä, koska tekoälyn kieli- ja kuvamallit on opetettu laajoilla olemassa olevilla tietomassoilla, joita mallit hyödyntävät vastauksissaan. Esimerkiksi jos pyytää kuvaa järvimaisemasta, kuvamalli ei tiedä mitään järvenrantaa, josta kuvaa alkaisi tekemään. Sen sijaan se tunnistaa termeillä laajasta opetusaineistostaan kuvia, jotka edustavat järvimaisemaa ja tarkentaa sitä käyttäjän komentojen mukaan. Eli absoluuttisesti uuden luomisen sijaan, se yhdistelee olemassa olevaa.
Kielimallit
Eng. language models
Laajoja kielimalleja käytetään luovassa tekoälyssä kielen ymmärtämiseen ja tuottamiseen. Nämä kyvyt on saatu aikaan opettamalla malleja laajoilla tekstiaineistoilla. Kielimallista riippuen opetus on yleensä vahvistettua tai ohjaamatonta oppimista. Vuonna 2023 laajalle yleisölle tunnetuimmat kielimallit ovat OpenAI:n GPT-mallit (keskustelumuotoinen ChatGPT), PalM (Google & Bard) sekä Llama (Meta). Kielimallien ja käyttöliittymien avulla ChatGPT:n kaltaisilla palveluilla kuka tahansa voi keskustella tekoälyn kanssa ja pyytää siltä esim. kielikäännöksiä, tiivistelmiä, poikkeavuuksien havainnointia, kielenhuoltotarkistuksia tai vastauksia erinäisiin kysymyksiin.
Kielimalleista keskustellessa törmätään usein aiheisiin eettisyydestä, luotettavuudesta sekä opetusaineiston tarkoituksenmukaisuudesta.
Koneoppiminen
Eng. machine learning
Koneoppiminen tarkoittaa, että tarkkojen sääntöjen sijasta tietokoneelle tai ohjelmalle annetaan kyky ja resurssit oppia esimerkeistä. Suuri osa tekoälyä hyödyntävistä sovelluksista perustuu koneoppimiseen.
Koneoppimista on kolmenlaista; ohjattua, ohjaamatonta ja vahvistettua oppimista.
Tietovarastot
Eng. data storage, data warehouse, data lake
Tietovarastoksi kutsutaan tietokantaa tai useimmiten tietokantojen kokoelmaa, johon on tallennettu organisaatiota tai sen osaa koskevaa tietoa.
Englanninkieliset termit Data Storage ja Data Warehouse viittaavat pääsääntöisesti jäsenneltyä, tiettyä tarkoitusta varten kerättyä tietoa, sisältäviin varastoihin.
Data Lake useimmiten viittaa varastoon, johon tietoa kerätään tietämättä välttämättä sen lopullista käyttötarkoitusta. Eri paikoista tuodaan mahdollisimman paljon tietoa saataville samaan paikkaan (Data Lake), josta sitä sitten lähdetään poimimaan ja jalostamaan erilaisiin tarpeisiin.
Data Lakessa tiedon jäsentely ja rakenne voivat vaihdella. Data Laken ylläpitäminen tähtää usein koneoppimisen ja/tai tekoälyn kehittämiseen tai hyödyntämiseen.
ETL/ELT
Eng. ETL/ELT
ETL terminä viittaa kokonaisuuteen, johon liittyy tiedon siirtäminen, muokkaaminen ja lataaminen. Tieto siis haetaan lähdejärjestelmästä, sitä muokataan tarpeen mukaan, ja se ladataan (siirretään) edelleen tietovarastoon. ETL-prosessi voi esimerkiksi lukea tuntikirjaus-Excelin yrityksen verkkolevyltä (extract), muuntaa sen sisältämät tiedot tekstimuotoon (transform), ja tämän jälkeen syöttää ne palkanlaskentajärjestelmään (load).
ELT-prosessit (extract, load, transform) ovat yleistyneet pilvipalveluiden myötä ja niissä data tuodaan ensin kohdejärjestelmään ja muokataan vasta sen jälkeen.
DataOps / DevOps
Eng. DataOps / DevOps
DataOps ja DevOps on jatkuvan kehittämisen hallintamalli sähköisten palveluiden tuotantoon. DataOps ja DevOps pyrkivät automatisoimaan kehitykseen, testaamiseen ja ylläpitoon liittyvät IT-palvelutoiminnot. Osa-alueita: ketterät projektimenetelmät, tehtävänhallinta, versionhallinta, testausprosessit ja automaatio.
Yhteenveto lyhenteistä
MDM
Master Data Management, ks. Ydintiedon hallinta
CRM
Customer Relationship Management, ks. Asiakastiedon hallinta
PDM / PLM / PIM
Product Data Management, Product Lifecycle Management, Product Information Management, ks. Tuotetiedon hallinta
ECM
Enterprise Content Management, ks. Sisällönhallinta
BI
Business Intelligence, ks. Business Intelligence
AI
Artificial Intelligence, ks. Tekoäly
ML
Machine Learning, ks. Koneoppiminen
Lisätietoa
Lisää määritelmiä tiedonhallintaan ja dataan liittyen löydät muun muassa seuraavista paikoista:
Sanastokeskus, tietotekniikan termitalkoot
Sanastokeskus, TEPA-termipankki
Ari Hovi Oy:n blogi
Ite wiki, digitalisoinnin opas
Finto, Tietotermit-sanasto