Liigu edasi põhisisu juurde
Datadriven decision making

Tõenduspõhine otsustamine – kuidas alustada BI-ga?

Kaarel Koosapoeg

Tõenduspõhise otsustamisega (Data Driven decision making) alustamine tundub paljudele ettevõtetele ületamatu väljakutse. Valdkonda uurima hakates jõutakse kiiresti märksõnadeni suurandmed, modelleerimine ja tehisintellekt. Teemasse lisandub sageli ka vajadus andmejärve järele. Olenevalt ettevõttest hinnatakse pingutust ja investeeringut sellega tegelemiseks suureks ning peetakse ebavajalikuks. Mida rohkem tõenduspõhisest otsustamisest ja andmeanalüütikast lugeda, seda keerulisem teema tundub. Kogu selle aja jooksul on kuklas küsimus, kas väiksema või keskmise suurusega ettevõtte jaoks on üldse andmeanalüütikaga tegelemine otstarbekas.

 

Millest ja milliste sõnadega räägime?

 

Enne edasi lugemist on aeg selgitada mõned mõisted, sest neis on natuke segadust ja kattuvust.

 

Tõenduspõhine otsustamine tähendab otsuste langetamist, mille aluseks on tegelikud andmed ja analüüs. Sisuliselt vastandub see intuitiivsele või vaatlusel põhinevale otsustamisele. Tõenduspõhise otsustamise levikut toetavad erinevad tehnoloogilised vahendid ning andmeanalüütika areng.

 

Andmeanalüütika on teadusharu, mis tegeleb analüüsi abil andmetest järelduste tegemisega. Andmeanalüütika tegevusi ja meetodeid automatiseeritakse kasutades algoritme, et muuta toorandmed inimesele paremini arusaadavaks. Andmeanalüütika võimaldab tuvastada trende, mis muidu jääks märkamata ja selle tulemusel tekkivat informatsiooni on võimalik kasutada tõenduspõhiste äriliste otsuste langetamiseks.[1]

 

Lihtsam definitsioon on järgmine - Andmeanalüütika on andmeteaduse meetodite praktiline rakendamine suurandmete automatiseeritud töötlemisel, mille tulemusena valmivad diagrammid, trendiprognoosid ja soovitused aitavad ka ilma programmeerimis- või statistikahariduseta inimestel langetada tõenduspõhiseid otsuseid.[2]

 

Sagedast kasutust leiab ka mõiste äriintelligents, mis on metoodikate, protsesside, arhitektuuri ja tehnoloogiate kogum, mis aitab andmed muuta mõtestatud informatsiooniks, mis toetab efektiivset taktikaliste ja strateegiliste otsuste langetamist.[3]

 

Reaalsuskontroll

 

Erinevatel seminaridel ja konverentsidel osaledes on sageli kuulda inspireerivaid lugusid, kus räägitakse, et tehisintellekt tuleb ning lahendab andmeanalüütika ja tõenduspõhise otsustamise väljakutsed. Lisaks rõhutatakse, et masinõpe aitab andmetest peidetud seoseid välja lugeda, mida inimesed ei suudaks märgata ja seega võiks jätta andmete pealt otsuste langetamise masinatele. Tehniliselt vastab tõele, et masinõppega on võimalik mustreid oluliselt paremini tuvastada, kuid see ei ole ainuvõimalik tee andmetest väärtust välja võtta. Hiljutine MMC Ventures uuring näitab, et 2830 Euroopas registreeritud AI start-up ettevõttest 40% ei rakenda mingilgi määral AI-d[4]. Tehisintellekt võimaldab luua väärtust ja selle kasutamise hind muutub järjest soodsamaks. Tehisintellekti kasutamisesse tuleks suhtuda teatud kriitikaga ja mõelda, kuidas andmetest hetkel kasu saada ka väiksema ja keskmise suurusega ettevõtte puhul.

 

Vaadates ettevõtte varasid, hinnatakse kõige kallimaks tavaliselt töötajaid, kelle kätte konsolideeruvad personaalsed kontaktid, oskused ja teadmised, mis on vajalikud organisatsiooni toimimiseks. Tähtsuselt teisel kohal on andmed, mis kajastavad organisatsiooni hetkeolukorda ja ajalugu – tehingud, arved, kliendid, koostööpartnerid laosesis jne. Kui midagi peaks juhtuma andmeid kasutatavate rakendustega, siis tarkvara on taastatav. Andmete kõrge väärtustamine tuleneb neisse peidetud võimalustest – optimeerida protsesse, tuvastada alakasutatud müügivõimalusi, leida tootmise pudelikaelu või leida optimaalne koht järgmise poe jaoks.

 

Loogiliselt võttes võivad andmed olla elavad või surnud. Elavaid andmeid kasutatakse igapäevaste otsuste tegemisel ja need on relevantsed. Surnud andmed on kuhugi kogunenud, kuid need ei ole relevantsed või neid ei kasutata äriliste probleemide või otsuste langetamisel. Põhjused, miks andmeid ei kasutata, võib jagada sisuliselt neljaks:

 

  1. Need on vananenud ärikeskkonna muutuse tõttu ja sealt ei ole midagi õppida.
  2. Ei teata, millised andmed on olemas, kus nad paiknevad ja milline on nende kvaliteet.
  3. Ei suudeta sõnastada selliseid küsimusi, millele andmeanalüüsiga vastata saaks.
  4. Puudub tehniline platvorm või oskus seda kasutada et andmetest väärtus välja võtta.
  5. Andmed, mis on surnud punktide 2-4 tõttu, on võimalik kasutusse võtta ja ettevõtte hüvanguks tööle panna.

 

Tõenduspõhise otsustamise erinevad küpsustasemed

 

Tõenduspõhist otsustamist on otstarbekas vaadelda läbi küpsusmudeli, mille dimensioonid on keerukus ja äriline väärtus. Olgu mainitud, et küpsusmudeleid on erinevaid ja mõned neist keskenduvad organisatsiooni võimekustele (töötajate oskused, tehnoloogia kasutamine, andmehaldus jne). Käesoleval juhul käsitleme näitena Arbela Maturity Model-it[5], millel on kolm küpsustaset ja kuus alataset. Siinkohal käsitleme kolme peamist küpsustaset

 

Kirjeldav analüütika (descriptive analytics) – Madalamad küpsustasemed keskenduvad raporteerimisele, retrospektiivsele analüüsile ja hetkeolukorra jälgimisele läbi võtmeindikaatorite. Eelkõige vastatakse küsimusele, mis juhtus, miks juhtus ja milline on olukord täna. Tegu on eelkõige olemasolevate andmete retrospektiivse analüüsiga, mis võimaldab minevikust õppida ja saada ülevaade hetkeolukorrast. Kirjeldav analüütika jaguneb omakorda alam küpsustasemeteks, mida iseloomustab andmete reaalajalähedus ja nende aktiivne monitoorimine. Näitena võib tuua erinevad juhtimislauad ja raportid.

 

Prognoosiv analüütika (predictive analytics) - Esimene olulisem muutus toimub siis, kui rakendada mudeleid andmetes olevate lünkade täitmiseks ning tuleviku prognoosimiseks. Seejuures on oluline meeles pidada, et ükski mudel ei prognoosi tulevikku täpselt ja väljastpoolt tulenevad šokid löövad prognoosi kõikuma. Sisuliselt otsib prognoosiv analüütika mineviku andmete vahelisi seoseid, tuvastab trende ning rakendab neid tuleviku prognoosimisel. Näitena võib tuua klientide ostumustrite tuvastamise ja nõudluse põhjal tootmise planeerimise.

 

Ettekirjutav analüütika (prescriptive analytics) – Keskendub eelkõige kasutaja poolt tehtud valikute põhjal erinevate stsenaariumide modelleerimisele, ehk siis kui mingi otsus langetada, siis milline mõju sellel on. Olulise täiendusena on võimalik mudeli põhjal genereerida ka soovitusi, millist otsust langetada. Näiteks kui ettevõte tooteportfellis on palju tooteid, millest kõik ei ole kasumlikud, siis antakse soovitus mingitest toodetest loobuda koos mõjuhinnanguga äritulemustele. Olulisel kohal on otsuse ja mõju vaheliste kausaalsete seoste tuvastamine.

 

ärikasumi ja meetodite teljed

 

 

Tõenduspõhise otsustamisega alustamine

 

Gartneri 2018 tehtud uuring näitas, et 87.5% ettevõtete küpsus on madal[6] piirdudes parimal juhul kirjeldava analüütika küpsustasemega. See tähendab, et andmeid analüüsitakse ad hoc vajadusest lähtuvalt. Sageli piirdutakse Exceliga, teatud juhtudel kasutatakse ka spetsiifilisi lahendusi, kuid küpsus sõltub üksikute indiviidide õhinapõhisest tegevusest. Olukorras, kus soovitakse tõenduspõhise otsustamisega alustada, kuid ei soovita suuri kulutusi teha, on selleks siiski mõned taktikalised käigud.

 

1. Määratle eesmärgid tõenduspõhisele otsustamisele

Sea eesmärgid, mida soovitakse tõenduspõhise otsustamisega saavutada. Juhul kui eesmärk sisaldab erinevaid küpsustasemeid, on otstarbekas see jagada saavutatavateks etappideks, sest ei ole mõtet püüda üle oma varju hüpata.

Eesmärgid peaksid sisaldama ka ärilisi küsimusi, mille osas soovitakse tõenduspõhiselt otsustada, kasutades andmeanalüütikat. Sisuliselt on need küsimused, millele vastamine võimaldab ettevõttel kasumit suurendada. Näiteks:

  • Milliseid tooteid on mõistlik koos paketeerida?
  • Kes on mu suurimad kliendid ja kas nende juures on müügipotentsiaal täielikult realiseeritud?
  • Kus mu tootmisprotsessis on pudelikaelad, mis põhjustavad 15% toodete hilinemise?

 

Tõenduspõhise otsustamisega tegeledes peab olema selge eesmärk, mille mõju väljendub ka ettevõtte finantstulemustes.

Kunagi viisin läbi kaubandusega tegelevas ettevõttes töötuba, mille eesmärgiks oli genereerida küsimusi, millele andmeanalüütikaga vastus anda. Mitmed ideed olid sellised, millele andmeanalüütika saab vastuse anda, kuid nende põhjal ei ole võimalik langetada otsust ettevõtte tegevuse muutmiseks. Näiteks püstitati küsimus, kuidas ilm mõjutab poodide käivet. Andmete põhjal on võimalik tuvastada seos, kuid nimetatud ettevõttel poleks sellega midagi teha olnud, sest a) ilma ei ole võimalik kontrollida ja b) ilma pärast nad poode ajutiselt sulgema ei hakka. Seevastu ostuharjumuste erinevus Balti riikide puhul on informatsioon, mille põhjal on võimalik kauba tellimine ümber kujundada ning reaalset ärilist kasu luua.

 

2. Loo selle toetuseks organisatsiooni struktuur

Tõenduspõhise otsustamisega tegelemine ja andmeanalüütika ei saa olla üks mitmetest sekundaarsetest tööülesannetest. See ei tähenda, et selleks peaks eraldi inimese palkama, vaid oluline on määrata vastutus ja eraldada selleks teatud kogus tööaega. Andmete analüüsimine eeldab süvenemist ja seda ei ole võimalik teha 10 minutilise pausi ajal möödaminnes, sest tulemi kvaliteet kannatab märgatavalt. Spetsialiseerumise vajadus kasvab ka küpsuse tõustes.

 

3. Tuvasta andmeallikad

Andmed on sageli erinevates infosüsteemides laiali ja sageli paiknevad need Exceli dokumentides, on korrastamata ja andmekvaliteet varieerub. Andmete korrastamisega kaasneb teatud komplekssuse kasv, kuid see ei muuda neist kasu lõikamist võimatuks.

 

Hiljuti nõustasin ühte asutust, kelle äriprotsessi tuumaks oli klientide teenindamine ja nad soovisid teada, kui otstarbekalt nad ressursse utiliseerivad. Teenust osutavad töötajad olid kirjas ühes infosüsteemis, kuid muud teenuse osutamiseks kasutatavad ressursid (nt ruumid) olid teises infosüsteemis. Paraku ei olnud need andmed omavahel võrreldaval kujul seotud. Kurioossemaks tegi asjaolu, et ressursside haldamiseks kasutatavas tarkvaras oli andmete agregeerimise ja analüüsimise funktsionaalsus sisse ehitatud, kuid see ei kuvanud andmeid korrektselt. Pärast mõningast tööd alusandmetega oli siiski neist võimalik tuletada realistlikud utilisatsiooni hinnangud. Teatud juhtudel, mil asutus arvas, et ressurss on utiliseeritud 80% ulatuses, selgus, et utilisatsioon oli alla 30%. Andmete analüüs aitas tuvastada olulised võimalused teenuse optimeerimiseks.

 

4. Vali analüütika platvorm

Excel on kõikvõimas, kuid keerukamate analüüside tegemiseks eeldab see kasutajalt küllaltki häid teadmisi. Loodud on mitmeid töövahendeid, mis aitavad tõenduspõhiseks otsustamiseks vajaliku analüüsi muuta lihtsamaks. Loomulikult tuleb ka nende rakenduste puhul arvestada õppimiskõveraga, kuid see võib-olla oluliselt madalam, kui Exceli arenenumate funktsioonide õppimine. Lisaks toetavad need andmete paremat visualiseerimist. Garner on toonud välja valdkondlike liidritena mitmed lahendused:

 

  • Microsoft Power BI
  • QlikSense
  • Tableau
  • QlikView
  • ThoughtSpot

 

Näiteks QlikSense tarkvara on oluliselt lihtsustatud, pidades silmas vähem kogenud kasutajaid. Selles on hästi visualiseeritud ja lihtsustatud erinevate andmebaaside vaheliste seoste tegemine. Kokkuvõttes tähendab see võimalust toorandmetest kiiremini vastusteni ja tõenduspõhiste otsusteni jõuda.

 

Kokkuvõtteks

Tõenduspõhise otsustamise maailm tundub keeruline ja seal on võimalik minna väga sügavale ja detailseks. Seevastu on võimalik õigeid küsimusi esitades andmetest kasu saada, mis ületab tehtava pingutuse.

 

 

Kasutatud allikad:

[1] https://www.investopedia.com/terms/d/data-analytics.asp

[2] https://kompass.hitsa.ee/analuutika-ja-suurandmed/

[3] https://en.wikipedia.org/wiki/Business_intelligence

[4] https://www.mmcventures.com/wp-content/uploads/2019/02/The-State-of-AI-2019-Divergence.pdf

[5] https://www.arbelatech.com/insights/blog/what-is-the-business-intelligence-analytics-maturity-model.html

[6] https://www.gartner.com/smarterwithgartner/take-your-analytics-maturity-to-the-next-level/