Liigu edasi põhisisu juurde
inimene ja robot löövad käed

Millist kasu toovad ettevõttele masinõppe projektid?

Roland Pihlakas & Eerik Sven Puudist

Tehisaru on kiiresti leidnud tee meie igapäevateenustesse, pannes ettevõtted küsima, kuidas uut tehnoloogiat parimal viisil enda äritegevuses rakendada. Meie eksperdid annavad ülevaate levinumatest masinõppe kasutusvõimalustest koos praktiliste näidetega.

 

Vahel võib jääda ekslik mulje, nagu oleks tehisaru müstiline must kast kontorinurgas, mis sööb lõunaks äriprobleeme ja annab vastu valmis lahendused. Tegelikult tuleks tehisaru näha osana laiemast taristust, mis koosneb andmevoogudest, algoritmidest, kasutajaliidesest ja – kõige olulisem – lahenduse kasutajatest.  

 

Kui sind huvitab, kuidas masinõppe lahendused sinu ettevõtet toetada saavad, siis vaata lisainfot ja praktilisi näiteid meie sidusettevõtte Intelex insighti kodulehelt.

 

Enamasti pole ju eesmärk otsustamise masinale delegeerimine, vaid inimese ja masina koostöö. Masin teeb küll inimese eest suure töö ära ja annab soovitusi, ent otsused langetab endiselt inimene (või vähemalt vastutab nende eest, isegi kui masin need teeb, seega peab ta igal juhul mõistma, milliseid otsuseid ja miks tehisaru teeb). Loe ka meie varasemalt kirjutatud artiklit Kuidas BI (ärianalüütika) ja AI (tehisintellekt) aitavad äri veelgi efektiivsemaks muuta? 

 

Olenemata täpsest sisust järgivad andmeprojektid laias laastus samu etappe. Kõik algab eesmärgi püstitamisest ehk läbi mõtlemisest, mida soovitakse saavutada ja kuidas hinnatakse lahenduse kasu.  

 

Sellele järgneb andmete kogumine, eeltöötlemine (mis on reeglina väga mahukas töö) ning mudeldamine (seejuures võib ühe äriprobleemi lahendamiseks vaja minna mitut mudelit). Lõpuks tuleb veenduda, et mudel ka praktikas töötab, ja integreerida see organisatsiooni töövoogu, et see kasutult seisma ei jääks.

 

Vaatame nüüd lähemalt masinõppe levinumaid kasutusvõimalusi ning milline on saadav kasu ettevõtete jaoks.

 

 

1. Optimeerimine  

Optimeerimine tähendab oma olemuselt tegevuskava koostamist, kus ei ole võimalik korrata mineviku mustrit, vaid tuleb arvesse võtta erinevaid reegleid ja piiranguid. Klassikaline optimeerimisülesanne on tunniplaani koostamine, kus tuleb arvestada õpetajate ja õpilaste päevaplaaniga ning ruumide saadavusega. Samal põhimõttel käib ka töögraafikute koostamine, organisatsioonides kus need ei järgi ühte lihtsat mustrit.

 

Optimeerimise reeglid jagunevad piiranguteks, mis peavad olema täidetud, ja mõõdikuteks (eesmärkideks), mille poole püüelda. Kaubatranspordil võivad piiranguteks olla näiteks kaubiku mahutavus ja juhi tööaeg, eesmärkideks aga päeva lõpuks maksimaalse kaubakoguse tarnimine ning minimaalne kütusekulu. Piirangud omakorda võivad olla eri rangusastmega (näiteks seadusest tulenevad tööaja piirangud, mida ei tohi rikkuda, ja personali eelistused, millega arvestatakse võimalusel).

 

Tavaliselt on ettevõtte eesmärgiks kulude optimeerimine, aga selleks võib olla ka paindlikkus ja seeläbi riskide vähendamine. Kuna käsitsi optimeerimine on väga ajamahukas, saab tehisaru siinkohal palju aega säästa, eriti kui on vaja kiiresti muudatusi teha ja plaane ümber optimeerida.

 

Optimeerimisülesande puhul ei pruugi me leida ideaalset lahendust. Piisab ligikaudu heast lahendusest antud reeglite piires.

 

Pilt

 

Optimeerimisprojektide näiteid: 

 

  • personali töögraafik;
  • ladustamise paigutus laos või veoki kaubaruumis;
  • kaupade paigutus poes;  
  • sõidukite trajektoor (logistika);
  • tööstusseadmete töögraafik (mis järjekorras millised masinad materjale töötlevad);
  • toormaterjali lõikamine minimaalsete jääkidega;
  • ülaltoodud plaanide jooksev ümberplaneerimine minimaalsete muudatustega uute tingimuste ilmnemisel;
  • ühistranspordi kasutaja teekonna planeerimine;
  • inimeste rühmadesse jaotamine;
  • kontaktisoovitused vabade aegade alusel (matchmaking);
  • kontaktisoovitused profiili alusel (matchmaking);
  • otsingutulemuste mitmekesistamine.

 

 

2. Äratundmine ja ennustamine  

Ehkki me ei saa kunagi täie kindlusega tulevikku ette teada, saame prognoosida erineva tõenäosusega tulevikustsenaariume. Tõenäosust teades saame aga anda endast parima, et enda jaoks sobiv tulemus saavutada.

 

Aegridade analüüsimisel prognoositakse mingi numbrilise suuruse väärtust tulevikus, võttes arvesse sama suuruse mineviku väärtusi ja teisi mõjutegureid. Näiteks ennustame järgmise aasta müügitulu, arvestades eelmise aasta müüginumbreid ja teisi müüki mõjutavaid tegureid, nagu kampaaniad, pühad, ilm, inflatsioon, trendid jmt.

 

Kui hästi midagi prognoosida saab, sõltub sellest, kui hästi me süsteemi toimimisest aru saame, kui paljudest muutujatest süsteem sõltub, kui regulaarsed on mustrid ajaloolistes andmetes ja kui palju ennustused tuleviku kohta süsteemi ennast mõjutavad (näiteks mõjutavad aktsiahindu tugevalt analüütikute prognoosid).  

 

Ennustamiseks võib kasutada ekspertide hinnanguid või statistilisi meetodeid. Enamasti saab parima tulemuse mõlemat kombineerides: ekspert aitab kokku panna mudeli, masin genereerib prognoosi ning lõpuks ekspert tõlgendab ja korrigeerib tulemusi.  

 

Vahel piisab ennustamiseks väga lihtsatest meetoditest, nagu ajaloolise keskmise arvutamine. Teinekord tuleb rakendada keerukamaid mudeleid, mis võtavad arvesse mustreid ajaloolistes andmetes või seda, kuidas vaadeldav suurus on seotud teiste protsessidega.  

 

Üheks lihtsaks meetodiks aegrida - näiteks kuist käivet - paremini mõista, on jagada see trendiks, sesoonseks kõikumiseks ning müraks. Trend näitab muutuse üldist suunda, näiteks, et müük on igal aastal umbes 15% kasvanud. Sesoonsus näitab, kuidas sõltub käive mingist perioodilisest kõikumisest, näiteks nädalapäevast (laupäeval ja pühapäeval ostetakse rohkem) või aastaajast (suvel on käive suurem).  

 

Mõnikord võib sesoonsus olla kompleksne - näiteks võib olla oluline iga kuu teise nädala esmaspäev, mis on liikuva kuupäevaga. Müra näitab raskesti ette ennustatavaid kõikumisi, näiteks COVIDiga seotud piirangute mõju.

 

Regressioonianalüüsi puhul ennustame pidevat muutujat - näiteks mitme minuti pärast takso kohale jõuab. Oluline on meeles pidada, et statistiline mudel on alati maailma lihtsustus. Statistiline mudel ei genereeri ühtainsat väärtust, vaid tõenäosuse jaotuse, valib siis sellest välja kõige tõenäolisema väärtuse ja esitab selle ühe numbri kujul lõppkasutajatele.

 

Hea mudel annab võimalikult täpse tulemuse võimalikult vähese keerukusega ehk võimalikult väheste parameetrite baasil.

 

Pilt

 

Klassifitseerimise puhul õpetame masina etteantud tunnuste järgi objekte liigitama - näiteks ära tundma, kas pildil on kass või koer.

 

Kui juhendatud masinõppe puhul teame soovitud tulemust ette, siis juhendamata masinõppe puhul me seda ei tea. Näiteks laseme kliendiandmete ja ostuajaloo põhjal ettevõtte kliente segmenteerida teadmata, millised rühmad tulemuseks saadakse.

 

Algoritm võib klassifitseerimisel teha kahte tüüpi eksimusi: paigutada rühma objekti, mis tegelikult sinna ei kuulu, või jätta paigutamata objekti, mis kuulub. Neil eksimustel võib olla erinev kaal.  

 

Oletame, et kasutame algoritmi ennustamiseks, millistel õpilastel tekivad õpiraskused. Kui algoritm liigitab ekslikult riskirühma õpilase, kel raskusi ei teki, ei ole see tõenäoliselt väga suur probleem. Hoopis tõsisemad tagajärjed on sellel, kui algoritm jätab tuvastamata õpilase, kel probleemid päriselt tekivad. Selle vältimiseks võime näiteks otsustada, et kõik üle 25% tõenäosusega õpilased tuleks klassifitseerida riskirühma.

 

 

Näiteid projektidest

 

Äratundmine:

  • klassifitseerimine: kliendipöördumiste või tagasiside liigitamine ja edastamine õigesse osakonda;
  • praak toormaterjali äratundmine, näiteks puidutööstuses;
  • kulumise, rikete, või inimvigade tuvastamine pildi, video või muu signaali pealt;
  • muude anomaaliate tuvastus (näiteks masinapargiga ettevõttes kütuse varastamine).

 

Ennustamine:

Ajastuse ennustamine: 

  • masinate, hoonete ja teede remondi hooldusvälpade ennustamine (millal on vaja hooldada);

 

Mahu ennustamine:

  • kaupluse läbimüük toodete lõikes (et riiulid ei saaks tühjaks ning kaup ei rikneks või seisaks asjatult);
  • tooraine vajaduse maht tootmises;
  • hoolduse jaoks vajaminevate varuosade koguse ennustamine (et pika tarneajaga varuosad oleksid tarnitud ajaks, kui neid vaja võib minna);

 

Finantside ennustamine:

  • ettevõtte käibe prognoosimine;
  • toorainehindade muutumise prognoosimine;

 

Ajakulu ennustamine:

  • varustamise või transpordi ajakulu, kauba, tooraine või varuosade saabumise aeg (näiteks et kaup jõuaks poeletile siis, kui varasem partii on otsas. See on eraldi ülesanne vajamineva kauba mahu ennustamisest.)

 

Koormuse ennustamine:

  • kassade või klienditeenindajate koormuse ennustamine;
  • masinate ja sõidukite töökoormuse ennustamine;

 

Ennustamine ja planeerimine koos:

  • potentsiaalsete eritellimuste koormuse ja mahu ennustamine ning nende täitmiseks paindlikkuse või vabade ressursside olemasolu tagamine planeerimise teel, et oleks suutlikkus hea tasu eest kiireloomulise vajadusega kliente vahele võtta.

 

Konkreetne näide mitmest omavahel kombineeritud ennustamise ja planeerimise ülesandest:  

 

„Minu ettevõte tegeleb toidukauba hulgimüügiga. Mul oleks vaja teada, millal kaupa tellida. Kui ma tellin liiga hilja, siis saab kaup otsa ja kliendid on rahulolematud. Kui ma tellin liiga vara, siis läheb toit halvaks ja minu finantsjuht on rahulolematu.“

 

  • Kui kaua kaup säilib? (ette teada)
  • Kui palju ma lähiajal müün? (ennustamisülesanne)
  • Kui kiiresti tellitud kaup kohale jõuab? (ennustamisülesanne)
  • Kui palju korraga ja kui sageli tellida, et transpordi kulu oleks minimaalne? (optimeerimisülesanne)

 

 

3. Tekstitöötlus  

Klassikaline tekstitöötluse näide on otsingumootor ja siinkohal ei pea me silmas vaid Google’it, vaid kõikvõimalikke otsingumootoreid kodulehtedel ja dokumendibaasides.

 

Kui minevikus suutis masin tekstidest leida vaid otsitava sõna või heal juhul selle sünonüümid, siis täna suudavad otsingumootorid leida vastuseid küsimuste tähenduse tasandil.

 

Otsingumootori edasiarendus on juturobotid, mis teostavad otsingut taustal ja kasutavad otsingu tulemust sisendina. Seejuures on võimalik juturoboteid näidistekstide põhjal treenida küsimustele vastama kindlas, etteantud stiilis ja terminoloogias.

 

Tekstitöötlust läheb vaja ka otsingutulemuste mitmekesistamiseks (näiteks et ürituste portaal ei soovitaks ainult üht laadi sündmusi, vaid erinevat tüüpi üritusi), samuti personaliseeritud kontaktisoovituste andmiseks platvormidel, mis arvutatavad välja kasutajaprofiilide sarnasused-erinevused ning sobitavad need omavahel.

 

Tekstitöötluse näiteid:

 

  • juturobot;
  • automatiseeritud klienditugi;
  • KKK koostamine varasemate küsimuste klasterdamise abil (algoritm leiab korduvad küsimused, mis on samas võimalikult mitmekesised);
  • tagasiside vormiga kombineeritud otsingumootor (enne küsimuse ärasaatmist soovitab robot tutvuda sarnase küsimusega KKK all);
  • tekstist kokkuvõtte tegemine või info otsimine ;
  • aruteludest kokkuvõtete tegemine, tuues välja võimalikult erinevad seisukohad;
  • kirjelduse põhjal sarnaste kaupade tuvastamine ja soovitamine;
  • kliendipöördumiste automaatne edasisuunamine õigesse osakonda;
  • automaatne tuvastamine, millised vastamata kirjad on kõige olulisemad;
  • otsingutulemuste mitmekesistamine ;
  • kontaktisoovitused kasutaja isikliku profiili sisu alusel.

 

Ehkki masinõpe võib esmapilgul tunduda keerulisena, ei tuleks selle ees hirmu tunda. Selle asemel tasub seda näha ettevõtte jaoks võimalusena, mis võimaldab paljusid tegevusi senisest efektiivsemalt teha, produktiivsust tõsta ning uusi sihte seada.  

 

Andmeprojektide esimene samm on luua pilt, millised andmed on ettevõttes juba olemas ning millist väärtust on nende abil võimalik luua. Kogenud spetsialistid saavad siin väärtuslikku abi pakkuda ning järgmiste sammudeni juhatada. Kui soovid arutada masinaõppe kasutamise võimalusi oma ettevõttes, võta ühendust meie sidusettevõtte Intelex Insighti tegevjuhi Kauriga.

 

Vaata lisa: Ärianalüütika ja masinõpe