Luukas Kristjan Ilves: ma tean sinust rohkem
Elame “tõe-järgsel” ajastul, mil kaaskodanikud ei usu enam jagatud tõdedesse ning tarbivad informatsiooni enda infomullides. Seda on kirjeldatud mh konfliktina avatud ning suletud maailmavaadete vahel. Aga küsimus pole tingimata ainult väärtuskonfliktis, vaid asjaolus, et me ei suuda enam omavahel kokku leppida faktides.
Andmed on ehitusklotsid, millest faktid koosnevad. Tänapäeval supleme andmete paljususes. Andmete hulk maailmas kahekordistub iga kahe aasta tagant. Tarkade majade, autode, medikamentide, isegi riiete tulek tagab, et see kahekordistamine mõneks ajaks jätkub. Ent enamasti ei oska me selle infolaviiniga midagi pihta hakata. Aktsiaturge troonivad ettevõtted, kes on ära õppinud kuidas andmete põhjal süstemaatiliselt teadmisi luua – Amazon, Google, Facebook. Nende edu jätkub ka tehisintellekti ajastul, suurim hüpe masinõppes on tulnud suurte andmehulkade baasil tehisintellekti paremas treenimises.
Suured majanduslikud muutused pea igas sektoris tulevad järgmisel kümnendil andmete paremast kasutamisest, alates personaliseeritud geeni-põhisest meditsiinist mis tervelt elatud aastate arvu oluliselt tõstab kuni tarkade kodudeni mis vähem energiat kasutades elektriarveid langetavad ning ülemineku taastuvenergiale hõlbustavad.
Andmetest faktide tootmine oli kunagi kulukas tegevus, mis kuulus valitsustele, suurkorporatsioonidele ning ülikoolidele. Mitte enam. Andmeanalüütika ning andmete töötlemine on muutunud järjest odavamaks ning lihtsamaks, täna räägime kodanikualgatuslikult andmeteadusest. Internetis saadava avaliku teabe põhjal on vabatahtlike kooperatiiv Bellingcatteinud Lääneriikide teabeteenistustele silmad ette tõestamas vene kohalolekut Donbass-is ning Krimmis. Avaandmetel toimivad rakendused on kättesaadavad kõige väiksemale omavalitsusele.
Andmete parem kasutamine ei ole pelgalt IT küsimus, aga see on IT-ga läbipõimitud:
Eesti on andmete kasutamises vastuolude maa:
Eesti riigil on ilmselt maailma kõige paremini ühendatud ning korrastatud andmetaristu, ent oleme avaandmetes Euroopas 23ndal kohal. X-teel on 1500 andmekogu, aga avaandmetena saab ainult 154 – ning neid enamasti läbi allalaetava faili, mitte veebiteenusena.
Andmemajanduse lisandväärtus Eestis on 3,5% SKT-st (parim näitaja Euroopas), aga see tuleb enamasti mõne innovaatilise sektori arvelt. Eesti idufirmad, pangad, telekomi firmad teevad innovaatilist tööd, aga Eesti ettevõtted on tervikuna digivahendite kasutamises Euroopas 19ndal kohal, jäädes alla Slovakkiale ning Küprosele!
Allikas: EU Data Landscape, The Lisbon Council
Eesti riik teeb kohati väga põnevaid asju. Näiteks plaanib statistikaamet toetada ministeeriumide poliitikakujundamist reaalaja andmekaevega. E-tervise ja geeniandmete põhjal hakatakse tegema terviseuuringuid. Tänu nõudele registreerida üle 1000-eurosed tehingud säästis maksuamet maksumaksjatele üle 100 miljoni euro aastas, kuna tekkisid andmed, mis võimaldasid maksupettusi avastada.
Ent paarist avaliku sektori kompetentsikeskusest ei piisa. OECD sõnul on järgmise kümnendi vajalikum amet andmeteadlane, ilmselt olulisem kui programmeerimine. See pole õigupoolest eraldi teadusharu või amet, vaid kompetents mis on vaja igal statistikul, analüütikul ning juhil, advokaadibüroost pangani (viimaste puhul eriti rahapesu avastamiseks!). Ei jää ka puudutamata huminataaralad - keeleteadlaste, ajaloolaste, geograafide töö muutub tänu andmetele – ning kõige põnevamat teadust teevad need, kes oskavad andmeid toota ja analüüsida.
Miks mitte lisada andmekaeve ja analüütika mooduleid kõikidesse keskkooli ning ülikooli õppekavadesse? Või eestindada internetipõhised andmeteaduse õppeprogrammid, võttes eesmärgiks 10-20 tuhande inimese ümberkoolitamise aastas?
Hiljuti lahkunud Rootsi akadeemik Hans Rosling tajus, et andmetest laiema üldsusele teadmisteks tegemine saab toimida ainult läbi nende visualiseerimise ning veenva esitamise. Oma kõnedes lükkab ta veenvalt ümber kujutelma, just kui läheks maailmas kõik kehvemini, näidates andmete põhjal maailma jõukuse, tervise ja turvalisuse kasvu. Vajame oma avalikes debattides rohkem Hans Rosling-e, kes tuleksid mitte argumentide vaid analüüsitulemuste ning piltidega. Mõned näited:
Mis on alkoholiaktsiiside ja piirikaubanduse koosmõju? Võrdleme suure hulga indikaatoreid (maksulaekumine, müügiarvud, alkoholitarbimise eeldatavad tervise- ja sotsiaalmõjud) eri Eesti nurkades. Võrdleme Lõunapoolseted maakonnad Saare või Läänevirumaaga. Veel parem, kui võrdleksime Läti andmetega, ning võtaksime appi erasektorilt müügi ning lokatsiooniandmed.
Või integratsiooniteemal. Reaalne tulemus, mida me soovime, on Eesti keelt kõnelevad, majanduslikult edukad, oma riiki armastavad kodanikud. Kool on oluline, aga kuidas mõjuvad erinevad pakutavad poliitikavariandid tulemustele? Ning mis on teiste faktorite (tervis, jõukus) koosmõju? Riigi andmetes peitub sadade tuhandete Eesti-venelaste elukaare andmestik, mis võiksid selgust anda.
Isegi vaktsineerimise teemal võimaldaksid Eesti e-tervise andmed testida odavalt vaktsiinivastaste hüpoteese, mida teadus veel kõik kontrollida pole jõudnud (näiteks väidest, et vaktsineerida tuleks hiljem ning suuremate ajavahedega). Vaataks järgi, kuidas erinevad Eestlaste pikaajalised tervisetulemused sõltuvalt hetkest mil neid vaktsineeriti.
Järgmise kuu-kahe jooksul moodustatakse uus valitsus ning pannakse paika programm järgmiseks neljaks aastaks. Valitsusprogrammide terminoloogia jääb üldiselt ähmaseks („tõstame, parandame, suurendame, laiendame...“). Mis oleks, kui iga valitsusprogrammi punkti taha tekiksid olulised indikaatorid? Numbrid, mis ei uuene iga-aastase uuringu tulemusena vaid kuvatakse reaalajas valitsuse veebisaidil? See võiks tekitada surve mitte ainult ametkonnale, vaid avaks ka laiema ühiskondliku debati – mis indikaatorid on olulised? Kuidas me tulemusi mõõdame? Ning aitaks kaasa olulisemale kultuurilisele muudatusele andmepõhisise poole.
Artikkel ilmus Eesti Päevalehe, Heateo Sihtasutuse ja Kodanikuühiskonna Sihtkapitali artiklisarjas "Mis sind närvi ajab?"