TP 2 – Alternatiivsed andmepõhised lahendused
Statistikaamet on kõige olulisema lahendusena elukoha andmete parandamiseks keskendunud Eesti registrites endis leiduva teabe sõelumisele. Sellele keskendus ka REGREL elukoha andmete analüüs (Tammaru 2013). Põhjuseks on asjaolu, et senised otsingud ei ole aidanud leida mõnda alternatiivset suurandmestikku, mis oleks piisava usaldusväärsusega. Täpsemalt küll üks selline suurandmestik — mobiilpositsioneerimise andmestik — leidub. Seetõttu keskendub TP2 alternatiivsete lahenduste otsimisel just sellele, kõige suurema potentsiaaliga lahendusteele, otsides vastuseid järgmistele uurimisküsimustele:
- Millised oleksid alternatiivsed võimalused tegelike elukohaandmete saamiseks rahvastikuregistrisse?
- Millised on selleks tehnoloogilised võimalused ja/või nutikad kaudsed meetmed?
- Kas ja millistel tingimustel on võimalik kasutada inimese tahteavaldusest sõltumatuid lahendusi?
- Kas maailmast on teada toimivaid ja rakendatud alternatiivseid lahendusmudeleid?
- Milliste alternatiivsete (seni kasutamata) meetoditega ja millistel tingimustel oleks võimalik KOV-dele tagada informatsioon tegelikult tema territooriumil elavate inimeste kohta (nt teiste registrite kaudu)?
Mobiilpositsioneerimise andmetel on väga suur potentsiaal seetõttu, et nende kasutus registriandmete parandamiseks on tehniliselt võimalik, samas aga ei luba hetkel mobiilpositsioneerimise ja registriandmete sidumist Eesti seadusandlus.
Esimene suund (TP2-1) on seetõttu seotud seadusandlusega seoses mobiilpositsioneerimise ja registriandmete sidumisega. AKI viitab oma otsuses Eesti sideseadusele ning täpsemalt selle ühele paragrahvile (ESS § 105 lõige 1): kliendi asukohaandmeid, mille töötlemine ei ole sätestatud ESS §des 104 ja 1111, võib sideettevõtja töödelda ainult siis, kui need andmed on enne töötlemist muudetud anonüümseks. Seega ei saa kliendi asukohaandmeid ilma inimestelt endilt luba küsimata kasutada statistilistel eesmärkidel, sest sideseadus lubab töödelda vaid anonüümseid andmeid. Euroopa seadusandlus selliseid kitsendusi ei sea. See on väga oluline töölõik, sest kui Eesti läheb registripõhiste rahvaloenduste läbiviimise teed, on see lahendus ülimalt oluline. Selgitame, mida ja kuidas on võimalik Sideseaduse muutmiseks teha või kuidas tõlgendada mobiilpositsioneerimise andmeid käesoleva seaduse kontekstis. Teeme seda koostöös Statistikaameti, Majandus- ja Kommunikatsiooniministeeriumi ning Eesti Pangaga, sest ka Eesti Pank vajab mobiilpositsioneerimise andmeid oma igapäevatöös. Lisaks sellele tunneb mobiiliandmete kasutamise vastu huvi ka Eurostat. Lühidalt, praegune seadusandlus ja andmete tõlgendamine ei võimalda kasutada mobiilpositsioneerimise täit potentsiaali. See ei tähenda siiski, et mobiilpositsioneerimise andmeid ei saaks juba täna kasutada, sest inimeste endi nõusolekul on andmete sidumine lubatud ka praeguse seadusandluse raames.
Teine suund (TP2-2) pakub analüütilise raami sellest, milline on Eesti elanike tänane ruumilise mobiilisuse muster ja kuidas see on ajaga (alates 2006. aastast) muutunud. Selleks kasutame pseudonüümseid passiivse mobiilpositsioneerimise andmeid. Selle töö käigus toimub nn ankurpunktide metoodika valideerimine ja edasiarendamine: mobiilpositsioneerimise andmetest ankurpunktide arvutamise algoritmi tuum on juba üle 10 aasta vana ning see võimaldab leida inimeste elu- ja töökoha asukohti ning selgitada teisi olulisi viibimiskohti. Tänu pidevale arendustööle töötab see väga hästi nende inimeste puhul, kes elavad ühes kohas ning töötavad päeval kindla asukohaga töökohas. Inimeste mobiilsusmustrid on tegelikult väga rutiinsed. Näiteks tööealise inimese elu kulgeb valdavat „trassil“ kodu–töö–kodu. Sellele lisanduvad muud regulaarselt külastatavad kohad (teine kodu, poed, hobid jmt), kuid nende osatähtsus on juba oluliselt väiksem. See tähendab muu hulgas, et varasema käitumise (näiteks 1 aasta jooksul, et aru saada ka elurütmi sesoonsusest) võimaldab väga täpselt hinnata ka liikuvust lähitulevikus.
Selleks, et ankurpunktide mudel oleks veelgi täpsem ka ebaregulaarselt liikuvate inimeste puhul (nt mitme töö- ja elukohaga inimesed, vahetustega töötavad inimesed) on vaja metoodikat edasi arendada, võttes aluseks erineva liikumiskäitumisega inimesi. Näiteks on mitme elukoha vahel liikumise põhjuste tuvastamiseks vaja uurida nendest kohtades viibimise sagedust, selle ajalist dünaamikat (ööpäev, nädal, aasta) ja kohtade külastamise järgnevust. Selle alusel võime prognoosida, kas tegemist on teise koduga suvekuudeks, puhkuseks või elab respondent ühes kohas tööpäevadel ja teises kohas nädalavahetuseti. Piisavalt pikk aegrida võimaldab tuvastada ka tüüpilisemaid reisiahelaid: näiteks tööle minnakse alati esmase tähtsusega kodust, aga nö teine kodu on tööreisi alguseks esmaspäeva hommikuti jne.
Kolmas suund (TP2-3) on valimipõhine mobiilpositsioneerimise ja registriandmete ühendamine. Täpse elukoha aadressi määramiseks on vaja esimese sammuna värvata inimesed, kes on nõus lubama mobiilpositsioneerimise andmed linkida Statistikaametis enda registriandmetega. Valim metoodika testimiseks ei pea olema suur, näiteks 250 inimest, kuid oluline on kaasata T1 ja TP3 raames selgitatud riskirühmi ehk inimesi, kelle elukoha andmetes on kõige enam ebatäpsusi. Mobiilpositsioneermise andmed ei võimalda määrata elukohta eluruumi täpsusega ning seetõttu saab elukoha määrata otsides mobiilpositsioneerimise abil leitud elukoha ankurpunkti piirkonnas üle erinevate registrite inimeste eluruumi aadresse. Inimese elukohaks määratakse see aadress, mis asub mobiilpositsioneerimisega leitud elukoha ankurpunktis. Viimase sammuna valideeritakse andmeid, küsides inimestelt nende tegeliku elukoha aadressi. Teisisõnu sõltub mobiilpositsioneerimise andmete kasutuse edukus sellest, kas inimese on mõnes registris kasutanud ka oma tegeliku elukoha andmeid. Kui metoodika on välja töötatud ja valideerimise käigus kinnitust saanud, on võimalik seda metoodikat katsetada ka kogurahvastiku peal. Kas seda on võimalik teha projekti ajaraamides või hiljem sõltub TP2-1 tegevuste edukusest.
Neljanda suuna (TP2-4) eesmärk on selgitada, kas teistes riikides on kasutatud alternatiivseid suurandmeid registriandmete parandamiseks. Samas on erinevates varasemate arutelu faasides (sh REGREL) kaalutud mitmeid variante: inimeste asukoha tuvastamine IP-aadresside põhjal, pangakontaktide kasutus, kaupluste kliendikaartide teave jne. Kõigi nende andmestiku puhul on probleemiks, et nad ei kata kogu rahvastikku. Siiski analüüsime ka oma projekti raames läbi ka teisi alternatiivseid võimalusi lisaks mobiilpositsioneerimise andmetele.
Vastutav täitja: Tartu Ülikooli Ökoloogia ja maateaduste instituut (juht Anto Aasa)