Henkilötiedonkeruuta tehdään pian myös verkossa | Tieto & Trendit

Uusin numero

3/2016
Tieto&trendit
Teema Asuminen
Arkisto
Tieto & Trendit
Tieto&trendit 2/2015 19.5.2015 Laura Hulkko

Henkilötiedonkeruuta tehdään pian myös verkossa

Laura Hulkko

Tilastokeskuksen tavoitteena on mahdollistaa kansalaisille verkossa vastaaminen vuodesta 2016 alkaen.

Verkkovastaaminen edellyttää kuitenkin paljon tiedonkeruisiin liittyvää menetelmä­työtä ja testaamista. Eri menetelmin saatujen tietojen tulee olla keskenään vertailukelpoisia, vastauskato ei saa nousta, tietoturvasta tulee huolehtia ja kansalaisia tulee kohdella tasapuolisesti.

Tilastokeskus kerää vuosittain väestön elinoloihin liittyviä tietoja noin 200 000 kansalaiselta. Tietojen pohjalta laaditaan sosiaalitilastoja, jotka muodostavat kattavan kuvan suomalaisten elämästä ja olosuhteista. Kansalaisilta kysyttäviin haastattelu­tietoihin perustuvat muun muassa työllisyys- ja tulonjako­tilastot sekä väestön tietotekniikan käyttöä, kulutusta, ajankäyttöä ja vapaa-ajan toimintaa kuvaavat tilastot. Näitä tiedonkeruita kutsutaan henkilötiedon­keruiksi, ja ne kuuluvat Suomen virallisen tilastoinnin piiriin.

Nykyisin virallisten tilastojen tiedot kerätään kansalaisilta pääosin puhelin­haastattelujen avulla. Myös käynti­haastatteluja käytetään eräissä isohkoissa tiedonkeruissa. Haastattelujen määrä on valtava; yksinomaan työvoima­tutkimuksessa tehdään joka kuukausi noin 10 000 puhelin­haastattelua. Tiedonkeruuta on tekemässä jatkuvasti lähes 200 haastattelijaa.

Tietotekniikka ja internetin käyttö alkavat olla arkipäivää jo suurimmassa osassa suomalaiskoteja. Alle 65-vuotiaista suurin osa käyttää internetiä lähes päivittäin, ja aktiivikäyttäjiä löytyy yhä runsaammin myös vanhimmista ikäryhmistä (kuvio 1).

Kuvio 1. Suomalaisten internetin käyttö ikäryhmittäin vuonna 2014

Suomalaisten internetin käyttö ikäryhmittäin vuonna 2014, Lähde: Tilastokeskus, väestön tieto- ja viestintätekniikan käyttö

Lähde: Tilastokeskus, väestön tieto- ja viestintätekniikan käyttö

Erilaiset nettikyselyt ovat kansalaisille tuttuja, ja myös monet viranomais­asiat voidaan hoitaa internetin välityksellä. Netissä voi esimerkiksi tilata verokortin, hakea Kelasta tukia ja tehdä päivähoito­hakemuksen, ja suuri osa kansalaisista myös käyttää näitä mahdollisuuksia (kuvio 2). Tämän myötä tuntuu luontevalta, että myös virallisen tilaston tiedonkeruuseen olisi mahdollista vastata verkon kautta.

Kuvio 2. Suomalaisten internetin käyttö viranomaisasiointiin vuonna 2014

Suomalaisten internetin käyttö viranomaisasiointiin vuonna 2014, Lähde: Tilastokeskus, väestön tieto- ja viestintätekniikan käyttö

Lähde: Tilastokeskus, väestön tieto- ja viestintätekniikan käyttö

Tilastokeskuksen tavoitteena onkin mahdollistaa verkossa vastaaminen kansalaisille vaiheittain vuodesta 2016 alkaen. Yritystilastoissa ja ulkopuolisella rahoituksella toteutetuissa tilaustiedon­keruissa verkko­vastaaminen on ollut käytössä jo pitkään.

Viimeksi kuluneiden parin vuoden aikana verkkotiedonkeruuta on testattu pilotti­tutkimusten avulla kahdessa erityyppisessä tiedonkeruussa: kansalaisten talouteen liittyviä mielikuvia kartoittavassa kuluttaja­barometrissa sekä työllisyys- ja työttömyys­lukujen pohjana olevassa työvoima­tutkimuksessa. Pilottitutkimuksista saadut kokemukset osoittavat, että virallisten henkilö­pohjaisten tilastojen tiedonkeruisiin liittyy erityisiä haasteita.

Yhdistelmätiedonkeruu käyttää useita menetelmiä

Haastatteluja ei täysin korvata verkkolomakkeilla, vaan suurimmassa osassa henkilö­tiedonkeruita tullaan käyttämään kahta rinnakkaista tiedonkeruu­menetelmää. Kyse on siis niin kutsutusta yhdistelmä­tiedonkeruusta (mixed mode data collection), jossa osa tiedoista saadaan verkko­tiedonkeruun kautta, osa haastattelemalla.

Kansalaisten tasapuolisten vastaamis­mahdollisuuksien turvaaminen on Tilastokeskukselle tärkeää, joten esimerkiksi tietokoneen puuttuminen ei saa olla esteenä tutkimukseen osallistumiselle. Ja vaikka välineissä ja taidoissa löytyisikin, vastaaja voi muusta syystä kokea verkossa vastaamisen epämieluisaksi.

Haastatteluja tarvitaan paikkaamaan katoa, sillä aiempien pilotti­tutkimusten perusteella pelkällä verkkotiedon­keruulla ei päästä riittäviin vastausosuuksiin. Kun kuluttaja­barometrissa testattiin yhdistelmä­tiedonkeruuta, saatiin vastauksista 42 prosenttia verkko­tiedon­keruun kautta, ja työvoima­tutkimuksen verkko­tiedonkeruu­pilotissa vastausaste oli 30 prosenttia. Puhelimitse tehtävän työvoima­tutkimuksen vastausosuus on noin 70 prosenttia.

Tiedonkeruilla on usein tiukka aikataulu, eikä vastauksia voida pitkään odotella. Toisaalta väljemmästä aikataulusta­kaan ei välttämättä olisi merkittävää hyötyä. Esimerkiksi työvoima­tutkimuksen verkkotiedon­keruu­pilotissa suurin osa verkko­vastauksista saatiin heti tiedonkeruun käynnistyttyä tai muistutus­viestien jälkeen. Jos vastaaminen jää tuonnemmaksi, se jää helposti kokonaan, vaikka vastaaja suhtautuisi kyselyyn periaatteessa myönteisesti. Tällöin haastattelijan yhteydenotto on tarpeellinen vastausten saamiseksi.

Haastattelemalla saatujen vastausten osuus tulee siis ainakin toistaiseksi olemaan tiedonkeruissa suurempi kuin verkko­vastausten osuus. Ajan myötä tämä suhde voi toki muuttua.

Tietojen laadusta on huolehdittava

Uuden tiedonkeruu­menetelmän käyttöönotto ja usean tiedonkeruu­tavan yhdistäminen tuo mukanaan tietojen laatuun ja vertailtavuuteen liittyviä haasteita. Lopullisten tietojen tulee olla vertailukelpoisia tiedonkeruu­tavasta riippumatta, ja aikasarjojen jatkuvuudesta on huolehdittava.

Henkilötiedonkeruiden pohjalta tuotetaan monia poliittisesti keskeisiä indikaattoreita, kuten kuluttaja­barometrin perusteella laskettava kuluttajien luottamus­indikaattori, työvoima­tutkimukseen perustuvat työttömyys- ja työllisyys­asteet sekä tulo- ja elinolo­tutkimukseen pohjautuva pienituloisuu­saste. Erityisesti taloudellisesti epävakaina aikoina epäilys siitä, että muutokset näissä luvuissa johtuisivat uudesta tiedonkeruu­tavasta, vaarantaisi tilastotietojen luotettavuuden vakavasti.

Verkossa ja haastattelussa käytettävät tiedonkeruu­lomakkeet eivät voi olla ominaisuuksiltaan täysin samanlaisia, sillä vastaaminen on erilaista eri menetelmillä. Verkkolomake nojaa visuaalisiin ratkaisuihin, joiden avulla vastaaminen yritetään tehdä mahdollisimman helpoksi, kun taas haastattelussa haastattelija voi motivoida ja auttaa vastaajaa.

Tiedonkeruu on kuitenkin muutoksille herkkää, ja pieniltäkin tuntuvat muutokset lomakkeella saattavat vaikuttaa tuloksiin yllättävällä tavalla. Yksi esimerkki tästä on ”en osaa sanoa” eli eos –vastaus­vaihtoehdon esittämistapa lomakkeella. Tutkimukset ovat osoittaneet, että eos-vastauksen tarjoaminen yhtenä näkyvänä vastaus­vaihtoehtona lisää eos-vastausten osuutta erityisesti tieto-, mielipide- ja asenne­kysymyksissä ja siten heikentää tiedonkeruun laatua (ks. Jokinen & Järvensivu 2014).

Tämä nähtiin selvästi kuluttajabarometrin pilotti­tutkimuksessa, jossa eos-vaihtoehto oli näkyvissä verkko­lomakkeella, mutta sitä ei puhelin­haastattelussa luettu ääneen. Eos-vastausten osuus oli selvästi suurempi verkko­lomakkeella kuin puhelimessa vastanneilla, mikä heikentää eri keruutapojen vertailukelpoisuutta.

Keruutapa voi vaikuttaa selvästi tuloksiin myös kysymyksissä, joissa vastaus valitaan usean vaihtoehdon joukosta. Kun haastattelija lukee vaihtoehdot ääneen, vastaajan mieleen jäävät listalta helpoimmin viimeksi mainitut, ja vastaus valitaan herkemmin näiden joukosta. Verkko­lomakkeella annetut vastaukset puolestaan painottuvat listan alkupäähän, sillä vastaaja valitsee listalta herkästi ensimmäisen, joka tuntuu sopivalta. Näin ollen samaan kysymykseen voidaan saada haastattelussa ja verkko­lomakkeella erilainen vastaus­jakauma. (Bethlehem & Biffignandi 2012.)

Tiedonkeruuta testataan monin tavoin

Tietojen laadunvarmistukseen on onneksi keinoja. Tärkein keino on ammatti­taitoinen ja huolellinen lomake­suunnittelu, joka Tilastokeskuksessa osataan. Olennaista on myös lomakkeiden testaus aidoilla vastaajilla. Testaus voi olla joko laadullista tai kvantitatiivista, ja molempia tarvitaan näin laajamittaisen uudistuksen yhteydessä.

Laadullisessa testauksessa mukana on pieni joukko vastaajia, joita pyydetään vastatessaan kertomaan siitä, miten he lomakkeen kysymykset ymmärtävät ja miltä vastaamis­kokemus tuntuu. Laadullinen testaus on joustavaa ja kustannustehokasta, ja sen avulla saadaan arvokasta tietoa lomakkeen kehittämiseksi. Erityisen hyödyllistä laadullinen testaus on silloin, kun halutaan tutkia jonkin rajatun, juuri kyseiselle tiedonkeruulle kriittisen kohderyhmän vastaamista.

Kvantitatiivisessa testauksessa kyse on pilottitutkimuksesta, jossa tutkimus­asetelma on lähellä aitoa tiedonkeruuta ja vastaajajoukot melko laajoja. Pilottitutkimus on usein eräänlainen kenraaliharjoitus, jonka avulla voidaan varmistua tiedonkeruun toimivuudesta ennen muutosten käyttöönottoa varsinaisessa tiedonkeruussa. Pilotti­tutkimuksen tuloksia voidaan tutkia tilastollisin menetelmin ja siten selvittää esimerkiksi muutoksia keskeisissä indikaattoreissa.

Tänä vuonna Tilastokeskus toteuttaa yhdistelmätiedonkeruun käyttöön­ottoon liittyvää laadullista testausta työvoima­tutkimuksessa ja asuntojen vuokra­tiedustelussa sekä kvantitatiiviset pilottitutkimukset väestön tieto- ja viestintä­tekniikan käyttö -tutkimuksessa ja työvoima­tutkimuksessa. Testikierrosten tuloksia saadaan käyttöön vaiheittain vuosien 2015–2016 aikana, ja niitä hyödynnetään yhdistelmä­tiedonkeruun käyttöönoton suunnittelussa.

Vastauskokemus vaikuttaa katoon

Lomakesuunnittelu on tärkeää paitsi tietojen laadun kannalta, myös kadon hillitsemisen keinona. Vastauskadon kasvu on yksi keskeisimmistä huolenaiheista henkilö­tiedonkeruissa.

Yrityksille ja yhteisöille tilastotiedonkeruisiin vastaaminen on usein pakollista, mutta kansalaisten osallistuminen perustuu vapaaehtoisuuteen. Haastattelujen yhteydessä haastattelija voi suostutella vastahakoistakin vastaajaa jatkamaan kyselyn loppuun, mutta verkossa vastatessaan vastaaja on omillaan. Jos vastaaminen tuntuu hankalalta tai epämiellyttävältä, verkossa kyselyyn vastaaminen on helppo lopettaa.

Tiedonkeruulomakkeiden tekniseen toimivuuteen ja käytettävyyteen sekä sisällön ymmärrettävyyteen on siis panostettava, jotta vastaaminen olisi mahdollisimman miellyttävä kokemus. On myös kiinnitettävä erityistä huomiota vastaajien motivointiin tiedonkeruu­materiaaleissa (kuten tiedonkeruusta kertovissa saatekirjeissä ja Tilastokeskuksen verkkosivuilla).

Erityisen tärkeää motivointi on toistuvien tiedonkeruiden kohdalla; esimerkiksi työvoima­tutkimuksessa saman vastaajan pitäisi pysyä mukana kaikkiaan viisi ja tulo- ja elinolotutkimuksessa neljä tiedonkeruukertaa. Vastaamis­kokemuksen laatu vaikuttaa ilman muuta siihen, miten innokkaasti vastaaja seuraavalla kerralla lähtee lomaketta täyttämään.

Tietoturva on varmistettava

Vastaajan tietoturvasta huolehtiminen on ensiarvoisen tärkeää kaikissa tiedonkeruissa. Yksittäisen vastaajan antamat tiedot ovat ehdottoman luottamuksellisia, ja myös verkko­tiedon­keruun puolella on varmistuttava siitä, ettei vastauksia pääse vuotamaan tiedonkeruu­järjestelmän ulkopuolelle. Vastaajien luottamuksen säilyttäminen on Tilastokeskukselle ensiarvoisen tärkeää, eikä tietoturva saa vaarantua missään olosuhteissa.

Tietoturvaan liittyy myös se, että varmistutaan vastaajan henkilöllisyydestä. Tilastokeskuksen henkilö­tiedonkeruut perustuvat väestö­tieto­järjestelmästä poimittuun satunnaisotokseen. Vastaajaksi käy vain otokseen poimittu henkilö, eikä alkuperäistä vastaajaa voi korvata toisella henkilöllä. Usein lomakkeelle on viety valmiiksi tietoja, jotka ovat peräisin saman tiedonkeruun edelliseltä vastauskerralta, joten luonnollisesti on tärkeää, että tiedot ovat vain vastaajan itsensä nähtävissä.

On siis rakennettava tunnistautumisjärjestelmä, jonka kautta otokseen valittu pääsee kirjautumaan lomakkeelle. Järjestelmä varmistaa, että kyse on juuri oikeasta henkilöstä. Pankki­tunnukset ovat varsin yleisesti käytössä viranomaisten internet-palveluissa. Pankkitunnusten kautta kirjautuminen on yksi vaihtoehto myös Tilastokeskuksen verkko­tiedon­keruissa.

Toinen vaihtoehto on käyttää erikseen määriteltäviä kirjautumis­tunnuksia, jotka lähetetään vastaajalle henkilökohtaisen saatekirjeen mukana. Molemmissa ratkaisuissa on hyvät ja huonot puolensa, ja ne soveltuvat vaihtelevasti eri tiedonkeruiden tarpeisiin. Lopullinen käyttöön otettava järjestelmä tuleekin todennäköisesti olemaan jonkinlainen yhdistelmä eri ratkaisuja.

Verkkovastaaminen ei tuo nopeita säästöjä

Verkkotiedonkeruuta kehitetään parhaillaan myös muissa Euroopan tilastovirastoissa. Työ on edennyt varovaisin askelin, eikä täysin valmista ratkaisua ole tarjolla missään. Tiedonkeruiden ja maiden lähtötilanteen erilaisuudesta johtuen samat ratkaisut eivät toimi kaikissa maissa. Samassa tilanteessa Suomen kanssa ovat vain muut Pohjoismaat ja muutama muu Euroopan maa kuten Hollanti, Viro ja Itävalta.

Selvää kuitenkin on, että verkkotiedonkeruun käyttöönotto on lähi­tulevaisuuden tavoitteena kaikissa Euroopan tilastovirastoissa. Tähän vaikuttavat paitsi tietoteknisten välineiden läpimurto, myös toive säästää tiedon­keruu­kustannuksissa.

Uusi tiedonkeruumenetelmä ei tuo ihmepelastusta tilastovirastojen budjetteihin. Kehittämistyö vaatii resursseja ja kustannushyödyt realisoituvat vasta pitkällä tähtäimellä, kun yhdistelmä­tiedonkeruu saadaan käyttöön täysimittaisesti. Ajan myötä vastaajat oppivat kuitenkin varmasti hyödyntämään verkko­vastaamisen hyviä puolia, ja verkko­tiedon­keruiden suunnittelusta tulee rutiinia myös tilastoviranomaiselle.

Kirjoittaja toimii yhdistelmätiedonkeruusta vastaavana projektipäällikkönä Tilastokeskuksen tiedonhankinta-yksikössä.

 

Lähteet:

Bethlehem, Jelke & Biffignandi, Silvia 2012. Handbook of Web Surveys. Hoboken, New Jersey: John Wiley & Sons.

Jokinen, Marika & Järvensivu, Marjaana 2014. En osaa sanoa -vastaaminen verkkokyselyissä. Hyvinvointikatsaus 4/2014.


Sivun alkuun >>

Kommentit (0 kommenttia)