4. helmikuuta 2016, 9.24 Kirsti Ahlqvist

Edustavuuden ajatus joutuu koetukselle verkkokyselyjen maailmassa

Verkossa tehtävät kyselyt ovat lisääntyneet valtavasti viime vuosina. Niitä tehdään eri medioiden sivustoilla ja sosiaalisessa mediassa. Verkko­kyselyiden suosio perustuu niiden edullisuuteen – kustannukset ovat alhaiset ‒ ja nopeuteen – tulokset saadaan nopeammin kuin perinteisessä tietojen­keruussa. Usein niihin saadaan myös suuri määrä vastauksia.

Palvelun­tuottajat tekevät kyselyjä omille asiakkailleen, media selvittää ihmisten mielipiteitä tehdäkseen niistä sisältöä. Hauska esimerkki on Ylen urheilu­toimituksen yhdessä Kilpa- ja huippu-urheilun tutkimus­keskuksen Kihun asian­tuntijoiden kanssa toteuttama testi suomalaisille parhaiten sopivasta liikunta­lajista. Yllättäen sopivimmiksi lajeiksi tulivat tennis, paini ja jää­kiekko.

Myös vakavan tutkimustiedon keräämisessä hyödynnetään nykyisin sähköisiä medioita. Tästä yhtenä esimerkkinä on köyhyys­tutkijoiden ja Helsingin Sanomien yhteis­työnä toteuttama Helsingin Sanomien verkko­sivujen kysely ihmisten suhtautumisesta köyhyyteen. Yllättävän tuloksen mukaan rikkaat ihmiset suhtautuvat varsin tylysti köyhiin. Provosoiko verkko esittämään kärjekkäitä mielipiteitä?

Verkko­kyselyt poikkeavat siitä, miten aiemmin on ajateltu kyselyiden tekemisen periaatteista. Erityisesti kysymys saadun aineiston edustavuudesta herättää huolta. Keiden mielipiteitä ja käsityksiä tietyillä sivustoilla vastaamassa käyvien mielipiteet edustavat? Verkko­vastaamisen edustavuutta perustellaan usein suurella vastaajien määrällä. Ylen kyselyyn on vastannut yli 200 000 ihmistä ja Helsingin Sanomien kyselyynkin lähes 10 000.

Vastaajien määrä ei kuitenkaan riitä edustavuuden takaamiseen. Jo pelkästään se, että kaikki eivät vielä käytä verkko­palveluita, vinouttaa vastaus­jakaumia.

Tilasto­keskuksen Väestön tieto- ja viestintätekniikan käyttö -tutkimuksen mukaan iäkkäimmistä (75-89-vuoitiasta) peräti 70 prosenttia ei ollut käyttänyt internetiä viimeisen kolmen kuukauden aikana. Tätä nuoremmastakin ikäluokasta (65-74-vuotiaista) lähes kolmannes ei ollut käyttänyt nettiä. Myös alhainen koulutus tarkoittaa muita vähäisempää netin käyttöä.

Tietyllä verkko­sivustolla vierailevat lienevät valikoitunutta joukkoa. Kihun asian­tuntija arveli erikoisten tulosten perusteella, että nuoret antoivat sopivaa liikunta­lajia koskevaan testiin vähemmän vastauksia kuin iäkkäät.

Keiden mielipiteitä ja käsityksiä tietyillä sivustoilla vastaamassa käyvien mielipiteet edustavat?

Väestöä koskevien tietojen edustavuus on perinteisesti perustunut kahdelle menettelylle: kokonais­tutkimukselle ja otos­tutkimukselle. Tutkimus­aineistojen edustavuuden kysymys on herättänyt into­himoja niin kauan kuin väestöä koskevia tietoja on haluttu tuottaa. Otanta­teorian kehittäjät kohtasivat Kansain­välisessä tilasto­instituutissa voimakasta kritiikkiä kokonaistutkimusten kannattajien taholta 1800-luvun lopulla.

Otanta­tutkimukset yleistyivät varsinaisesti 1950-luvulta lähtien. Rekisterien käyttö tilastoinnissa ja tutkimuksessa on myös herättänyt vastustusta. Onkin muistettava, että kaikilla tiedon­keruun tavoilla on omat ongelmansa ja etunsa.

Edustavuuden vaatimus toteutetaan otos­tutkimuksissa tietyin periaattein ja menettelyin mm. määrittämällä tutkimuksen kohde­perusjoukko ja huolehtimalla siitä, että vastaajat jakautuvat otoksessa samoin kuin perus­joukossa.

Mikäli otos edustaa sitä perus­joukkoa, jota oli tarkoitus tutkia, voidaan aineiston perusteella laskea erilaisia tunnus­lukuja kuten keski­arvoja ja jakaumia, tehdä väestö­ryhmiä koskevia vertailuja tai tutkia syy- ja seuraussuhteita.

Otostutkimuksen ehtojen toteututtua voidaan analysoida myös tutkimuksen katoa ja sen mahdollista systemaattista vinoutta ja muita systemaattisia virheitä sekä arvioida, miten ne vaikuttavat aineistosta tehtäviin johtopäätöksiin.

Näiden virheiden vaikutusta pystytään nykyisin myös korjaamaan. Otos­tutkimusten ongelmana ovat pienet otos­koot ja yhäti kasvava kato, jotka vähentävät yksityis­kohtaisia vertailu­mahdollisuuksia.

Otostutkimusten ehdot toteutuvat harvoin verkko­kyselyissä ainakin, jos halutaan tutkia koko väestöä. Parhaiten verkko­kyselyt soveltunevat rajatulle joukolle - esimerkiksi tietylle organisaatiolle - jolloin kohde­perusjoukko tunnetaan, ja kato­analyysi voidaan mahdollisesti tehdä.

Verkkokyselyiden edustavuutta on kuitenkin mahdollista arvioida, jos vastaajista on tiedossa sosio-demografisia tai alueellisia tietoja. Olemassa olevien väestön rakenne­tietojen perusteella jakaumia voidaan vertailla ja saada käsitys verkko­kyselyyn vastanneista.  

Verkossa tehdyillä kyselyillä ja niiden edustavuudella on merkitystä. Ne ovat nykyisin median suosimaa sisältöä ja niiden välittämästä viestistä muodostuu helposti yleisinä käsityksinä pidettyjä tosiasioita. Olisi tärkeää huolehtia siitä, että mikään väestö­ryhmä ei jäisi vastaamisen ulko­puolelle ja että aineistojen analyysissä kiinnitettäisiin nykyistä enemmän huomiota, keiden mielipiteitä oikeastaan ollaan julkaisemassa.

Verkko­kyselyistä ja yleensäkin big datasta on muodostumassa uudenlainen tiedon­muoto, joka edellyttää teoreettista ja metodologista pohdintaa ja kehittämistä.

Blogikirjoitukset eivät ole Tilastokeskuksen virallisia kannanottoja. Asiantuntijat kirjoittavat omissa nimissään ja vastaavat kukin omista kirjoituksistaan.

Kommentit (0 kommenttia)