2_Webstore_smallWeb analytiikka ja siihen liittyvät henkilötietosuoja-asiat ovat olleet jo pidemmän aikaa pinnalla. Henkilötietojen suojaamisesta ei kuule useinkaan puhuttavan ennen kuin jotain on jo mennyt mönkään. Useimmiten asiat on hoidettu hyvin. Kuitenkin toisinaan sattuu vahinkoja, joiden ei olisi tarvinnut tapahtua.

Miksi mokia sitten sattuu? Osittain syynä saattaa olla tietämättömyys: aina ei täysin ymmärretä, millaista tietoa saa ja ei saa lähettää analytiikkaan ja mitä kaikkia muita asioita pitäisi huomioida. Puutteet ovat useimmiten pienien yritysten riesa, mutta eniten ääntä syntyy, kun jonkin ison yrityksen tiedonkeruussa tapahtuu tietosuojaan liittyvä virhe.

Pysähdytäänpä siis hetkeksi pohtimaan tietosuojaa ja tietoja, joita analytiikkaan ei saa lähettää. Seuraavassa lyhyt lista asioista, jotka ainakin sivustolta on löydyttävä.

  • Sivuston ylläpitäjän on kerrottava selvästi kävijälle, että hänestä kerätään tietoa ja mihin tarkoituksiin tietoa käytetään. Usein tällaiset asiat kerrotaan tietosuojaa käsittelevällä sivulla. Viimeaikoina on yleistynyt tietojen keruusta kertova popup, jonka kävijä voi joko hyväksyä tai olla hyväksymättä.
  • Sivustolla on oltava tietosuojalauseke, jossa kerrotaan, mitä tietoa kerätään, mihin sitä käytetään ja kuinka kauan sitä säilytetään.
  • Sivustolla olisi kerrottava myös evästeiden käytöstä – mihin niitä käytetään ja millaisia evästeitä sivustolla on käytössä
  • Kävijällä pitäisi aina olla myös mahdollisuus estää itsensä seuraaminen.

Mikä on henkilötietoa?

Suomen laissa on kirjaus siitä, mitkä asiat määritellään henkilötiedoiksi:

”Henkilötiedolla tarkoitetaan luonnollista henkilöä taikka hänen ominaisuuksiaan tai elinolosuhteitaan kuvaavia merkintöjä, jotka voidaan tunnistaa häntä, tai hänen perhettään tai hänen kanssaan yhteisessä taloudessa eläviä koskeviksi.”

Myös Google on antanut selkeät ohjeet, mitä tietoa saa kerätä analytiikkaan. Analytiikkaan ei saa lähettää verkkosivuston käyttäjän nimeä, sosiaaliturvatunnusta, osoitetta, sähköpostiosoitetta, puhelinnumeroa tai muuta vastaavaa tietoa. Analytiikkaan ei myöskään saa lähettää tietoa, jonka avulla voidaan tunnistaa jokin tietty laite pysyvästi. Google kieltää kaiken sellaisen datan tallentamisen, joka voidaan yhdistää henkilötietoihin pelkkää analytiikkadataa käyttäen.

Miten tietoa käsitellään web-analytiikassa?

Google Analyticsiin kerätään anonyymiä tietoa verkkosivustojen kävijöiden käyttäytymisestä. Tiedot lähetetään tyypillisesti sivujen latautumisen yhteydessä: mistä tai miten sivustolle on tultu, kauanko sivustolla on viivytty, monellako sivulla on käyty tai millä sivuilla on käyty. Tämän kaltaisten tietojen kerääminen ei kuitenkaan saa rikkoa kenenkään henkilötietosuojaa.

On kuitenkin huomioitava, että analytiikassa näkyy sivuston url-osoitteet. Urani aikana olen muutaman kerran nähnyt, että osoitteisiin on eksynyt henkilötietojakin. Ylläpitäjien tulisikin sivustoja kehittäessään olla tarkkana, mitä tietoa urlissa näkyy. Otetaan yksinkertainen esimerkki: Kirjautumisen mahdollistavissa palveluissa on usein mahdollista muokata käyttäjätunnusta. Käyttäjän itse muokkaama käyttäjätunnus voidaan katso henkilötiedoksi, koska se voi sisältää esimerkiksi nimen. Tällöin kannattaa varmistaa, että tunnus ei valu urliin vahingossakaan. Useimmiten käyttäjätunnus korvataankin urlissa numerosarjalla. Viimeisimpänä muistutuksena tilanteesta, jossa Url-osoitteeseen pääsi sinne kuulumattomia asioita, toimii S-pankkiin liittyvä kohina.

Sivun osoite on yksi paikka, jota kautta arkaa tietoa voi päätyä analytiikkaan näkyville. On kuitenkin syytä huomioida, että analytiikkaan voidaan lähetetään tietoa muillakin tavoin. Esimerkiksi eventtien avulla voidaan mitata asioita, joita ei perusseurannalla voida. Eventtejä käytetään yleensä erilaisten painikkeiden ja lomakkeiden seuraamisessa. Toinen tapa rikastuttaa dataa on tuottaa informaatiota datalayerin kautta, esimerkiksi ostokäyttäytymisestä. Tällöinkin on syytä varmistaa, ettei eventteillä tai dataleyereilla kerättyyn tietoon päädy arkaluontoisia asioita.

Lyhyesti sanottuna analytiikkaan ei saa joutua mitään sellaista tietoa, joka on tulkittavissa henkilötiedoksi.

Rikos, seuraamus ja vastuu

Web-analytiikka ei ole oma yksinäinen saarensa, ja myös siellä rikkomuksella on seurauksensa. Kasvojen, maineen ja asiakkaiden lisäksi menetetään yleensä myös data. Mikäli analytiikkaan pääsee henkiötietoja loukkaavaa aineistoa, langettaa Google rangaistuksensa joko sulkemalla korruptoituneen tilin kokonaan tai poistamalla sieltä kaiken datan. Pienestä näpäytyksestä ei ole kyse: kävijäseurannassa on usein erittäin arvokasta tietoa, ja olisi sääli menettää kaikki vaivalla kerätty tietämys yhden sattumuksen takia.

Googlen kurinpalautus ei kuitenkaan riitä: usein yritykselle seuraa myös epämieluisaa julkisuutta ja toisinaan oikeuskäsittelyitäkin. Oikeussali-istuntoja ajatellen on hyvä muistaa, että vaikka tieto on päässyt Googlen järjestelmiin, siitä vastaa loppukädessä sivuston ylläpitäjä.

Summa summarum

Jos henkilötietoasioiden ja analytiikan äärellä herää epäilys, onkohan kaikki kunnossa, kannattaa toimia nopeasti. Suosittelenkin lämpimästi olemaan yhteydessä joko organisaationne tekniikkaan tai ulkopuoliseen tahoon, joka voi auttaa selvittämään asiaa.

Tässä vielä muutama linkki, joiden avulla pääset liikkeelle.

Universal Analyticsin yleisohje käyttäjälle
Google Analyticsin käyttöoehdot