4 yleisinta google analytics virhetta

Google Analytics on ihan hyvä työkalu, koska se tekee minkä lupaa ja on verrattain helppokäyttöinen. Koulutuksissa ja asiakastyössä olen kuitenkin törmännyt muutamaan kohtaan, joissa Google Analyticsiä tulkitaan toistuvasti väärin tai käytetään tyhmästi. Näihin sudenkuoppiin ovat pudonneet niin ensikertalaiset kuin pitkän linjan analyytikotkin – myös tämän tekstin kirjoittaja aikoinaan. Jonkinlaiseksi synninpäästöksi kerronkin nyt neljä yleisintä Google Analytics -mokaa korjausehdotuksineen.

4. Sivulla vietetty aika

Google Analytics tilastoi sekä kokonaisten sessioiden pituuden että sivukohtaisesti kullakin sivulla keskimäärin vietetyn ajan. Näistä kahdesta sivulla vietetty aika on ongelmallisempi tulkittava, sillä siinä (toisin kuin yleensä oletetaan) sivukohtaisesti aika mitataan ainoastaan niistä sivulatauksista, joita seuraa jokin toinen sivulataus samalla sivustolla.

Jos siis 9 kävijää lataa sivun A ja poistuu sivustolta klikkaamatta mitään muuta sivua, ja 1 kävijä lataa sivun A ja 5 minuuttia myöhemmin lataa sivun B, keskimääräinen sivulla A vietetty aika on 5 minuuttia. Tämä on harhaanjohtavaa, sillä mittaus perustuu vain 10 %:n touhuihin – loput 90 % ovat poissa laskuista. Mitä suurempi poistumisaste sivulla on, sitä pienempään otokseen kaikista sivulla kävijöistä keskimääräinen sivulla vietetty aika perustuu.

Yksinkertaisin ratkaisu ongelmaan on se, että sivulla vietettyä aikaa ei kannata liiemmin vilkuilla. Tai ainakin kannattaa varmistaa, ettei ko. sivu ollut käynnin viimeinen sivu kuin murto-osassa sivulatauksia. Parempi mittari ajan mittaamiseen on session duration eli koko käynnin pituus, jossa keskiarvoon otetaan mukaan myös ainoastaan yhden sivulatauksen sisältäneet käynnit arvolla nolla. Tarkempaa tietoa ajan mittaamisesta Google Analyticsissä löytyy täältä.

3. Propertyjen määrä

Google Analyticsin tilirakenne on kolmiportainen. Ylimmällä tasolla on Account, joka tyypillisesti on yrityksen nimi. Yhdellä yrityksellä voi olla useita Propertyjä eli sivustoja, ja yksi sivusto voi olla jaettu yhteen tai useampaan Näkymään (view).

Tilinhallinnassa yleisin virhe liittyy propertyjen määrään. Aivan liian usein loppukäyttäjän näkökulmasta yhden ja saman sivuston tulokset on turhaan pilkottu useaan eri propertyyn joko osioittain tai ajallisesti. Lopputuloksena data on siiloutunut useaan eri paikkaan, ja pahimmillaan jopa käyntien kokonaismäärän arviointi on mahdotonta.

Ratkaisu on helppo: Kun suunnittelet tilirakennetta, mittaa osaksi samaa propertyä kaikki sellainen, joka loppukäyttäjänkin näkökulmasta on osa samaa verkkopalvelua, vaikka domain matkalla vaihtuisikin. Ja aivan ehdottomasti kannattaa pidättäytyä luomasta uutta propertyä jokaisen sivustouudistuksen yhteydessä. Tyypillisesti tämä nyrkkisääntö toimii hyvin: mitä vähemmän eri propertyjä on, sitä laadukkaampaa ja kokonaisvaltaisempaa dataa kukin niistä sisältää. Jos fiksu tilinhallinta Google Analyticsissä kiinnostaa, kannattaa lukaista tämä.

2. Liikenteen lähteet filtteröidyssä näkymässä

Myös toiseksi yleisin virhe liittyy tilirakenteeseen – tarkemmin sanottuna tulosten tulkintaan silloin, kun propertyn alle on luotu vain tietyn osion tulokset sisältäviä näkymiä. Esimerkiksi mediamaailmassa yleinen ratkaisu on se, että pelkkiä uutisartikkeleja halutaan analysoida myös yhtenä kokonaisuutena erikseen muista tuloksista.

Vaikka eri sisältöryhmien mittaaminen omiksi näkymiseen (EI propertyikseen) on analytiikassa järkevää ja suositeltavaa, tässäkin piilee sudenkuoppa. Ongelma nimittäin on se, että koko käynnin liikenteen lähde periytyy kokonaistasolta, mutta aloitussivuna näkymäkohtaisissa filtteröidyissä tuloksissa näytetään kuitenkin ensimmäinen ko. näkymään kuuluva sivu, ei välttämättä koko käynnin aloitussivua. Jos esimerkiksi kävijä tulee Google-hausta median etusivulle ja jatkaa siitä artikkeliin A, näyttää pelkät uutisartikkelit sisältävä näkymä, että kävijä tuli Google-hausta suoraan artikkeliin A. Tämä on vähintäänkin harhaanjohtavaa.

Jos halutaan tietää, mistä liikenteen lähteistä nimenomaan tiettyyn osioon tultiin suoraan, onkin käytettävä osiokohtaisen näkymän sijasta kaikki tulokset sisältävää All Data -näkymää, ja luotava sen alle segmentti niistä käynneistä, joissa käynnin aloitussivu on ko. osioissa.

1. Sessions by Pages

Selkeästi yleisin, vahingollisin ja kaikkein vaikeimmin selitettävä virhe liittyy käyntien määrän mittaamiseen sivukohtaisesti.

Sivukohtaisen liikennemäärän perusmittari on sivulataukset. Ne kertovat, kuinka monta kertaa tietty sivu on ladattu. Joskus kuitenkin halutaan saada selville sivulatausten sijasta se, kuinka moni käynti sisälsi tietyn sivun. Tavoite on se, että käynti, jonka aikana tietty sivu ladattiin viisi kertaa, näkyykin tuloksissa vain yhtenä käyntinä ko. sivulle.

Tuntuisi siis loogiselta vetää ristiin sivun nimi (Page) Sessions-metriikan kanssa, eikö totta? Väärin menee. Tämä on tolkuttoman yleistä, eikä Google Analytics harmillisesti edes herjaa mokasta. Sivutasolla tarkasteltuna Sessions ei nimittäin tarkoita suinkaan sitä, kuinka moni käynti sisälsi tietyn sivun, vaan mittausteknisistä syistä suunnilleen sitä, kuinka moni käynti alkoi tietyltä sivulta.

Ratkaisu on hyvin yksinkertainen: Älä koskaan vedä ristiin sivun nimeä käyntien määrän kanssa. Tätä varten Google Analytics tarjoaa toisen mittarin: Unique Pageviews. Käytä sivukohtaisia käyntimääriä selvittäessäsi siis Unique Pageviews -lukua, älä sessioita. Haaste liittyy Google Analyticsin scope-käytäntöön, josta voi lukea lisätietoja vaikkapa täältä.

No niin. Nyt on kevyempi olo. Kiitos ja antoisaa analyysiä kaikille.