Pyöräililjöitä

Random forest -algoritmi auttaa tunnistamaan potentiaalisimmat pyöräilyn edistämistoimien kohderyhmät

Johannes Mesimäki

Kestävien kulkutapojen osuutta pyritään kasvattamaan ympäri maailmaa ilmastonmuutoksen hillitsemiseksi, ja tähän pyrkivät strategiat nojaavat usein jalankulun ja pyöräilyn edistämiseen. Suomessa valtakunnallisen kävelyn ja pyöräilyn edistämisohjelman tavoitteena on kasvattaa kävely- ja pyöräilymatkoja 30 % vuoteen 2030 mennessä (LVM, 2018). Lisäksi monella kunnalla on oma kävelyn ja pyöräilyn edistämisohjelmansa.

Kestäviä kulkutapamuutoksia edistävät toimenpiteet ovat usein tehokkaampia, jos ne suunnitellaan ja kohdistetaan tietyille ryhmille (Anable, 2005; Haustein & Hunecke, 2013). Pyöräilyä lisäävien toimien suunnittelussa voi olla hyödyllistä tietää miten suomalaiset liikkujat jakautuvat erilaisiin segmentteihin esimerkiksi sosioekonomisen asemansa tai asuinpaikkansa perusteella, jotta toimet vastaisivat segmenttien liikkumistarpeisiin.

Tässä blogitekstissä esitellään STYLE-tutkimuksen osana toteutettua hanketta, jossa suomalaisia liikkujia segmentoitiin erilaisiin pyöräileviin ja ei-pyöräileviin ryhmiin soveltamalla random forest (suom. satunnainen metsä) -algoritmia vuoden 2016 valtakunnallisen henkilöliikennetutkimuksen (HLT) kyselyaineistoon (Liikennevirasto, 2018). Lisäksi arvioitiin segmenttien pyöräilypotentiaalia.

Random forest -menetelmä

Random forest -algoritmilla luotiin malli, joka pyrkii tunnistamaan HLT-aineiston aikuisvastaajista pyöräilijät. Pyöräilijäksi määriteltiin henkilö, joka pyöräilee vähintään 4–5 päivänä viikossa.

Algoritmi luokittelee vastaajat luomalla tuhansia yksittäisiä päätöspuita, jotka pyrkivät jakamaan vastaajat mahdollisimman selkeisiin pyöräileviin ja ei-pyöräileviin joukkoihin ominaisuuksiensa perusteella (esimerkki kuvassa 1). Päätöspuut luokittelevat erikseen jokaisen vastaajan, ja vastaajan lopulliseksi luokaksi tulee kaikkien päätöspuiden yleisin päätös. Päätöspuista tulee hieman erilaisia antamalla satunnaisuuden vaikutta jokaisen puun luomiseen. Tämän tarkoituksena on vähentää aineiston aiheuttamaa vinoumaa ja parantaa luokittelun tarkkuutta.

Kuva 1. Hypoteettinen esimerkki random forest -algoritmin päätöspuiden logiikasta. Luvut viittaavat ryhmissä olevien tapausten lukumääriin. Loppupisteen enemmistöluokkaa käytetään tekemään ennusteita uusille tapauksille.

Segmenttien muodostamista varten malli laski vastaajien väliset etäisyydet, jotka perustuivat luokittelujen samankaltaisuuteen. Lähekkäiset vastaajat ovat tyypillisesti ominaisuuksiltaan lähempänä toisiaan kuin etäiset, ja lähekkäisten vastaajien ryhmittymät poimittiin hierarkkisen klusteroinnin avulla. Ryhmittymät laajennettiin koko väestöä edustaviin segmentteihin käyttämällä HLT-aineiston valmiita laajennuskertoimia.

Lopuksi segmenttien pyöräilypotentiaalia tarkasteltiin estimoimalla HLT-aineiston matkatiedoista, kuinka paljon jokaisessa segmentissä tehdään pyöräiltävissä olevia, mutta autolla ajettuja matkaketjuja. Pyöräiltävän matkaketjun määritelmänä oli, että ketju alkaa ja päättyy kotiin, on ajettu kokonaan yksin autolla ja sen sisältämät matkat ovat maksimissaan viiden kilometrin pituisia. Lisäksi minkään matkan pääasiallisena tarkoituksena ei saanut olla työasia, ostosmatka päivittäistavarakauppaan tai kyyditseminen.

Henkilöliikennetutkimuksen aineistoista löytyneet liikkujasegmentit

Random forest -algoritmilla ja hierarkkisella klusteroinnilla muodostettiin kahdeksan keskenään eriävää liikkujasegmenttiä (huom. autoilijan, kävelijän ja joukkoliikennettä käyttävän vastaajan määritelmänä pidetään kulkutavan käyttöä 4–5 päivää viikossa):

  1. Kaupunkialueiden ulkopuoliset keski-ikäiset työssäkäyvät autoilijat (n ≈ 1 301 000)
  2. Harvemmin liikkuvat pienituloiset eläkeläiset ja työttömät (n ≈ 1 198 000)
  3. Keski-ikäiset työssäkäyvät kävelevät autoilijat (n ≈ 546 000)
  4. Työssäkäyvät ja opiskelevat julkisilla liikkuvat urbaanit nuoret aikuiset (n ≈ 352 000)
  5. Auton omistavat mutta sen käyttöä välttävät työssäkäyvät keski-ikäiset (n ≈ 301 000)
  6. Urbaanit työssäkäyvät ja eläkkeellä olevat hyvätuloiset autoilijat (n ≈ 374 000)
  7. Kaupunkialueille painottuvat, aktiivisesti liikkuvat työssäkäyvät ja opiskelijat (n ≈ 370 000)
  8. Autoilijat joilla on rajallinen mahdollisuus käyttää autoa (n ≈ 141 000)

Segmentit erottuvat erityisesti liikennekäyttäytymisen, asuinympäristön ja elämäntilanteen mukaan. Vastaajat jakautuivat useampaan autoilijaryhmään, yhteen joukkoliikenneryhmään, yhteen aktiivisesti liikkuvien ryhmään sekä yhteen harvemmin liikkuvaan ryhmään. Segmentit eroavat myös kooltaan: Kaupunkialueiden ulkopuolisten keski-ikäisten autoilijoiden segmentti vastaa suurinta väestömäärää, kun taas autoilijat joilla on rajallinen mahdollisuus käyttää autoa vastaa pienintä.

Segmenttien muodostamiseen vaikuttaa suuresti tiedot jota algoritmi saa. HLT-aineisto ei esimerkiksi sisällä lainkaan tietoa vastaajien asenteista eri liikkumistapojen käyttämistä kohtaan, jotka voisivat muuttaa kuvaa.

Millä segmenteillä eniten potentiaalia siirtyä autoilusta pyöräilyyn?

Kuudessa segmenteistä tehdään pyöräiltäviä automatkoja. Näistä kertyy pyöräilykauden aikana (puolessa vuodessa) yhteensä noin 52 miljoonaa matkaketjua ja 470 miljoonaa kilometriä. Luku vastaa noin 1 % yhden vuoden henkilöautosuoritteesta (Liikennevirasto, 2018). Urbaanit työssäkäyvät ja eläkkeellä olevat hyvätuloiset autoilijat tekevät eniten pyöräiltäviä mutta autolla ajettuja matkaketjuja (noin 0,15 per henkilö per päivä). Vastaava luku on pienin (noin 0,03) harvemmin liikkuvien eläkeläisten ja työttömien segmentissä.

Tarkastelu paljastaa, että käytetyn määritelmän mukaisia pyöräiltävissä olevia automatkoja on suhteellisen pieni määrä. Vaikka kaikki potentiaalisesti pyöräiltävät matkaketjut taitettaisiin pyörällä, kulkutapaosuuden muutos ei olisi erityisen suuri. Pyöräilyn kulkutapaosuus on jo nykyisellään Suomessa pieni, edustaen vain noin 8 % kaikista matkoista (Liikennevirasto, 2018). Pyöräilyn edellytyksiä olisikin hyvä parantaa myös liikennejärjestelmäsuunnittelun tasolla, jotta suurempi määrä matkoista olisi pyöräiltävissä. Toisaalta, kyse on noin 100 kilometristä per henkilö, jonka positiiviset terveysvaikutukset voivat olla jo huomattavat.

Tulosten mukaan suomalaiset jakautuvat ominaisuuksiltaan ja pyöräilypotentiaaliltaan erilaisiin liikkujasegmentteihin. Segmenttien ominaisuustiedot mahdollistavat toimenpiteiden entistä paremman kohdistamisen ja vaikuttavuuden. Lisäksi pyöräilypotentiaalin arvioiminen antaa myös käsityksen siitä, millä segmenteillä on suurin potentiaali siirtyä autosta pyöräilyyn. Hanke jatkuu tulosten tarkemmalla tulkinnalla ja suositusten laadinnalla.

Johannes Mesimäki
Tutkija, Teknologian tutkimuskeskus VTT Oy

Lähteet

Anable, J. (2005). ‘Complacent Car Addicts’ or ‘Aspiring Environmentalists’? Identifying travel behaviour segments using attitude theory. Transport Policy, 12(1), 65–78. https://doi.org/10.1016/j.tranpol.2004.11.004

Haustein, S. & Hunecke, M. (2013). Identifying target groups for environmentally sustainable transport: Assessment of different segmentation approaches. Current Opinion in Environmental Sustainability, 5(2), 197–204. https://doi.org/10.1016/j.cosust.2013.04.009

Liikennevirasto (2018). Henkilöliikennetutkimus 2016: Suomalaisten liikkuminen (Nro 1/2018). Helsinki: Liikennevirasto.

LVM (2018). Kävelyn ja pyöräilyn edistämisohjelma (Nro 5/2018; s. 43). Helsinki: Liikenne- ja viestintäministeriö.


Kuvituskuva: Jonny Kennaugh, Unsplash