LoCard-tutkimus hyödyntää kaupan asiakasdataa uudella tavalla
LoCard-tutkimuksessa hyödynnetään kaupan kanta-asiakasjärjestelmän tuottamaa dataa tieteellisessä tutkimuksessa. Datan avulla on tutkittu esimerkiksi eri kuluttajaryhmien muutoksia kohti kestävämpää ruokavaliota, ruoanvalinnan motiiveja eri väestöryhmissä ja ruokaostosten hiilijalanjälkiä. Uusien datojen analysoiminen voikin tarjota yllättäviä mahdollisuuksia.
Data on tieteellisen tutkimuksen kriittisin tuotannontekijä. Ilman dataa ei ole empiirisiä havaintoja, joita tutkijat tarvitsevat teorioiden kehittämiseen ja testaamiseen sekä paremman ymmärryksen luomiseen muuttuvasta maailmasta. Tutkijoiden käytettävissä oleva aineisto määrittääkin pitkälti tutkimuksen tekemisen edellytyksiä. Huono data johtaa huonoon tutkimukseen, hyvä data mahdollistaa hyvän tutkimuksen.
LoCard-tutkimuksessa hyödynnetään kaupan kanta-asiakasjärjestelmän tuottamaa dataa tieteellisessä tutkimuksessa. Monitieteisen tutkimushankkeen päätutkijoita ovat biostatistiikan professori Jaakko Nevalainen Tampereen yliopistosta, ravitsemustieteen professorit Maijaliisa Erkkola ja Mikael Fogelholm Helsingin yliopistosta sekä allekirjoittanut Tampereen yliopistosta. Vuosien aikana mukaan on tullut laaja joukko muita tutkijoita, joiden erilaiset asiantuntemusalueet ovat rikastuttaneet ja laajentaneet tutkimusdatan hyödyntämisen mahdollisuuksia (ks. esim. https://locard.fi/). Kyseessä on kansainvälisestikin ainutlaatuinen tutkimushanke, jossa tutkijat tekevät innovatiivisella tavalla yhteistyötä yrityksen kanssa, mikä mahdollistaa uudenlaisen tutkimusaineiston keräämisen ja hyödyntämisen. Olemme toistaiseksi tunnistaneet vain kaksi muuta kansainvälistä tutkimusryhmää, jotka hyödyntävät kaupan kanta-asiakasjärjestelmän dataa samansuuntaisesti ja -laajuisesti kuin mitä LoCard-tutkimuksessa tehdään.
LoCard-tutkimusryhmä on vuodesta 2016 alkaen S-ryhmän myötävaikutuksella suunnitellut, kehittänyt ja hyödyntänyt suostumuksensa antaneiden asiakasomistajien ostodataa terveys- ja yhteiskuntatieteellisessä tutkimuksessa. S-ryhmän rooli on mahdollistaja: se antaa asiakasomistajille mahdollisuuden osallistua yliopistojen tutkimukseen, mutta ei määrittele tai ohjaa tutkijoiden tekemistä millään tavalla, eikä sillä ole pääsyä tutkimusaineistoon.
Kyse on huomattavasta datamäärästä; kesällä 2018 kerätty aineisto sisältää kaikkiaan yli 130 miljoonaa ostotapahtumaa liki 50 000 eri kotitaloudelta yli kahden vuoden ajalta. Valtaosa ostodatansa luovuttaneista asiakasomistajista vastasi myös suunnittelemaamme kyselylomakkeeseen, jolla kerättiin täydentävää tietoa kotitalouden rakenteesta, sosioekonomisesta asemasta, ruokaan liittyvistä asenteista ja muista taustatekijöistä. Vaikka aineisto ei sisällä ostettujen tuotteiden tarkkaa bränditietoa, tarjoaa se silti poikkeuksellisen laajan aineiston tarkastella erilaisten kuluttajaryhmien ostokäyttäytymistä tuoteryhmätasolla ajan kuluessa. Yksittäisiä kotitalouden ostoja ei milloinkaan tarkastella, vaan huomio on erilaisten väestöryhmien ostokäyttäytymisen tutkimisessa. Koko aineisto on pseudonymisoitu* ja tutkimushankkeelle on saatu Helsingin yliopiston tutkimuseettisen toimikunnan puolto.
”Datan kasvavasta liiketoiminnallisesta roolista on puhuttu kiihtyvään tahtiin jo vuosikymmen.”
LoCard-aineistosta tekee erityisen sen pitkittäinen luonne (data sisältää ostotietoja pitkältä aikaväliltä), objektiivisuus (data kertoo mitä on ostettu, ei mitä sanotaan ostettavan) ja yksityiskohtaisuus (data sisältää tietoa mitä, milloin ja missä postinumeroalueella on ostettu, paljonko se on maksanut ja mitkä ostot kuuluvat samalle pseudonymisoidulle kortinhaltijalle).
Datan avulla olemme tutkineet muun muassa eri kuluttajaryhmien muutoksia kohti kestävämpää ruokavaliota, alkoholilainsäädännön vaikutuksia, ruokaostosten hiilijalanjälkiä, ruokahävikin kuluttajasegmenttejä tai ruoanvalinnan motiiveja eri väestöryhmissä. Olemme parhaillaan suunnittelemassa uutta datankeruuta, joka toteutunee keväällä 2023. Uusi data mahdollistaisi monia mielenkiintoisia tutkimusasetelmia mm. koronapandemian ja inflaation vaikutusten tutkimisen eri väestöryhmissä. LoCard-tutkimuksen viimeisimpään vaiheeseen on saatu Suomen Akatemian rahoitus.
Datan kasvavasta liiketoiminnallisesta roolista on puhuttu kiihtyvään tahtiin jo vuosikymmen. Sen merkitystä on korostettu sanoen sen olevan bisneksen uusi öljy. Tutkijoiden näkökulmasta kyse on ennemminkin kiertotaloudesta: data tulee nähdä resurssina, joka ei välttämättä kulu yritysten käytössä loppuun, vaan luovuttamalla dataa tutkijoiden käyttöön siitä voidaan tuottaa tieteellisen tutkimuksen keinoin uudenlaista yhteiskunnallista arvoa.
”Luovuttamalla dataa tutkijoiden käyttöön siitä voidaan tuottaa tieteellisen tutkimuksen keinoin uudenlaista yhteiskunnallista arvoa.”
Kannustan tutkijoita, yrityksiä ja julkisia organisaatioita kehittämään uusia yhteistyömalleja, joilla organisaatioiden aitoa osto- tai muuta dataa saataisiin tietosuojakysymykset huomioiden laajemmin valjastettua tieteellisen tutkimuksen tekemiseen. Päivittäistavarakaupan lisäksi tällaista tieteellisen tutkimuksen datapotentiaalia löytyy varmasti niin verkkokaupoista, finanssialalta, energiayhtiöistä kuin myös kaupunkiorganisaatioista. Uusien datojen analysoiminen voi tarjota yllättäviä mahdollisuuksia luoda tutkimusnäyttöön pohjautuvia ratkaisuja keskeisiin yhteiskunnallisiin ongelmiin.
Hannu Saarijärvi työskentelee markkinoinnin professorina Tampereen yliopistossa.
Kuva: Jonne Renvall/ Tampereen yliopisto
*Pseudonymisointi: Pseudonymisointi tarkoittaa henkilötietojen käsittelemistä siten, että henkilötietoja ei voida enää yhdistää tiettyyn henkilöön ilman lisätietoja. Tällaiset lisätiedot täytyy säilyttää huolellisesti erillään henkilötiedoista. (lähde: Tietosuojavaltuutetun toimisto)
Hannu Saarijärvi esittelee LoCard-tutkimusta tarkemmin Vähittäiskaupan tutkimussäätiön ja Kaupan liiton Kaupan tutkimuspäivä 2023: Kauppa uuden kynnyksellä -tilaisuudessa 2. helmikuuta 2023. Voit lukea lisää ja ilmoittautua tutkimuspäivään täällä.