Målgruppeanalyse på internettet

Hvordan identificerer og beskriver man forskellige brugerprofiler ved hjælp af korrespon-danceanalyse? Christian Vermehren fra Framfab giver her sit bud på fordelene ved korre-spondanceanalysen.

Man må have
et detaljeret kendskab til sin målgruppe for at kunne tilpasse et
websted til brugernes behov. Hos FramFab's Centre of User Experience bliver
kvalitative og kvantitative metoder ofte kombineret for at undersøge
brugerne af internettet og definere målgrupper. Man kan få
kendskab til målgruppen ved at gennemgå to trin:


1) Data om målgruppen eller brugerne indsamles
og lagres i en database

2) Data analyseres


1.
Dataindsamling


Det første trin er at indsamle data om brugerne. Der er flere måder
at indsamle data på:


· Almindelig off-line markedsanalyse

· Internetpaneler

· Online spørgeskemaundersøgelser

· Logfilanalyser


De to første metoder, off-line markedsanalyser
og internetpaneler, bruges til at få et generelt indblik i brugernes
adfærd (uanset om det drejer sig om internettet eller ej). De to
sidste, online spørgeske-maundersøgelser og logfilanalyser,
anvendes til at undersøge et specifikt websted.


Off-line markedsanalyse

Off-line markedsanalyse (det vil sige almindelige personlige interview,
telefoninterview, osv.) er den eneste måde at sammenligne internetbrugere
og ikke-internetbrugere. Denne metode er specielt velegnet, hvis et site
skal skabes helt fra grunden. Det vil sige, hvis det rigtige segment først
skal identificeres, og hvis man ønsker at vide, hvilket medie man
skal bruge for at tiltrække målgruppen til sitet.


Internetpaneler

Internetpaneler fokuserer udelukkende på brugerne af internettet,
men går ud over det enkelte site. Denne metode giver mulighed for
at beskrive folks adfærd og holdninger ikke blot på ens eget
site (hvis man har et sådant), men også på konkurrenternes
sites. Ligesom off-line markedsanalyse for-udsætter internetpaneler
ikke, at man selv har et websted. De to metoder kan derfor med fordel
bru-ges, når et site skal skabes helt fra grunden. Fordelen ved
internetpaneler er, at de er langt billigere end almindelige off-line
analyser.


Online spørgeskemaer
og logfilanalyser


Online spørgeskemaundersøgelser og logfilanalyser bruges
primært til at forbedre eksisterende si-tes. Formålet er at
få indblik i et specifikt websteds brugere og derefter tilpasse
webstedets indhold og struktur til brugerne.


2. Dataanalysen

Efter at dataene er blevet indsamlet på forsvarlig vis, er andet
trin analysen. Dataanalysen kan in-volvere forskellige analysemetoder.
Ud over almindelige frekvensanalyser og krydstabuleringer anvender Framfab's
Centre of User Experience en såkaldt korrespondanceanalyse i kombination
med en klyngeanalyse.


Korrespondanceanalyse

Udfordringen kan ofte være
at opdele sin målgruppe i mindre grupper, så webstedet kan
tilpasses til flere forskellige profiler på én gang. Korrespondanceanalysen,
der især kendes fra den del af socio-logien, der handler om forskning
i livsstil, går ud på, at man kortlægger de væsentligste
forskelle inden for målgruppen.


En traditionel måde er almindelig frekvensanalyse
og en rangordning af målgruppens attituder, ud fra hvor mange der
tilslutter sig dem. Problemet herved er imidlertid, at man ikke får
noget at vide om kombinationerne af de præferencer eller attituder,
målgruppen har.


Korrespondanceanalysen har sin styrke i, at den
netop kan afdække de mest typiske kombinationer af præferencer
og attituder, så man kan danne sig nogle mere fuldstændige
profiler. Det skyldes at den er i stand til at behandle mange variable
på én gang, og at den således går holistisk til
værks.


Før man kan gå i gang med en korrespondanceanalyse,
er det nødvendigt at forberede sine data. Man må blandt andet
slå nogle af svarkategorierne sammen og give dem mere sigende navne,
så det bliver lettere at overskue materialet.


Resultatet kan være en konstruktion af
forskellige værdier på baggrund af de gamle kategorier. Ved
hjælp af korrespondanceanalysen placeres værdierne i et todimensionelt
"kort", der visualiserer de statistiske sammenhænge mellem
værdierne. Hvis to værdier er tæt på hinanden
i dette kort, betyder det, at der er stor sandsynlighed for, at den samme
person har dem, og derved begynder man, at kunne beskrive de mest typiske
profiler på en mere fuldstændig måde.


Kortet med værdier giver en anden information
end ved bare at rangordne udsagnene gennem fre-kvensanalyser. Ved at betragte
værdierne, der ligger tæt på hinanden i kortet, som
"brudstykker" af en hel profil, kan man gradvist danne sig et
mere komplet billede af, hvem det er, man bør henven-de sig til.


Kortets akser angiver de væsentligste forskelle
blandt respondenterne. Som udgangspunkt er akser-ne "anonyme"
i den forstand, at de kun angiver den statistiske spredning. Det er imidlertid
muligt at fortolke akserne ved at se på de værdier (eller
variable), som bidrager mest til denne spredning. Det vil sige de værdier,
som målgruppen er mest uenige om. Ud over visualiseringen af statistiske
sam-menhænge producerer korrespondanceanalysen et numerisk output,
som kan understøtte denne for-tolkning. Ved at fortolke "fællesnævneren"
for de værdier, der bidrager mest til akserne, kan man navngive
akserne/modpolerne, således at man ender med en enkel, overskuelig
segmenteringsma-trix.


Fordelene ved korrespondanceanalyse

En fordel ved korrespondanceanalysen er, at den er i stand til at visualisere
komplekse statistiske sammenhænge, således at man helt undgår
brugen af "tørre" eller "rå" talstørrelser.
Denne form for visualisering er specielt velegnet som input til det kreative
arbejde med websteder, idet den lægger op til en bredere fortolkning
af respondenternes profiler, selvom den er baseret på en abstrakt
ma-tematisk beskrivelse.


En anden fordel ved korrespondanceanalysen er,
at den går holistisk til værks, hvilket vil sige, at den har
mulighed for at inkludere adskillige variable i den samme analyse. Til
forskel fra almindelig statistik vil en korrekt anvendelse af korrespondanceanalysen
resultere i et mere fyldestgørende billede af de mest typiske respondenter,
hvilket netop er ønskeligt i forbindelse med at fastlægge
brugerprofiler.


Endelig har korrespondanceanalysen den fordel,
at den med udgangspunkt i mange variable kan reducere et væld af
informationer til nogle få, vigtige forklarende faktorer. Disse
faktorer kan illu-streres grafisk som en simpel segmenteringsmatrix, der
kendes fra marketingdisciplinen. Hermed fås et praktisk og simpelt
overblik over ens målgruppe, der omhyggeligt er begrundet i en empirisk
undersøgelse.


Klyngeanalyse

Mens korrespondanceanalysen kortlægger de væsentligste forskelle
inden for målgruppen, har klyngeanalysen til formål at bruge
disse forskelle til at opdele målgruppen i mindre, men mere præ-cise
segmenter. Det er altså modsætningerne fra korrespondanceanalysen,
der skal anvendes som udgangspunkt for segmenteringen.


Forinden bør man dog notere sig, at korrespondanceanalysen
kun giver en indikation af de mest typiske profiler, som er til stede.
Den giver ikke en præcis angivelse af, hvor mange segmenter der
er, og hvor store de er. Umiddelbart giver korrespondanceanalysen indtryk
af, at en målgruppe altid bør opdeles i fire segmenter, idet
den typisk kun visualiserer to akser ad gangen. Men i virkelighe-den er
disse to akser en projektion af et multidimensionalt rum med mange akser,
og således er det faktisk muligt at dele op i flere undergrupper.


En måde at komme rundt om dette problem
på er at anvende korrespondanceanalysen sammen med klyngeanalysen.
Denne metode er ideel til at gruppere individer ud fra afstande. Man beregner
først afstandene mellem individerne i det fulde multidimensionale
rum produceret af korrespondanceana-lysen og bruger dem derefter som datagrundlag
for klyngeanalysen.


Herefter udregnes gennemsnitspunktet for hvert
segment i det oprindelige kort med værdier. Resul-tatet er en præcis
kortlægning af, hvor mange segmenter man bør operere med,
hvor store disse segmenter er, og hvilke typiske værdier der karakteriserer
dem.


Supplerende information

Når først man har defineret de mest typiske profiler på
baggrund af værdier, er det muligt at uddybe med andre variable
fra spørgeskemaet:


· Alder

· Køn

· Ressourcer

· Internetadfærd

· Osv.


Disse variable kan lægges ind i værdikortet
som trendslinier, der angiver sammenhængen mellem for eksempel alder
og profilerne i kortet. Man kan blive ved med at lægge lag på
lag og dermed få et mere og mere nuanceret billede af sin profil
eller de mest interessante segmenter.




Statistik og dybdeinterview - hvordan kombineres kvantitative og kvalitative
metoder?

Korrespondanceanalysen kan også bruges til at udvælge respondenter
til kvalitative undersøgelser, således at kvantitativ statistik
kombineres med dybdeinterview. Metoden giver nemlig mulighed for at lave
et kort over individer. Det hedder netop korrespondanceanalyse, fordi
den altid produce-rer to kort, et variabel- eller værdikort og et
individkort, som korresponderer med hinanden. Variab-lene/værdierne
bliver skiftet ud med enkeltindivider.


Det er interessant, at man kan udvælge
personer til kvalitative interview ved at gå ind og udpege de individer,
der ligger tættest på gennemsnitsværdien for en undergruppe,
og derved få fat i de perso-ner, der bedst repræsenterer hele
segmentet. Denne metode gør det muligt at generalisere et enkelt
dybdeinterview til hele segmentet, netop fordi man ved, at segmentet er
forholdsvist homogent.


Gennem systematisk, kvalitativ uddybning af korrespondanceanalysens
værdikort ender man med en forståelse af ens målgruppe,
der på samme tid er både bred og dyb.




Filosofien bag metoden

Korrespondanceanalysen udelukker ikke andre statistiske metoder og skal
ses i en større data-mining sammenhæng. Man bør altid
supplere korrespondanceanalysen og klyngeanalysen med an-den form for
statistik, først med nogle meget simple frekvensberegninger og
derefter med krydsta-buleringer. Først til sidst anvendes avanceret
korrespondanceanalyse.


Der findes en række alternativer til korrespondanceanalysen.
Men det er vigtigt at forstå korrespon-danceanalysens unikke fordele:


· For det første er den et eksempel
på statistik uden tal - den er visuel med et intuitivt forståe-ligt
resultat, selvom dette bygger på komplekse beregninger, der kan
være svære at forstå.

· Den går holistisk til værks - det vil sige, at den
viser fragmenter af en hel personlighed og kombinationer af mange præferencer
i stedet for kun at betragte én eller to variable ad gan-gen.

· Den lægger op til fortolkning og indlevelse (fragmenterne
skal stykkes sammen) og er der-for specielt velegnet i forbindelse med
kreativt arbejde.

· Den fokuserer på modsætninger såvel som på
ligheder og er derfor ideel til at vise, hvordan folk ofte definerer sig
i forhold til andre, i forhold til det man ikke er.

· Helt nye strukturer opstår ud fra korrespondanceanalysens
data, når akserne fortolkes og navngives, og det giver mulighed
for at forstå et meget stort datamateriale udfra ganske få
begreber.




Nye data mining-metoder


Der opstår bestandigt helt nye data mining-metoder baseret på
kunstig intelligens.


· Neurale netværk

· Fuzzy logic

· Regelinduktion

· Beslutningstræer


Korrespondanceanalysen kan sagtens kombineres
med disse nye metoder. Men problemet med de nye metoder er, at de sommetider
er baseret på "Black Box"-beregninger (for eksempel neurale
netværk) snarere end på fortolkning, indlevelse og forståelse.
Et andet problem kan være, at de ofte er mere egnede til hypotesetestning
end til hypotesegenerering (for eksempel regelinduktion og be-slutningstræer).


Dette går imod formålet med data
mining, som er at "lede" efter interessante sammenhænge.
Ordet "data mining" er en metafor, hvor data sammenlignes med
et minefelt, hvor man graver efter - og pludselig finder - guld.


Link fra hypotesetestning

Hypotesetestning er den angloamerikanske tradition, hvor korrespondanceanalysen
bygger på den franske, der inddrager holistiske dimensioner.


Hypotesetestning er:

· mere en reduktionistisk end en holistisk indfaldsvinkel

· svær at anvende til identifikation af profiler

· baseret på forudsætninger om statistisk fordeling
etc.

· baseret på subjektive valg på trods af påstand
om objektivitet

· ikke en metode, hvor man lader dataene tale for sig selv - man
skal kunne koge tingene ned til nogle få begreber. Jævnfør
"eksformationsbegrebet" i Tor Nørretranders bog "Mærk
Verden".


Man opstiller således hypoteser, som man
forsøger at af- eller bekræfte i stedet for at reducere data
til nogle få empiriske begreber.




Logfilanalyser


En nuanceret beskrivelse af ens målgruppe stiller store krav ikke
kun til de analysemetoder, man anvender, men også til de data, man
indsamler. En komplet analyse af ens målgruppe bør inkludere
data fra webserverens logfiler.


Logfilanalyser har den fordel, at de kan foretages,
så tit man har lyst uden at belaste brugerne med spørgsmål.
Spørgeskemaundersøgelser og logfilanalyser bør dog
ideelt set kombineres, idet førstnævnte typisk fokuserer
på holdninger og psykografi, mens sidstnævnte fokuserer på
adfærd.


Logfiler kan omdannes til brugbar information,
men har også en række indbyggede problemstillinger:


· Data produceres i utilgængeligt
format.

· Det kan være svært at identificere gengangere på
en sikker måde (IP numre-, cookies- og login-problematikken).

· Udregning af "dwell time" (den tid, man faktisk anvender
og ikke bare venter på, at noget for eksempel bliver uploaded) og
"click streams" (brugerens faktisk navigation på webstedet)
kan være vanskelig.

· Logfiler er ofte forskellige, hvilket gør det vanskeligt
at konstruere et program, der kan håndtere dem alle på en
konsistent måde.

· Få softwarefirmaer specialiserer sig i problematikken og
giver ikke færdige anvisninger på, hvordan man gør.

· Logfiler indeholder typisk ekstreme mængder af data med
store potentialer, men som kan være besværlige at have med
at gøre - hvordan tages for eksempel stikprøven?




Hvordan kan vi forstå en clickstream?

Det vigtigste begreb i forbindelse med logfilanalyser er click
streams. Det vil sige den rækkefølge af websider, som brugeren
eksponeres for under et besøg. For at kunne anvende click stream
til noget, er man nødt til at forstå de mulige betydninger,
som klikforløbet er udtryk for.


Det er ikke nok blot at analysere, hvor mange
der for eksempel er kommet ind på side X og gået videre til
side Y og Z. Man er også nødt til at finde ud af, hvilken
oplevelse eller resultat dette gav brugeren.


I stedet for at forstå en click stream
som en navigation fra X til Y til Z, bør man beskrive den på
et "højere" niveau, for eksempel som et "Succesfuldt
køb", et "Afbrudt køb", en "Forvirret
bruger", en "Session killer", en "Jobsøgende
bruger", en "Browsende bruger", eller måske endda
en "Glad", "Sur" eller "Frustreret bruger".


De kategorier - specielt "Glad", "Sur",
"Frustreret" - kan ikke altid læses direkte ud fra en
click stream. Ønsker man at beskrive logfil data på denne
måde er det en god ide at supplere med kvalitative interview. Det
vil sige, at man tager fat i folk karakteriseret ved bestemte click streams
og udspørger dem om deres oplevelser. Lidt efter lidt finder man
frem til, hvad forskellige click streams står for, og til sidst
anvender man disse kategorier i sin korrespondanceanalyse, klyngeanalyse,
osv.


Analyser af logfiler på et højere
beskrivelsesniveau forudsætter under alle omstændigheder et
dybtgående kendskab til sitets struktur, og det er derfor altid
en god ide at kombinere dem med ekspertvurveringer af indholdet og tænkehøjt-test.


Ved først at differentiere og derefter
kategorisere brugerne af et websted ud fra avanceret statistik kan man
altså definere en række segmenter, som hver især har
ens præferencer og interesser, men som indbyrdes er meget forskellige.
Udfordringen er nu at udforme sit websted på en sådan måde,
at det passer til disse forskelle og ligheder. En af de store fordele
ved internettet i sammenligning med andre medier som for eksempel fjernsyn
er jo netop, at man har mulighed for at dække mange forskellige
behov på én gang.


Denne unikke mulighed bør man udnytte,
og det gør man bedst ved at anvende avanceret statistik i kombination
med kvalitative metoder.



09.04.01


Del artikel

Tilmeld dig vores nyhedsbrev

Vær på forkant med udviklingen. Få den nyeste viden fra branchen med vores nyhedsbrev.

Forsiden lige nu

Læs også