Big data er the big issue

Big data er et begreb, der dækker over den store mængde digital information, som mennesker efterlader sig, og som virksomheder kan købe, indsamle og bruge i fx markedsføring og kommunikation. Her er muligheden for unik viden på baggrund af en stor mængde data. Big data er radikalt anderledes end tidligere tiders datahåndtering. For med big data kan man forudsige adfærd helt ned til få øjeblikke, før det sker. Det giver uanede muligheder for markedsføring, men kræver også helt nye it-, kommunikations- og analysekompetencer.
Mængden af data er eksploderet. IBM vurderer, at der hver dag bliver produceret 2,5 exabytes (2,5 milliarder gigabytes). Det svarer til, at 90 pct. af verdens samlede datamængde er blevet skabt alene de sidste 2 år. Og mængden af data bliver fordoblet hvert tredje år.
 
Infografik, der viser et udsnit af den enorme dataproduktion, der foregår på nettet alene. Grafen peger på, at der hvert minut bliver uploadet 48 timers YouTube-video, foretaget to millioner Google-søgninger, sendt over 100.000 Twitter-beskeder, skabt 571 nye websider og downloadet 47.000 apps. Det er hvert minut, og det er bare et lille udsnit af den samlede dataproduktion
 
Her ligger en guldgrube af informationer og venter på den rette fortolkning. Det er farvel til nytteløse fokusgrupper og middelmådige surveys, og det er farvel til uvedkommende historier. Med analyser af big data får man et langt mere præcist billede af tingenes sande tilstand. Man kan præcist vide, hvad ens målgruppe har brug for, og man kan udvikle historier, der har direkte relevans for dem. Det kan forandre kommunikationsarbejdet, som vi kender det. I et globalt survey af Avanade responderede 73 pct. af de adspurgte virksomheders IT-folk, at de allerede udnytter potentialet i big data til at øge omsætningen. Det er på tide at kommunikationsfolket kommer med.  
 
Definition af big data
Forresters definition af big data lyder: ”techniques and technologies that make capturing value from data at an extreme scale economical”.
 
Big data er på den måde et konceptuelt begreb, der betyder, at man kombinerer store mængder forskelligartet data, udvikler hypoteser og analyser, der igen kan føre til ny indsigt om mønstre i menneskelig adfærd. Det gør det muligt at kunne forudsige menneskelig adfærd helt ned i mindste detalje. Indsamler man for eksempel information om en tilfældig, almindelig danskers adfærd igennem tre uger, vil man ud fra denne datamængde kunne forudsige, hvad han præcist laver på et givent tidspunkt. Mulighederne er mange. Indsamling af de rette data og brug af den rette fortolkning kan fortælle, hvem der får diabetes, hvem der vil betale deres lån tilbage, hvem der vil købe den nye iPhone, hvem der vil stemme på hvem til det amerikanske valg, og hvilke målgrupper den næste kommunikationskampagne bør rette sig mod.
 
Big data marketing forklaret af marketing-ekspert Bryan Eisenberg
 
Farvel til Fandens fokusgrupper
Fordelen ved big data er, at det er informationer om folks reelle adfærd i stedet for begrænset information om deres selvbeskrevne holdninger. Det er forskellen på, hvad brugere faktisk gør, over for hvad de siger, de gør. Og det er en kæmpe forskel. For mennesker har altid en tendens til at se deres egne handlinger og selvbillede i et mere positivt og ønskværdigt lys, end hvad der faktisk er tilfældet. I kommunikationssammenhæng giver det derfor ikke mening at bruge mange penge på fx fokusgrupper og surveys, hvor folk alligevel mest rapporterer, hvad de har lyst til (læs Henrik Dahls: Fandens fokusgrupper).     
 
Folks reelle købsadfærd er anderledes end deres rapporterede købsadfærd: De siger eksempelvis, at de køber mere økologisk og mere grønt, end hvad tilfældet reelt er. Statistiske analyser og økonomiske teorier har imidlertid alle dage været bygget på generaliserede gennemsnit, hvilket rammer alle en smule og ingen specifikt. Big data ændrer hele dette billede på grund af de tre V’er: volume, velocity, variety.  
 
Volumen – datamængdens størrelse gør det muligt at få unik viden        
Den øgede datamængde skyldes, at alt er blevet digitaliseret, og at næsten al adfærd efterlader digitale fodspor. Fremkomsten af multimedia, sociale medier, den radikale digitalisering og snart for alvor Augmented Reality og the Internt of Things er medvirkende til den øgede produktion af data.
 
ANBEFALING: Kommunikatøren skal gå sammen med IT og Marketing i et powerteam og kortlægge al relevant dataproduktion. Data ligger typisk i adskilte siloer internt i virksomheden og eksternt på nettet. Der skal udvikles en samlet oversigt over al data, også den, man umiddelbart ikke tror, er relevant. Kommunikatørens kompetence er at kunne udvikle de interessante problemstillinger, der skal besvares – for kommunikatøren har kendskab til social adfærd og kan på det grundlag udvikle de interessante hypoteser.     
 
I 1986 var datamængden på verdensplan 3 exabytes, og den digitale datamængde udgjorde heraf 1 pct. I 2007 var den samlede datamængde på verdensplan 295 exabytes, og den digitale data udgjorde heraf 94 pct. Det er en voldsom forandring. Fra McKinsey-rapporten Big Data, 2012
 
Velocity – datamængdens produktionshastighed gør realtime-forudsigelse mulig  
Det er ikke blot mængden af data, der er interessant, det også hastigheden, hvormed data bliver produceret. Mennesker efterlader sig realtime-informationer, der er digitaliserede og arkiverede, og det gør det muligt inden for meget kort tid at forudsige adfærd. Twitter- og Facebook-opdateringer er gode eksempler, såvel som mobile lokaliseringsdata, Instagram-billeder osv. Det er life, og det gør life-analyser mulige.  
 
Af MIT Media Lab blev det for eksempel afsløret, hvor stor omsætning et supermarked (Maceys) havde den første julesalgsdag, før butikken offentliggjorde resultaterne – alene ved at sammenkøre data fra parkeringspladsen, hvor X antal biler med X antal mennesker med X antal mobiltelefoner befandt sig, med tidligere års salg. Velocity handler altså om realtime-produktion og -indsamling af data, der gør forudsigelser mulige. 
 
ANBEFALING: Kommunikatøren kan målrette markedsføringen af sit produkt, så det helt præcist rammer brugerens behov på det rette tidspunkt. Fra realtime-dataindsamling på fx Facebook kan man hurtigt finde ud af, hvad potentielle kunder interesserer sig for lige nu. Trends og interesser skifter hurtigt, og det gælder om at fange dem i nuet, ikke en uge eller måned for sent.     
 
Big data-analyser forudsagde det amerikanske supermarked Maceys julesalg på baggrund af life-opdaterede data, længe før supermarkedet selv havde resultatet færdigbehandlet
 
Variety – datamængdens forskellighed gør holistisk viden mulig
Big data handler om at indsamle forskellige datatyper for på den måde at kunne sammenstykke et holistisk billede af en trend, en forbrugertype eller en adfærd.
 
Man har altid behandlet data i virksomheder. Klassisk dataanalyse og datamining handler imidlertid kun om virksomhedens egne data, typisk salgsdata og leverandørdata. Big data er noget andet. Det er ikke blot salgsstatistik, men samkøring af data fra mobile enheder, sociale medier, kreditkort, Google-søgninger, GPS – kort sagt: alle tænkelige datatyper fra alle tænkelige kilder. For i den radikalt digitaliserede æra efterlader næsten al aktivitet digitale brødkrummer. Hver for sig er de blot krummer, men tilsammen giver brødkrummerne et helt brød, dvs. et meningsfuldt billede af en bestemt adfærd.
 
ANBEFALING: Kommunikatøren forstår forskellige typer data bedre end fx folk i it-afdelingen. De er gode til at lave beregninger og de nødvendige algoritmer, men det kan være kommunikatørens ansvar at pege på de steder, hvor data skal indsamles. Det er kommunikatøren, der bedst kender de sociale medier og nye tjenester såsom Pinterest. Og det gælder om at holde sig opdateret, så de rigtige data kommer med i beregningerne.  
  
Hvad vi kan lære af Amazon om unikke brugere
McKinsey publicerede for nylig en stor rapport, hvor de konkluderer, at den organisation, der kan håndtere og klogt bruge big data har et innovativt forspring. Amazon er et godt eksempel. 
 
Opretter man en profil på Amazon, vil man få skræddersyede anbefalinger af nye bøger, der har samme tematik som ens tidligere søgning, og som samtidig – og det er det vigtigste – er blevet købt af andre brugere med lignende købsprofiler. Det betyder, at man på baggrund af en enorm stor mængde købsdata kan få et helt præcist og relevant forslag til den næste bog, man skal købe. Man er således ikke blot en generaliseret enhed i en klassisk fire-matrix-segmentering, men et unikt individ med en unik købshistorik og købsinteresse. Se eksemplet fra Kforums konto her:
 
Screenshot fra Kforums Amazon-konto, hvor Amazons tophemmelige big data-baserede algoritme kommer med forslag til relevante bøger på baggrund af vores tidligere købsadfærd og andre lignende kunders købsadfærd     
 
Et andet godt eksempel er forudsigelse af huspriser
Ved hjælp af realtime-dataindsamling af, hvilken pris, hvilke huse, i hvilke områder bliver solgt til, udviklede Lynn Wu og Erik Brynjolfsson en analysemetode, der næsten i realtid kunne forudsige prisudviklingen på husmarkedet. Som køber er det selvfølgelig et meget interessant tal at få kendskab til, da det viser noget om, hvor meget man kan presse den listede salgspris.  
 
I den videnskabelige artikel beskriver Lynn Wu og Erik Brynjolfsson, hvordan man kan bruge big data til at forudsige adfærd ved hjælp af store mængder data. Tryk på billedet for at læse artiklen
 
Kommunikationsbranchen er varm på et heatmap
Det er dog ikke blot de store verdensomspændende virksomheder, der kan bruge big data til noget vigtigt. Det er klart, at Google og Amazon viser vejen (sammen med IBM, der har satset voldsomt på at blive førende i big data). Men andre brancher kan også med fordel følge trop. Som følgende heatmap viser, er potentialet eksempelvis stort for kommunikationsbranchen:
 

Skemaet viser potentialerne for brug af big data fordelt på forskellige brancher. Kommunikationsbranchen er indrammet, fordi her er særlige potentialer. Rød farve betyder, at der er stort big data-potentiale, og blå det modsatte. Fra rapporten: Market Trends: Big Data Opportunities in Vertical Industries
 
For kommunikationsbranchen gælder: 
  • Der er rigtig meget data tilgængelig (volume)
  • Meget ny data skabes hurtigt (velocity)
  • Det er muligt at indsamle meget forskellige typer data (variety)
  • Der er en moderat mængde uudnyttede skjulte data    
  • Man har rigtig god hardware til rådighed
  • Man har rigtig god software til rådighed
  • Man har god service til rådighed.
 
Obamas big data-kampagne
Et godt eksempel på brug af big data i kommunikationsbranchen er den nuværende amerikanske kampagne: Obamas kampagneteam bruger systematisk big data-analyser.
 
Data om vælgerne, deres medieforbrug og deres holdninger er tilgængelige. Rigtigt opsamlet og analyseret er de en sand guldgrube af viden. Den guldgrube af data bruger Obama nu som sit hemmelige våben i præsidentkampagnen til at segmentere, definere og kommunikere med vælgere på nye målrettede måder. På baggrund af big data-analyser har man fx fundet ud af, hvordan politiske holdninger spiller sammen med brug af forskellige sociale medier. Som billedet herunder viser, er demokraterne tydeligvis til Spotify, mens republikanerne er til Pinterest. Og som billedet bagefter viser, kan man også bruge big data-analyser til at identificere vælgernes foretrukne ølvalg.
 
Obamas vælgere bruger Spotify, og Romneys vælgere bruger Pinterest. Godt at vide, når man skal vælge social platform i kampagnen. Læs mere om kampagnen i det politiske nettidsskrift Politico. Se også beskrivelserne i den nye bog: The Victory Lab: The Secret Science of Winning Campaigns
 
 
Et sjovt og illustrativt eksempel på, hvad Obamas kampagnefolk kan med big data. Ved at sammenkøre data kan de se, hvilken øl demokrater og republikanere foretrækker. På Y-aksen er ”turnout”, der handler om sandsynligheden for, om borgeren vil stemme. På X-aksen er graden af demokratisk henholdsvis republikansk orientering fordelt. Af oversigten fremgår det fx, at vælgere, der drikker Corona, er stærkt demokratiske, men næppe stemmer. Til gengæld er vælgere, der drikker Samuel Adams, stærkt republikanske, og de stemmer formentlig. Læs mere her
 
Analyser af big data er blevet brugt til at finde ud af, at amerikanske vælgere, der drikker Corona, er demokratiske sofavælgere, hvorimod vælgere, der drikker Samuel Adams, er republikanere, der går til stemmeboksen. Det demokratiske kampagnekontor kan fx bruge denne viden til at målrette indsatsen mod Corona-drikkere, så de kommer af sted på valgdagen   
 
Big Data Dashboard
Som led i kampagnen har Obamas team også udviklet en ny app kaldet Dashboard, der trækker på big data. Med denne app kan man ikke bare hente, men også indtaste, data, der live-opdateres i en central database og derpå igen bliver tilgængelig for alle aktivister i hele landet.
 
Eksempelvis skaber appen præcis viden om, hvor relevante demokrater befinder sig geografisk. Det er interessant viden for frivillige, der stemmer dørklokker. Når en frivillig logger ind med sin adresse, kommer der et kort op. De huse i nærområdet, hvori der bor demokrater, bliver markeret med et lille blåt flag – og for hver adresse fremgår navn, alder og køn på demokraten, der bor der. Når den frivillige så har besøgt et hus, så taster hun eller han mere information ind. Samlet set skabes der hurtigt en gigantisk mængde præcis data om vælgere, som man bagefter kan ramme med præcise kampagnebudskaber. Læs mere om appen her.
 
Dashboard viser, at der i området omkring Fulton Metrostation er seks demokrater. De to valgte er Mary på 31 år og Seth på 30 år
 
Et netværk af relationer er godt nok
Vælgere påvirker hinanden. Kunder påvirker hinanden. Mennesker er socialt indfiltret i et netværk af relationer, hvor man påvirker hinanden. Den præmis betyder, at man ikke behøver alle data om en person for at kunne forudsige hans adfærd og livscyklus. Har man blot en række centrale data om en person, kan man fortolke sig til resten ved at sammenligne med andre i gruppen. Big data handler derfor om at finde forbindelser og mønstre. Forbindelser mellem mennesker – og mellem mennesker og deres adfærd.   
 
For social adfærd er reelt bygget op af millioner af små, unikke transaktioner mellem individer. Der er mønstre i disse transaktioner, der ikke blot er udtryk for et gennemsnit men udgør selvstændige interessante mikromønstre. Det er fx dynamikken bag det arabiske forår, hvor mange små mønstre tilsammen skabte en bevægelse. Det var ikke en gennemsnitlig adfærd, men nogle særlige, unikke mønstre, der gjorde udfaldet. Sådan har sociale bevægelser ofte udfoldet sig. Med big data har man nu bare muligheden for at udvikle en langt mere præcis forståelse og forudsigelse af dynamikken, fordi man kan finde mønstre i detaljerne. Se mere om Twitter og big data i dette filmklip:  
 
Det arabiske forår kan forstås og forudsiges ud fra big data-analyser af digitale fodspor
 
Transaktionsdata + interaktionsdata + software/hardware = big data
Big data er altså de informationer, som kunder efterlader på Facebook, LinkedIn, Twitter og andre sociale platforme. Men mindst lige så vigtig er data om menneskers banktransaktioner, søgemaskineadfærd, brug af kreditkort og lokaliseringsbaseret data. Big data kan således ses som en sammenkobling af disse, som illustreret i denne graf: 
 
Big data er mulig på grund af tre ting: big transaktions-data som fx telefon-data, big interaktions-data som fx Facebook-data og big data-processing, dvs. ny smart software som fx Hadoop. Det er sammenkoblingen af forskellige typer data med kraftige computere og software, der giver nye muligheder 
 
Her er to eksempler på, hvordan man allerede i dag kan bruge big data på denne baggrund – i sygehusvæsenet og i politiet:
 
Tidligere kunne man læse om sin sygdom via Google-søgninger. Så kunne man finde andre i lignende situationer og lægevidenskabelige beskrivelser af sygdommen generelt. I den nære fremtid kan man få præcis information om sit sygdomsforløb på baggrund af data om ens unikke genetik og adfærd.
 
I politiefterforskningen har man i mange år brugt fornemmelser og erfaringer for at lokalisere mulige kriminelle holdninger. Allerede i dag bruger det amerikanske politi big data til at lave en langt mere præcis forudsigelse af, hvor kriminelle handlinger vil ske, og på hvilket tidspunkt. Militærets efterretningstjenester er ligeledes med langt fremme. Eksemplerne er fra Forbes      
    
Fremtidens kommunikationsmedarbejder er it-ekspert
Man har i mange år talt om datamining, men med big data har begrebet fået ny mening. Nu er det blevet muligt at målrette kommunikationsindsatsen over for præcise segmenter ved at kunne forudsige i realtid, hvad de vil foretage sig.
 
Det er klart, at meget af databehandlingen må udføres og tænkes fra et it-synspunkt. It-afdelingen må på banen, men det må ske i et tæt samarbejde med marketing og kommunikation, der kan udvikle de interessante problemstillinger og hypoteser. Fremtidens kommunikationsmedarbejder må derfor på alle måder være it-kyndig og kunne forstå logikken bag big data.
 
I dag er der ifølge Computerworld mangel på it-kyndige, der forstår og kan arbejde med big data. Et tæt samarbejde med kommunikationsfolk er måske løsningen, hvor it-professionelle programmerer nye algoritmer og håndterer nyttig men kompleks software som Hadoop på baggrund af data indsamlet af kommunikatører, der også stiller de interessante spørgsmål.
 
Fordi man har så store mængder data, og fordi man kan lave så præcist rettede analyser, betyder det også, at man næsten kan få alle resultater til at være signifikante, hvis man blot laver analysestrengen snæver nok. For eksempel: Folk, der kører på arbejde om tirsdagen kl. 8 i Græsted, er i større risiko for at få influenza. Det vil måske være en statistisk signifikant konklusion. Men spørgsmålet er, hvorfor det er sandt, og om der er en kausal forbindelse mellem hvilke årsager. It-afdelingen med statistikere og programmører er gode til at få resultater. Men hvilke resultater der er interessante, kan kommunikationsfolket afgøre.
 
Big data kræver really big serverkapacitet. IBM er en af de virksomheder, der er længst fremme med at udvikle hardware og software til at håndtere big data. IBM taler om ’smarter storage’. Se mere her. Og tag deres test i big data her for at finde ud af, om du ved, hvad du burde vide
 
Datadeling
Big data handler om muligheder og i samme åndedrag lige så meget om etik, rettigheder og Big Brother. Brugt moralsk rigtigt er mulighederne enorme. Via lokaliseringsdata kan man præcist identificere adfærd igennem byer og på den baggrund udvikle en mere effektiv infrastruktur. Via sygdomsdata kan man identificere udbrud af influenzaer til epidemier. Det er alt sammen noget, man kan i dag. Hvis folk så oven i købet begynder langt mere aktivt at producere og dele data med hinanden, vil man i fremtiden hurtigt og præcist kunne stoppe sygdomsudbrud, trafikulykker, kriminalitet og anden dårligdom. Den form for datadeling er en af de mest indflydelsesrige big data-tænkere Sandy Pentland fx fortaler for.
 
Men som enhver også kan forestille sig, er de mulige negative konsekvenser også store. De etiske spørgsmål om, hvem der har retten over data, hvem der kan hente hvilke data, og hvad disse data kan bruges til, er store spørgsmål, der endnu ikke er afklaret. Den digitale verden er stadig et wild west, hvor regulering og regler mange steder er en mangel. I USA har man foreslået en Consumer Data Privacy Bill of Rights (download pdf), der også p.t. bliver behandlet af EU som dokumentet: Data Protection in the European Union: The Role of National Data Protection Authorities (download pdf). Internettet er globalt, og der burde derfor være internationalt gældende regler. Indtil da må enhver følge gældende national lov og ellers bruge sin egen moralske dømmekraft.   
 
10 big data-bud
  1. Jo hurtigere du analyserer data, desto større sandsynlighed for en præcis forudsigelse.
  2. Behold kun én kopi af dine data. Flere kopier af data skaber et forvirrende analysebillede.
  3. Brug mere forskelligartede data, ikke kun flere data generelt. Det gælder om at kombinere forskellige typer data.
  4. Data har værdi, som du ikke lige kan forudsige. Forkast ikke pludseligt opståede indsigter, du ikke lige søgte efter.
  5. Planlæg for eksponentiel vækst i data, og udvid mulighederne for indsamling gennem forskellige medietyper.
  6. Tænk ikke big data isoleret men som et redskab til at forbedre din kerneforretning. Hvordan kan big data bruges gennemgribende forretningsstrategisk?
  7. Data har ingen værdi uden menneskelig fortolkningsevne. Det er derfor big data ikke kun er et emne for it-afdelingen.
  8. Gør dig selv til analytiker. Lad dig ikke skræmme af tallene, men prøv selv at finde nogle små mønstre. Tag et udvidet kursus i Excel til en begyndelse.
  9. Hold dig opdateret med nye redskaber. Der bliver konstant udviklet ny software, der bliver mere og mere brugervenlig. Snart kan du selv sætte computeren til at lave alt arbejdet.
  10. Øv dig i at stille de rigtige spørgsmål, der giver dig brugbare svar. 
 
Læs mere
 
Læs bloggen spinsucks og få 5 centrale pointer for PR-konsulenten.
 
Alt om big data fra IBM
 
Wikipedias artikel om big data.
 
Beskrivelse af, hvordan segmentering forandrer sig med big data, fra AdAge.
 
Beskrivelse af big data ud fra en række forskellige vinkler: segmentering, sociale medier og ledelse fra SAS Institute. Læs også mere her.
 
En præsentation af trends inden for big data, fra Forbes.
 
Beskrivelse af Obamas big data-kampagne fra Financial Times og fra Slashdot.
 
Om marketing og segmentering via big data fra MarketingWeek.
 
Big data-manifestet fra Wikibon.
 
New York Times om big data og den forestående udstilling: The Human Face of Big Data.
 
Alt om big data fra ZDNET.
 
Stort temanummer fra Harvard Business Review.
 
McKinseys omfattende rapport om big datas betydning for innovation.
 
Interview med Sandy fra the Edge.
 
Oracle Information Architecture: An Architect’s Guide to Big Data. Hent i pdf.
 
Consumer Data Privacy Bill of Rights (download pdf).
 
Data Protection in the European Union: The role of National Data Protection Authorities (download pdf).
 
Alex "Sandy" Pentland betragtes som den førende ekspert i big data. Se her et interessant interview med eksperten, hvor han fortæller om mulighederne, men også om big brother-farerne 
 

Del artikel

Tilmeld dig vores nyhedsbrev

Vær på forkant med udviklingen. Få den nyeste viden fra branchen med vores nyhedsbrev.

Forsiden lige nu

Læs også