Big Data: Den store sandhed, tallene aldrig peger på

Hypen er større end stor. Big Data er The Big Issue lige nu, hvor sociale medier er blevet grå hverdag. Alle de kvantitative konsulenter omdøber nu sig selv og deres forretning til Big Data-firmaer for at komme med på trenden. Samtidigt investerer venture-kapitalisterne i Silicon Valley millioner i Big Data-forretninger, mens de store konsulenthuse fra McKinsey til Boston Consulting Group taler om en altforandrende datarevolution på linje med den industrielle revolution. Nu er det ikke damp, men data, der er den nye energikilde til samfundets forandring. Få kan forklare al den data-demagogi lige her og nu, men mange mærker magien og muligheden. For hvad nu hvis vi kan se i dataene, hvordan tingene hænger sammen, uden vi nødvendigvis skal forstå hvorfor. Vi behøver måske slet ikke længere teorier eller årsagsforklaringer, fordi tallene taler for sig selv. Ny bog giver en god, nuanceret introduktion til begrebet Big Data og dets magiske, matematiske tiltrækning.
Hvorfor er Big Data sådan et Big Issue?
Den store forandring i samfundet er, at software har spist verden. Flere og flere brancher og produkter er nu blevet digitaliseret. Digitaliseringen af samfundet er en dataficering af samfundet. Jo mere digitalt vi lever, jo flere data skaber vi. Lige nu sker det med en dramatisk hastighed, hvor helt nye områder og datatyper digitaliseres. Tænk blot på vores mobiltelefoner, som nu viser, hvor ejeren er rent geografisk. Resultatet er nye lokationsbaserede geo-data, som kan kombineres med andre typer af data. Det giver nye muligheder og indsigter, vi aldrig før har haft.
 
Samtidig bliver flere og flere fysiske objekter fyldt med sensorer og kommer på nettet. Vi begynder også at måle os selv mere og mere, som vi kender det fra idrætsverden. Det er alle tendenser, som samlet forandrer vores forhold til data og vores muligheder for at bruge dem. Vi mangler heller ikke længere data. Tværtimod er vi ved at drukne i data. Det er præmisserne for, at data i videnssamfundet er blevet til Big Data. Big henviser til, at datamængden er blevet så stor og uensartet, at det er et problem.
 
Fra stikprøve til alle
Ikke blot i antal og form sker der en eksplosion med vores data. Vores mulighed for at analysere data forandres også i den nye Big Data-virkelighed. Vi behøver derfor ikke længere tage stikprøver, fordi vi potentielt har ubegrænset adgang til et helt univers af muligheder, individer og tilfælde. Repræsentativitet er derfor i teorien ikke længere et problem. Vi kan samtidig hurtigt og næsten gratis afprøve hypoteser og gennemføre dataanalyser. Det betyder, at vi næsten omkostningsfrit kan lede efter mulige sammenhænge, uden vi ved, hvad vi leder efter. Den eksplorative statistik og de mulige korrelationer bliver derfor en ny potent mulighed på bekostning af den klassiske statistik og de besværlige kausalitet- og faktoranalyser.
 
Vi behøver derfor ikke længere forstå årsagssammenhængene, blot dataene viser, at her er en stabil sammenhæng over tid, lyder fremtidens løfte. Big Data kan derfor bruges til at forudsige fremtiden med en vis sikkerhed, hvis fremtiden minder om fortiden, og det er endnu et dramatisk skridt fra deskriptiv mod prædiktiv statistik.
 
Big Data-databasen i Minority Rapport

Det kan forklares ved hjælp af plottet i den berømte science-fiction-film med Tom Cruise, Minority Rapport, hvor politiet kan forudsige forbrydelser, før de sker. Pointen er, at fortidens forbrydelser ligner fremtidens ugerninger. En evne, som vokser ud af politiets kæmpe Big Data-database og brugen af statistik. Det er ikke længere science fiction, men en potentiel nærliggende mulighed, siger de begejstrede tilhængerne af Big Data. 

Data – Virksomhedens nye grundstof
 
Den første danske bog om Big Data samler fint op på hypen, begrebet og debatten. Bogen hedder Data – Virksomhedens nye grundstof. Den er skrevet af konsulenterne Mikkel Holm Sørensen og Simon Bentholm. Begge har en solid baggrund i medievidenskab, behavioral design og kompleksitetsteori. Det betyder, at de begavet kan sætte Big data-trenden i relation til mange andre aktuelle tendenser i økonomi og sociologi såsom behavioral economics, nudging, selvmåling og gamification. Svagheden er så, at Big Data forsvinder lidt i de mange teorier, og bogen bliver mere en datavinkel på de andre trends end omvendt. Det skaber lidt uklarhed om begrebets omfangslogiske status.
 
Forfatterne er konsulenter, og det fornægter sig ikke i form og indhold. Bogen er bygget op som en konsulentrapport, med fokus på hvordan Big Data kan forandre forretningen for dig. Dispositionen er den klassiske vandfaldsmodel: fra situation til problem til løsning. Hvert kapitel afsluttes med lister med råd og gode spørgsmål til at skabe værdi ved hjælp af de mange data. De mest udbredte Big Data-modeller og -begreber præsenteres pædagogisk og indlæst. Det sikrer, at den virker brugsorienteret og dejlig konkret i forhold til det noget flyvske begreb.  
 
I øjeblikket hersker der stor usikkerhed om, hvad Big Data er?
 
Ikke alt, som tæller, kan beregnes
Indholdsmæssigt er bogen en formidling af de vigtigste debatter og casestudies om emnet. Bogen er langtfra så velskrevet og præcis som det aktuelle internationale hovedværk om emnet: Big Data: A Revolution That Will Transform How We Live, Work, and Think af Viktor Mayer-Schonberger og Kenneth Cukier. Men ros skal forfatterne have for deres kritiske distance til hypen. I flere af de centrale kapitler i bogen tages der kritisk afstand til den såkaldte datafundamentalisme, hvor man ukritisk tror, at data kan tale i sig selv. Altså, at data findes i rå form og objektivt kan udsige noget om virkeligheden, uberørt af menneskelige tanker og teori.
 
Forfatterne tager også fint afstand til den meget naive tro om, at korrelationer kan erstatte kausalitet. En problemstilling som desværre berøres alt for overfladisk efter min smag. Spørgsmålet om verden som enten matematik eller mening er jo en klassisk konflikt i videnskab og filosofi. Big data har de samme præmisser og videnskabsteoretiske problemer, som vi genfinder i behaviorismen og hos de logiske empirister. Logiske regler, data og adfærdsmønstre er i sig selv ikke nok til at forstå noget som helst. Med Einsteins ord: Ikke alt som tæller kan beregnes, og ikke alt som beregnes kan tælles.
 
Rå data findes ikke
Verden og virkeligheden kan derfor ikke reduceres til en naiv empirisme, hvor teorier og fortolkninger erstattes med  ”selvindlysende” data. At sige, at metafysik er nonsens, er i sig selv nonsens. For alle, der blot har arbejdet en lille smule med eksplorativ Big Data-statistik som for eksempel korrespondance-analyser, ved jo, at robuste metafysiske teorier og fortolkningerne af de mange korrelationer fylder alt og er afgørende for at skabe betydning i de mange data.  
 
Den klassiske korrespondance-analyse: Big Data som bevis på det onde kapitalistiske klassesamfund i Frankrig eller seks forbrugssegmenter til hjælp for kapitalismen? Dataenes betydning afhænger af øjnene, som ser
 
Et illustrativt eksempel er her Pierre Bourdieus distinktion, hvor den uoverskuelige Big Data-mængde bruges til en knivskarp spekulativ kulturmarxistisk kritik af det franske samfund. Næppe noget tallene i sig selv har peget på og derfor et godt eksempel på, hvor meget dataene kan og skal fortolkes for at give (marxistisk) mening. Det samme data kunne sjovt nok bruges stik mod deres intention til at hjælpe det kapitalistiske forbrugersamfund med at inddele befolkningen i forskellige livsstilssegmenter og forbrugsmønstre i den såkaldte Minerva-model.
 
Den store sandhed, som alle tallene aldrig peger på
Der er ingen tvivl om, at Big Data kan være en støtte i analyser af fænomener og problemer, der er konsistente over tid, har lav kompleksitet og har klart definerede stabile relationer og korrelationer. De kan også med fordel være første trin i en analyse, hvor Big Data afdækker korrelationer, som efterfølgende analyseres kvalitativt for at forstå årsagssammenhængen.
 
Desværre er forretningslivet og Big Data ofte et ulykkeligt ægtepar, fordi de forstærker hinandens svagheder og blinde vinkler. De problemer, en virksomhed står overfor, er ofte præget af stor usikkerhed, kompleksitet og store forandringer over tid. Her finder vi også de såkaldte sorte svaner af usandsynlige tilfælde, der kan forandre en industri eller en virksomhed for altid. Her er Big Data til lille hjælp, fordi korrelationer kommer til kort over for en klar forståelse af, hvad der er årsag og virkning til succes eller fiasko. Ja, det kan ligefrem være farligt at tro blindt på Big Data i sådanne situationer. Big Data kan derfor aldrig stå alene og vil altid kræve en Big Theory. Matematik og mening er aldrig et enten-eller, men altid et både-og. Det er den store sandhed, som alle tallene aldrig peger på. 
 
Læs også Kforums interview med bogens forfattere og vores tip til din data-research:
 

Del artikel

Tilmeld dig vores nyhedsbrev

Vær på forkant med udviklingen. Få den nyeste viden fra branchen med vores nyhedsbrev.

Forsiden lige nu

Læs også