Hvad er din virksomheds Nash-equilibrium?

Spilteori er en meget omtalt og anvendt disciplin – ikke kun akademisk, men også populært. Den er blevet brugt til at formulere strategier for anvendelsen af atomvåben, studere markedskræfter, aktiemarkeder, sociale institutioner, firmaers organisering, optimering af overskud i virksomheder, konventioner, moral, demokratiske principper etc. Dertil kommer mere almene og populære indslag som filmen A Beautiful Mind fra 2001, baseret på Sylvia Nasars bog og med Russell Crowe i hovedrollen som Nobelpristageren og spilteoretikeren John Nash. En anden film, der har spilteori som omdrejningspunkt, er Wargames fra 1983 med Matthew Broderick og Ally Sheedy i hovedrollerne. Forskellige ”populærkulturelle” game-shows har også elementer af spilteori i deres grundlæggende struktur, herunder Friend or Foe, Survivor og de danske plagiater som Robinson Ekspeditionen, Big Brother, og hvad de andre simulerede ”reality”-programmer nu hedder. Men hvad er spilteori egentlig? Og hvilke styrker ligger der eksempelvis i en spilteoretisk forståelse af virksomhedens sociale spil?

Spilteori er oprindelig en matematisk-økonomisk disciplin, der studerer situationer, hvor forskellige spillere har forskellige udbyttemaksimerende handlinger at vælge imellem Spillerne kan være alt fra skak- eller pokerspillere til direktører i multinationale virksomheder, politikere, computereksperter og robotkonstruktører, spin-doktorer, trafikanter, human resource-managers, reklamefolk etc. I spilteori interagerer forskellige spillere.

Disciplinen kan karakteriseres som studiet af de udbytteoptimerende valg, man kan træffe, når cost-benefit af valgmulighederne ikke er fikseret en gang for alle, men er afhængig af de valg, som de andre spillere træffer.

Og sådan er det som oftest i vores hverdag. Det er meget sjældent, at vi får lov til at vælge præcis det, som passer os bedst, for valget er ofte blokeret af andre menneskers strategier, valg og forventninger til udbyttet. I den situation forsøger vi at vælge en strategi, der maksimerer vores eget udbytte – det er en rent menneskelig mekanisme. Spilteori går ud på at forstå dette mere formelt. Vi skal derfor starte dér, hvor spilteorien stammer fra – i matematikkens univers.

En matematisk repræsentation af spil

Da spilteori oprindeligt er en matematisk-økonomisk disciplin, er de undersøgte spil veldefinerede matematiske objekter. Et spil består generelt af (1) nogle spillere, (2) en mængde strategier, som spillerne legitimt kan bruge, samt (3) en specifikation af de udbytter, som enhver kombination af strategierne giver anledning til. Der findes forskellige repræsentationsformer, hvor vi her blot vil koncentrere os om en af de to standard-repræsentationer kaldet normalform, eller spillets strategiske form.

I normalform gengives spillet i en matrix, der viser spillerne, strategierne og de dertilhørende udbytter. Forsøger man eksempelvis at repræsentere et spil, hvor to spillere hver har to strategier med dertilhørende udbytter kunne det tage sig således ud:

	Spiller B – vælger venstre	Spiller B – vælger højre
Spiller A – vælger op	4,3	-1, -1
Spiller A – vælger ned	0,0	3,4

Udbyttet er gengivet i cellerne på en sådan måde, at det første tal er udbyttet for Spiller A, mens det andet tal er udbyttet for Spiller B. Hvis Spiller A nu vælger strategien ”at gå op”, mens Spiller B vælger strategien ”at gå til venstre”, så får Spiller A et udbytte på 4, mens Spiller B er efterladt med et udbytte på 3. Disse tal kan stå for alt fra penge til anerkendelse, street-respect, aktieudbytte, forfremmelse eller andre former for goder.

Der findes forskellige spil i matematik og økonomi, som kan gengives i normalform, og som er blevet studeret indgående. Det hænger sammen med at de, omend til tider noget simplificeret, indfanger væsentlige træk af vore valg, handlinger og adfærdsmønstre i forskellige situationer. Her skal blot nævnes et par stykker: symmetriske og asymmetriske spil samt 0-sum spil.

Symmetriske spil: Kyllinge-spil
I et symmetrisk spil er udbytterne ved at spille en bestemt strategi kun betinget af, hvilken anden strategi der spilles, men ikke af, hvem der spiller den. Hvis spillernes strategi kan byttes rundt, uden at udbytterne, der knytter sig til strategierne, ændres, så er spillet symmetrisk. Mange af de spil, der kan gengives i en 2×2-matrix, er symmetriske. Et spil som Kylling er symmetrisk: 2 biler, der kører mod hinanden, hvor det gælder om at vige sidst:

	Spiller B – vige	Spiller B – fortsætte
Spiller A – vige	3,3	2,4
Spiller A – fortsætte	4,2	1,1

Også under Cuba-krisen i oktober 1962 så vi et eksempel på et symmetrisk ”spil”, idet den amerikanske udenrigsminister Dean Rusk sagde: "We're eyeball to eyeball, and I think the other fellow just blinked".

Kylling (eller ørn-due-spillet, som det også kendes som) er ydermere blevet brugt til at analysere dyrenes territorial- og kampadfærd, ret til føde etc. Politologer og socialvidenskabsfolk har så sidenhen overført disse analyser til menneskers forhold til ejendomsret, køkultur, trafikregulering og i det hele taget enhver konvention, der måtte opstå, når nogen mener at have ret til noget over andre, fordi de er kommet først (eller sidst for den sags skyld). Et andet kendt symmetrisk spil kaldes Fangernes dilemma, og det skal vi se nærmere på nedenfor, da det har vidtrækkende konsekvenser for eksempelvis økonomi og virksomhedsledelse.

Asymmetriske spil: 0-sums-spil

Nogle af de mest studerede asymmetriske spil er de spil, i hvilke der ikke er identiske strategier fikseret for begge spillere. I et diktatur er der oplagt nok ikke identiske strategier fikseret for diktatoren og dem, han hersker over.

Et klassisk asymmetrisk spil er 0-sum spillet. I et 0-sum spil er det totale udbytte for alle spillere altid lig 0, uanset hvordan strategierne kombineres. Eller sagt på en anden måde: En spiller vinder kun noget på de andre spilleres bekostning:

	Spiller A	Spiller B
Spiller A	2,-2	-1, 1
Spiller B	-1,1	3,-3

Kortspillet Poker er et godt eksempel på et 0-sum spil, fordi man vinder præcis den mængde penge, som ens modspiller taber (se eksempelvis Chris Ferguson: http://www.timharford.com/favourites/pokermachine.htm ).

Flere bræt-spil er også 0-sum spil, det meste kendte af dem er nok skak. En del af de spil, som spilteoretikere studerer, er ikke-0-sum spil, og det hænger sammen med, at nogle af disse spils udfald har netto-resultater, som er større eller mindre end 0. Det betyder kort sagt, at dét, at en spiller vinder, ikke nødvendigvis implicerer, at den anden spiller taber tilsvarende. Blot fordi kunden før dig fik den sidste liter økologisk letmælk nede i Netto, betyder det ikke nødvendigvis, at du har tabt det økologiske letmælkskapløb, hvis du kan gå ned i Fakta og få det samme.

Anvendelser af spilteori

Der er meget mere at sige om de matematiske modeller og resultater i spilteori, men det bliver en historie, der må fortælles ved en anden lejlighed. Som allerede indikeret ovenfor, finder spilteori anvendelse mange steder – og i mange forskellige discipliner, og derfor anses spilteori som et sandt interdisciplinært anliggende, der studeres og anvendes ligeligt af matematikere, biologer, økonomer, socialvidenskabsfolk, dataloger, politologer osv. Dertil kommer så, at alt fra PR-medarbejdere, krigsstrateger, reklamefolk og politikere nyder godt af spilteoriens indsigter. Her er et par eksempler.

Fanget i økonomien

Økonomer har i tidens løb anvendt spilteori til at analysere en lang række forskelligartede økonomiske fænomener, herunder auktioner, markedsformer, handel, netværksformation, valgsystemer, osv. Her har forskningen ofte koncentreret sig om bestemte klynger af strategier, der kaldes ligevægtstilstande (equilibria) i spil. Disse løsningsbegreber i form af ligevægtstilstande er typisk baseret på, hvad der kræves af normerne for rationalitet. En af de mest kendte ligevægtstilstande er det såkaldte Nash-equilibrium opkaldt efter John Nash: En klynge af strategier er et Nash-equilibrium, hvis hver strategi repræsenterer det bedste svar til de andre spilleres strategi. Hvis det forholder sig således, at enhver spiller spiller strategierne i et Nash-equilibrium, så har de ingen grund til at udvise divergerende (læs irrationel) adfærd, siden deres strategi er det bedste, de kan gøre, givet hvad de andre spillere gør. Rationalitet betyder i økonomisk modellering som oftest at maksimere egenudbyttet, hvor udbyttet igen typisk er penge.

Fangernes dilemma

Til denne antagelse om rationalitet i form af egenudbytte-maksimering for den enkelte spiller findes det klassiske modeksempel kaldet Fangernes dilemma. Hovedbudskabet i dilemmaet er, at det faktisk til tider bedre kan betale sig at samarbejde end at arbejde på at maksimere udbyttet for sig selv!

Siden dette dilemma har vidtrækkende konsekvenser, ikke kun i økonomi, men ligesåvel i andre discipliner, skal vi se lidt mere detaljeret på det. Fangernes dilemma blev oprindeligt formuleret af Merrill Flood og Melvin Dresher, der i 1950’erne arbejdede for The RAND Corporation med at formulere strategier for anvendelsen af kernevåben. Senere blev dilemmaet formaliseret af Albert W. Tucker, der gengav det med udbytter i form af mulige fængselsdomme, og således fik det navnet Fangernes dilemma:

Two suspects, A and B, are arrested by the police. The police have insufficient evidence for a conviction, and, having separated both prisoners, visit each of them to offer the same deal: if one testifies for the prosecution against the other and the other remains silent, the betrayer goes free and the silent accomplice receives the full 10-year sentence. If both stay silent, the police can sentence both prisoners to only six months in jail for a minor charge. If each betrays the other, each will receive a two-year sentence. Each prisoner must make the choice of whether to betray the other or to remain silent. However, neither prisoner knows for sure what choice the other prisoner will make. So the question this dilemma poses is: What will happen? How will the prisoners act?

Dilemmaet kan kort gengives således:

	Fange B tier	Fange B fortæller
Fange A tier	Begge får 6 måneder	Fange A får 10 år, Fange B går fri
Fange A fortæller	Fange A går fri, Fange B får 10 år	Begge får 2 år

Dilemmaet opstår nu under antagelsen af, at begge fanger kun er interesserede i at minimere deres fængselstid, eller med andre ord, maksimere deres egenudbytte. Hver spiller har to muligheder: At samarbejde med sin medskyldige og dermed tie, eller at bryde deres indbyrdes pagt og dermed fortælle politiet, hvad der er sket, og således bedrage sin medskyldige for at få en mildere dom. Udfaldet af hvert valg afhænger af valget for den medskyldige, men den respektive fange må vælge uden at vide, hvad den anden fange har besluttet sig for at gøre.

Antag, at fangen nu overvejer det bedste træk. Hvis hans partner tier, så er hans bedste træk at fortælle, for så går han fri i stedet for at få en mild fængselsdom. Hvis hans partner nu vælger at fortælle, så er hans bedste strategi stadig også at fortælle, for det giver en mindre fængselsdom end den, han ville få ved at tie. Sådan tænker den ene fange, ... og sådan tænker den anden også, hvorfor han således også vil fortælle og dermed bedrage sin partner.

For denne betragtning er det optimale udfald for gruppen bestående af de 2 fanger at samarbejde med hinanden, eftersom dette ville reducere den samlede fængselstid til et år. Enhver anden beslutning ville være værre for de 2 fanger sammenlagt. Når fangerne bedrager hinanden, opnår hver fange et værre udfald, end de ville have gjort, hvis de havde samarbejdet! Moralen er derfor, at samarbejde kan betale sig.

Til tider kan egeninteresse være værst for alle, inklusiv en selv, og det er ligegyldigt, om vi taler om fanger i fængsel eller ledere i virksomheder.

Lønninger i virksomheden

Virksomheder kan ofte være fanget i et Fangernes dilemma. Som eksempel kan man forestille sig en direktion, der overvejer en mellemleders løn. Antag, at alle mellemledere betales ret moderate gager, der kun marginalt varierer i lyset af ansvarsområde, specialist-ekspertise etc. Antag ydermere, at der i mængden af mellemledere til rådighed på arbejdsmarkedet ligger en gruppe på ca. 20 %, der er de andre overlegne, og som, hvis de arbejdede for virksomheden, ville øge aktieværdien for aktieindehaverne med mere end det gennemsnitlige.

På den anden side er der 10 % af mellemlederne til rådighed på markedet, der er alle de andre underlegne, og som, hvis de arbejdede for virksomheden, potentielt ville skade aktieindehaverværdien.

Hvis det nu forholdt sig således, at alle firmaer tilbød moderate gager, så ville det være i den enkelte virksomheds interesse at afvige og betale mere end det normale. Ved at gøre det kunne virksomheden tiltrække overlegne talenter og således få større succes end konkurrenterne.

	Marked – top 20 %	Marked B – bund 10 %
Direktion – høj gage	3,3	1,4
Direktion – moderat gage	4,1	2,2

Samtidig har en virksomhed ikke lyst til at befinde sig i den situation, hvor den betaler betragtelig mindre end gennemsnittet, for det kunne betyde, at virksomheden kun kan tiltrække de underlegne mellemledere. Med andre ord er det at tilbyde højere lønninger en dominerende strategi, selv når det betyder, at virksomheden ikke får det bedre end den ville have det, hvis den havde betalt moderate gager. Ikke desto mindre er det bedre end at risikere at ligge i bunden med de 10 % dårlige mellemledere.

Det skal man måske lige huske på, når man forhandler løn, ikke mindst når det i øvrigt gælder i virksomheder, at lønnen er hemmeligholdt blandt mellemlederne. Analysen kan således også anvendes på mellemlederniveauet alene – eller på ethvert andet trin i organisationen, hvor man skal træffe valg om sin potentielle lønforhøjelse uden at vide, hvad den anden får. Det er ikke altid tilfældet, at man blot skal gå efter den højest mulige lønforhøjelse for sig selv. Satser man for højt kan det være, at ens kollega får lønstigningen. Går man derimod efter en moderat lønstigning kan det være at man får den, og uanset om kollegaen får det samme, er det jo bedre end ingenting

Spillets begrænsninger

Fangernes dilemma er langt fra det eneste spil, der på passende vis forklarer noget om måden, hvorpå interagerende instanser fungerer. Spilteori har et solidt arsenal af spil og modeller for adfærd, der kan indfange væsentlige træk af vore handlemåder. Dermed ikke sagt, at spilteorien er mirakelkuren, hvormed al social interaktion skal forstås

– den har sine naturlige begrænsninger, som spilteoretikere generelt er bekendt med. Nogle handlemønstre er ikke nødvendigvis drevet frem af egenmaksimering, fx selvopofrelse, næstekærlighed m.v. Det kan godt være, at de kan modelleres som udtryk for egen maksimering, men det ændrer ikke på den oprindelige intention.

Matematiske modeller indeholder generelt abstraktioner og simplificeringer, og det hænger sammen med, at vores måde at tænke, handle og agere på ikke er fuldt forstået – derfor må der abstraheres og simplificeres. Abstraktioner og simplificeringer kan sidenhen modificeres og nuanceres i takt med, at vores forståelse af handlemønstre udvides som resultat af de simple modeller – og nogle sociale handlemønstre viser sig måske helt at undsige sig en formel tilgang, men det er for tidligt at konkludere endnu. Selv hvis det er tilfældet, så ændrer det ikke på, at

Ligegyldig hvem du er,

og hvor du er,

er spilteorien dér.

FAKTABOKS om spilteori

Allerede i 1713 formulerede James Walgrave i et brev en minimax mikset strategi for kortspillet Le Her for 2 spillere. Sidenhen kom Antoine Augustin Cournots Researches into the Mathematical Principles of the Theory of Wealth fra 1838. Selvom man kan spore disse spredte spilteoretiske værker et godt stykke ned igennem den akademiske historie, så var det først den fabelagtige amerikanske matematiker John von Neumann, der i en serie af artikler indstiftede spilteorien som en matematisk disciplin i 1928. Von Neumanns arbejder i spilteori kulminerede i det klassiske værk fra 1944, The Theory of Games and Economic Behavior, som von Neumann forfattede sammen med Oskar Morgenstern. I 1950 kom så den første formulering af Fangernes dilemma, der var genstand for meget eksperimentelt arbejde fra The RAND Cooperation.

I samme periode udviklede John Nash ideen om ”optimum”-strategien for mange-spiller-spil, der siden blev kendt som Nash-equilibrium. Igennem 1950’erne og 60’erne blomstrede spil-teorien, og i 1965 formulerede den tyske spilteoretiker Reinhard Selten en vigtig forfinelse af Nash-equilibria; i 1977 lykkedes det en anden spil-teoretiker, John Harsanyi, at formulere et begreb om fuldstændig information i spil. Sammen modtog Nash, Selten og Harsanyi Nobelprisen i økonomi i 1994. Nobelpristagere i økonomi, som egentlig er spil-teoretikere, er der flere eksempler på, og i 2005 vandt amerikanerne Thomas Schelling og Robert Aumann Nobelprisen i økonomi; Schelling for sine arbejder om evolutionær spilteori, og Aumann for sine arbejder om almen viden i spilteori.

Der findes selvsagt oceaner af litteratur om spilteori, og meget af det er ganske teknisk. Har man imidlertid lyst til at en mere lettilgængelig indføring i spilteori, der også beskriver de motiverende faktorer, som har fået de allerstørste spilteoretikere i verden til netop at interessere sig for spilteori – inkl. Nobelpristagerne Schelling og Aumann – kan henvises til bogen Game Theory: 5 Questions, der i foråret 2007 vil blive udgivet på Automatic Press / VIP i New York. Mere information om Game Theory: 5 Questions kan findes på www.gametheorists.com.