Jeg har altid fundet spilteori særdeles spændende, derfor forsøgte jeg i sidste uge at benytte nogle spilteoretiske idéer til at analysere cykelløb. Til min store forbavselse viste det sig dog, at jeg hverken kunne ikke bruge spilteori til at forudsige eller udførligt forklare cykelrytternes adfærd. Dette har bragt mig i tvivl om spilteoriens generelle anvendelighed.
Det klassiske Prisoner’s Dilemma, som først blev formuleret af Albert W. Tucker, kan med fordel benyttes til at illustrere min tankegang og følgende tvivl. I dette dilemma skal man antage, at to personer – Bob og Al – bliver anholdt af politiet, mistænkt for en seriøs forbrydelse. Disse to fanger holdes dernæst adskilt og præsenteres for følgende regler: Hvis ingen af fangerne taler, har anklageren ikke mulighed for at få dem dømt for mere end nogle mindre forseelser, der højst giver 1 års fængsel. Hvis begge tilstår kan de på grund af deres samarbejdsvilje slippe med 10 års fængsel. Hvis kun den ene tilstår og angiver den anden, vil den som tilstår slippe helt for straf, mens den som angives får 20 års fængsel. Da fangerne holdes i isolation, kan de ikke koordinere deres strategier. De skal under den herskende usikkerhed vælge mellem tale og tavshed. Fangernes dilemma består hernæst i, om de skal tale eller holde mund.
Bob sidder altså alene og tænker strategisk over situationen. Bob ved ikke hvad Al gør. Hvis Al tilstår, så får Bob 20 år hvis Bob tier, men slipper med 10 år hvis Bob taler. Altså er det under den forudsætning bedst for Bob at tilstå. Hvis Al på den anden side tier, så er Bob ude i morgen hvis han taler, men får 1 år hvis han holder mund. Igen er det billigst for Bob at tilstå. For Bob er det – uanset hvad Al gør – således mest rationelt at tilstå. Als overvejelser er selvfølgelig helt parallelle og ensartede. Også for ham er den bedste strategi tilsyneladende at tilstå, for det giver den letteste straf, hvad enten Bob gør det ene eller det andet.
De tilstår altså begge og får 10 år hver. Men denne rationelle løsning er ikke den Pareto-optimale for dem. Havde de begge tiet, ville de have sluppet for 9 år i skyggen. Pointen er, at de ved at forfølge deres egeninteresse havner i en ligevægtstilstand, der ikke er Pareto-optimal.
Man kan med lidt god vilje finde analoge tilstande i cykelløb. Man kan sagtens forestille sig, at to ryttere, der er i udbrud, vil havne i samme dilemma. Hvis de samarbejder vil de holde til løbets slutning og kan dermed køre om sejren uforstyrret af de mange ryttere i feltet. Til gengæld kan en af rytterne også risikere at trække den anden rytter hele vejen til finalen, hvilket vil betyde, at den hvilende rytter, der jo blot har udnyttet den arbejdende rytters slipstrøm, kommer relativt frisk til finalen og vil derfor vinde let. Men hvis ingen af dem samarbejder, så bliver de indhentet af det jagtende felt og mister chancen for at køre om sejren. Det er altså samme regler som i Prisoner’s Dilemma. Nedenstående tabel kan illustrere cykelrytterens dilemma.

Som man kan se, så burde cykelrytterne vælge at slappe af og være en klassisk free rider. Det pudsige er bare, at rytterne næsten altid vælger at arbejde. Man kan indvende, at dette samarbejde opstår på baggrund af den kommunikation, der nødvendigvis må opstå mellem de to ryttere. Fangerne i det klassiske eksempel blev jo isolationsfængslet, mens rytterne har gode muligheder for at koordinere deres indsats og aftale en fælles løsning. Forskellen er simpelthen, at cykelsport er et kooperativt spil, mens Prisoner’s Dilemma er et ikke-kooperativt spil. Men er det virkelig en acceptabel forklaring? Det er sandt, at kommunikationen kan ændre på forholdene, men ofte tilrettelægges og planlægges samarbejdet altså slet ikke. Det opstår snarere spontant og ofte i det sekund angrebet bliver sat ind – altså uden kommunikation hverken på forhånd eller undervejs. En rytters første tilskyndelse er simpelthen ikke at slappe af, men derimod at arbejde. Samarbejde er udgangspunktet, ikke noget man kommunikerer sig frem til. Faktisk forekommer reel free riding kun når en rytter har fået besked på at vente eller holde tilbage på grund af holdtaktiske hensyn.
Hvis det ikke skyldes kommunikationen, hvad skyldes dette forhold så? Nogle vil mene, at det er fordi cykelløb er et gentaget spil, hvor rytterne benytter sig af en tit-for-tat-strategi. Denne strategi fortæller hver rytter, at de altid skal samarbejde i første runde, for derefter at agere på samme måde som din modstander gjorde i den forgangne runde. En gruppe af tit-for-tat-ryttere vil altså altid samarbejde, mens ryttere, der ikke benytter sig af tit-for-tat-strategien, vil blive straffet, fordi ingen til sidst vil samarbejde med dem. De vil dermed i det lange løb tabe til tit-for-tat-rytterne, medmindre de ændrer strategi.
Man kan dog indvende, at denne forklaring er uholdbar. Tit-for-tat-strategien forudsætter nemlig, at aktørerne ikke ved hvor mange runder, der er i spillet. Jeg vil dog hævde, at de fleste cykelryttere har en udmærket idé om hvornår deres nuværende løbsserie slutter. Medmindre man betragter hele cykelsportens historie som et langt spil, så må der nødvendigvis forekomme nogle forudsigelige afslutninger på cykelløbene: Tour de France, Giro d’Italia, Ardenner-klassikerne og alle andre etapeløb og løbsserier har altså en sidste runde. Eftersom rytterne ved hvornår denne sidste runde indtræffer, så burde det være rationelt at handle udelukkende i egeninteresse i denne runde, da der ikke ville være flere runder at straffe vedkommende i. I den næstsidste runde vil rytterne så også handle i egeninteresse, da de vil vide, at alle vil handle i egeninteresse i den sidste runde, og dermed ikke vil straffe rytterne, der handlede i egeninteresse i næstsidste runde. Dette betyder så, at de heller ikke er truet i tredjesidste runde, hvor de så også kan handle udelukkende i egeninteresse. Denne kædereaktion fortsætter helt til første runde, hvilket betyder, at det ville være yderst rationelt af rytterne at vælge ikke at samarbejde overhovedet. Altså er udkommet præcist det samme som i det klassiske dilemma – den såkaldte Nash-ligevægt er at slappe af hver gang. Problemet er som sagt bare, at dette udkom ikke stemmer overens med cykelsportens realiteter.
Hvad kan årsagen til denne praksis dog være? Ja, jeg ved det faktisk ikke. Måske er det blot tit-for-tat-strategi eller måske er det på grund af kommunikationen. Kan Robert Axelrod måske hjælpe? Eller også skyldes det helt andre forhold? Ære og sportmanship måske? Den tyske cykelrytter Jens Voigt opgav i hvert fald frivilligt en sikker sejr, fordi han følte, at han ikke havde arbejdet nok i frontgruppen: “I was always sitting on the back of the attack, but I couldn’t win today because I didn’t work at all. You can only win if you are the strongest and it wouldn’t have been right if I did.” Hvad er så idéen med at sidde med til mål som en free rider? Og hvordan vil man lige forklare den spilteoretisk?
Spilteorien har altså svært ved at forklare cykelrytternes adfærd. Dette medfører et endnu større problem, nemlig at spilteorien ikke kan bruges til at forudsige cykelrytternes adfærd. Er dette en generel tendens? Er det normalt, at spilteoriens ubestemthed og fejlagtige ligevægtstilstande gør det mere eller mindre umuligt at lave empirisk testbare forudsigelser og forklaringer? I så fald er dette en kæmpe svaghed. Spilteorien vil sikkert altid være interessant, da det fortæller nogle spændende historier, men dens praktiske anvendelighed er altså en anelse begrænset, hvis den har tilsvarende forklarings- og forudsigelsesproblemer på andre områder.


