Osannolika berättelser

Ibland kan man höra om en berättelse att den är osannolik. Det är dåligt. ”Osannolik” ligger högt uppe på listan över omdömen man inte vill ha som författare, tillsammans med ”virrig”, ”tråkig” och ”banal”. (Förutsatt att man inte skriver Douglas Adams-liknande science fiction, där det osannolika verkar ha fått sitt hem.) Men låt mig nyansera det hela lite grand:

Om man skulle skriva sannolika berättelser, skulle det tråka ut absolut varenda läsare! (Icke-cardassisk läsare, kanske jag borde tillägga.)

Det här är en sannolik berättelse:

En man [1] (40 år) jobbar som företagssäljare. Han arbetar ungefär 31 timmar per vecka. Han är gift och har två barn och en silverfärgad Volvo. Han bor i en storstad och åker på en semesterresa per år. Han är tre år från att skiljas (Statistisk årsbok 2013 4.24) men har drygt 40 år kvar att leva (4.27). Han är född i Sverige (4,31). Han utsätts troligen inte för något brott (21.3), men oroar sig för brottsligheten i landet. Om han ändå utsätts för brott klaras det inte upp (21.8). Han mår bra (20.1). Han går på något museibesök, läser ett par böcker, och umgås med vänner. Han har sex ca en gång i veckan men bara med sin fru. Några gånger om året är han med om något osannolikt. Han vinner kanske på en lott, eller träffar en vän på något oväntat ställe.

Ingen kioskvältare! Den berättelsen är för sannolik.

Statistik låter kanske närmast som motsatsen till berättelser. När det inte är lögn förstås. Det ena är matematik, kanske det mest logiska av alla naturvetenskapliga discipliner. Det andra är fiktion, så mänskligt det bara går. Men statistik och berättelser har mer gemensamt än vad man tror. Då tänker jag inte på hur statistik kan användas för att berätta en historia. Jag vill visa på det omvända, att berättelser är statistik. Eller för att vara mer specifik, berättelser bygger på jämförande statistik, d.v.s. sannolikhetslära.

Ian Fleming, som skrev romanerna om James Bond lär ha sagt att hans intriger inte är sannolika, men att de heller inte är omöjliga. (Det finns undantag, framför allt när böckerna sedan blev film, men även i de senare böckerna.) Det är det vi borde ha som utgångspunkt: att berättelserna ska vara möjliga, inte huruvida de är sannolika.

Nästan alla berättelser handlar på ett eller annat sätt om en person eller grupp som ställs inför en situation som är jobbig, och trots att det ser mörkt ut klarar han/hon/de av utmaningen, mot alla odds. Den här grundmyten brukar få representeras av exemplet David och Goliat, där underdoggen David lyckas besegra den förväntade vinnaren. I fiktion förväntar vi oss numera ett ganska stort mått av osannolikhet. Om Goliat skulle vinna, skulle vi bli grymt besvikna. Det här visas på ett tydligt och briljant sätt av Bill Marsilii (något jag säkert skrivit om tidigare):

A Nazi soldier and a young Jewish girl are rolling along the wall, struggling over a loaded Luger when suddenly — BANG! They both freeze.

At this point, as the writer, you stand before three doors. Three ways to go, three possible outcomes for this moment, three choices before you.

Door Number One is the obvious choice: the Nazi’s eyes bulge for a moment and he falls dead to the floor. That’s the choice we’ve all seen a million times, the one that gives us the outcome we want. By making the obvious choice, you’re giving us what we want, but you don’t surprise us in the least. We expected that to happen.

Door Number Two is the dreaded choice: the girl’s eyes bulge and she falls dead to the floor.

Were we surprised? Yes, we were surprised — we did not expect that to happen. But we didn’t expect that to happen because we didn’t want that to happen, and therein lies the danger of choosing Door Number Two. You want to surprise people, but not at the price of making them angry at you.

Dörr nummer två är Goliat-slutet. Därför kan det vara på sin plats att påpeka följande: Vi vill varken ha det sannolika slutet (nazisten) eller det osannolika slutet (tjejen). Vi vill bli överraskade, samtidigt som vi är trygga i att vi inte ska bli för överraskade. Vi vill vara trygga, men också se något nytt. Vi vill ha det geniala slutet! Eller för att tala med Marsilii: dörr nummer tre.

Fotnoter:

1. Jag vet att genomsnittspersonen är en kvinna, men genomsnittspersonen i berättelser är överväldigande övervägande en man. Senaste årets Hollywood-filmer har bara 11% kvinnliga huvudpersoner.

Spännande med statistik, del 2

Jag har tidigare skrivit om statistik. Och om kontrollgrupper.

Nu har jag hittat en ny sajt där de publicerar massor av intressanta grejer som har med statistik att göra, Flowing Data. Framför allt gillar jag kategorin Miscellaneous Visualization där de bland annat visar:

* ett flödesschema över Total eclipse of the heart

* ett korrelationsschema mellan boksmak och studenter med låga SAT-betyg (och uppföljaren musiksmak och betyg)

* sambandet mellan information och förvirring

* hur Powerpoint är fienden (missa inte New York Times-artikeln som nämns i blogginlägget)

* vad man ska säga under sex (fast om man är ateist säger man som bekant andra saker)

Men jag gillar också kategorin Mistaken data. Den visar hur enkelt det är att göra fel med statistik. Missa inte heller kategorin Infographics (till exempel hur man vinner sten-sax-påse).

Statistik är kul

Oaktat Mark Twains berömda sentens om tre sorters lögner, så är statistik rätt spännande. ”Nyligen” publicerades nämligen en studie som visade att Wikipedia tappade grymt många skribenter. (Jag skriver nyligen, för dr Ortegas studie publicerades i somras, men det var först nyligen som tidningarna började skriva om den.) Som tidningarna hoppade på det här! Wikipedia är dött, döende eller åtminstone svårt sjukt, skrev folk. Spekulationerna om varför antalet sjönk rusade allt snabbare: ”Det är för svårt med alla regler”, ”Folk på Wikipedia är för ovänliga”, ”Allt är redan skrivet”, ”Vi har redan rekryterat alla som vill skriva”, etc.

Nu visade det sig att dr Ortega hade beslutat sig för att räkna alla som hade registrerat sig och gjort en redigering som en användare. Logiskt, va? Nja, rätt många registrerar sig på Wikipedia för att de tror att de måste. Andra registrerar sig för att klottra mer ”osynligt”. Det finns säkert andra förklaringar. Kontentan är i alla fall att det är ganska många som bara gör en enda redigering. Den långa svansen, ni vet. Wikistats, den officiella statistiksidan för Wikipedia, räknar därför istället bara folk som gjort minst 5 redigeringar – per månad. Om man tittar på de användarna, så är det inte lika brant neråtkurva där. Lite mindre dramatiskt för tidningarna, alltså, vilket gör att det inte kommer att skrivas något om det.

Men problemet är faktiskt större än så. Det finns ett grundläggande antagande i dr Ortegas studie, som Erik Zachte, Erik Möller och dr Ortega själv nu håller på att ifrågasätta, nämligen hur man vet att en användare slutat redigera på Wikipedia.Originalstudien utgick ifrån alla som inte redigerade den här månaden men tidigare hade varit aktiva hade slutat (eller ”dött” som det faktiskt kallas). Om man drar ner på sin Wikipedia-aktivitet under en månad har man alltså slutat, enligt det sättet att räkna. Med tanke på att det är betydligt fler som redigerar nu än för ett år sedan är risken för att folk ska göra sådana uppehåll större. Ju fler som arbetar i en fabrik, desto större antal människor har semester samtidigt, eller hur?

Och hur kul är sånt att skriva om?