3.5 års relation, i Whatsapp-meddelanden

Analyserar data från en Whatsapp-chatt med min flickvän

Alla hjärtans dag 2020 har nyligen gått. Årets dag där par firar sin relation och sociala medier är fylld med inlägg, bilder och beröm för "andra hälften". Det är ofta en otrolig tid på året för alla som inte är i en relation, som måste ta itu med de skildringar av perfektion som vi så ofta ser på våra tidslinjer. Trots att jag är i ett förhållande är jag också trött på att se orealistiska skildringar av par online så i år bestämde jag mig för att slå tillbaka med lite kallt hård data. För att göra detta offrade jag min integritet och vände mig till det medium som jag anser vara det mest riktiga - min Whatsapp-chat med min flickvän.

Jag upptäckte nyligen att det är möjligt att ladda ner hela chatthistoriken från Whatsapp till en enda textfil. Jag trodde att detta kan vara en mycket intressant datakälla som kan ge en mycket mer realistisk, unik beskrivning av hur ett förhållande faktiskt är. Så här i den här artikeln kommer jag att lägga mina där utomhus i hopp om att du kan hitta analysen intressant, eller att den kan inspirera dig till a) fundera över hur data kan motverka den falska verkligheten vi ser på sociala medier, b) gräva lite djupare i de uppgifter du själv producerar eller c) ge din partner en väldigt nördig, datavetenskap-tema Alla hjärtans present.

(Bonuspoäng om du kan identifiera alla avsnittrubriker ...)

Här kommer solen

Som jag nämnde, Whatsapp låter dig ladda ner hela historiken för något av dina chattar mycket enkelt och exportera som en enda textfil, som jag sedan transformerade och analyserade med programmeringsspråket R. Chatten i fråga startade i oktober 2016 ( sedan jag senast bytte telefonnummer - min flickvän och jag har varit tillsammans sedan mars 2016).

Det är vår huvudsakliga form av virtuell kommunikation (vi textar eller använder sällan Facebook, till exempel) och resultatet var ett datasätt på 52 163 individuella meddelanden - i genomsnitt 43 meddelanden per dag. Detta överraskar mig redan och vi har inte ens repat ytan ännu ...

Datakraften

Målet är att sammanfatta vårt förhållande så strax utanför fladderträet vi ska aggregera och titta på siffrorna på hög nivå. Så här är en kort översikt:

  • 1 1212 dagar - mellan 18 oktober 2016 och 12 februari 2020.
  • 980 (81%) av dessa var "aktiva" dagar (dvs. meddelanden skickades).
  • 52 163 meddelanden. Jag skickade 1 495 fler meddelanden än min flickvän - igen, inte vad jag förväntade mig att hitta!
  • 11 670 unika ord användes (av vilka många inte är riktiga ord). Jag använde 8 844 unika ord där min flickvän använde 7,043.
  • 2 deltagare - min flickvän och jag - som bor i Storbritannien och i våra tidiga tjugoårsålder.

Jag vill inte skriva något

Antalet meddelanden vi skickar varje dag har i genomsnitt sjunkit under tiden vi har varit tillsammans.

Antalet Whatsapp-meddelanden som skickas per dag mellan min flickvän och jag, 16 oktober - 20 februari. Den blå linjen indikerar det jämna genomsnittet.

Detta beror främst på det faktum att vi i början av denna tidsperiod både var på universitetet och levde från varandra och därför skickade meddelanden oftare. Du kan sedan se i mitten av 2017 när vi slutar universitetet och bor tillsammans men ännu inte på ett heltidsjobb. På grund av detta tillbringade vi större delen av vår tid tillsammans varje dag och som ett resultat meddelade vi inte varandra. I september 2017 började vi jobb och meddelandefrekvensen plockades upp igen (oops).

Om du tittar noga ser du också ett mönster av en spik runt juletiden - som vi tillbringar isär med våra respektive familjer - och ett efterföljande dopp runt det nya året - som vi brukar spendera tillsammans.

Fredag ​​jag är kär

Nästa graf kan lätt vara en kurva över motivationsnivåer under hela veckan. Vi skickar fler meddelanden på vardagar än på helger.

Genomsnittligt antal meddelanden som skickas per veckodag.

Våra meddelandemönster reflekterar mina allmänna känslor gentemot varje veckodag och når en crescendo på fredag ​​när vi troligen är upptagen och umgås. Det handlar ofta om att planera och kommunicera relevant information (så fler meddelanden). Söndag är den veckodag som vi sannolikt tillbringar tillsammans så vi skickar betydligt färre meddelanden.

Gång på gång

Följande med temat mer meddelanden under arbetsveckan låt oss se om vi verkligen är så dåliga på att skjuta upp eller om jag kan spara lite ansikte ...

Genomsnittligt antal meddelanden per minut under 24 timmar.

Du kan se att våra meddelanden gradvis ökar under morgonen och når en topp runt lunchtiden (överraskande). De doppar sedan lite efter lunch när vi går tillbaka till arbetet och plockar upp igen efter 16:00, ungefär när vi vanligtvis slutar arbetet. Färre meddelanden på kvällarna är helt enkelt en annan återspegling av det faktum att vi inte skickar meddelanden när vi är tillsammans.

Mer än ord

Nu för det verkliga fördömande beviset ... tid att titta på vad våra mest använda ord var. För detta tog jag bort alla stoppord ('a', 'the', 'och' etc.) och de 10 mest använda orden av var och en av oss kan ses nedan:

Topp 10 mest använda ord för var och en av oss, exklusive stoppord

Vi är uppenbarligen överens med varandra ... mycket. Jag är ganska säker på att min engelska undervisande far skulle bli besviken över min ofta användning av "gonna". Det är också tydligt att 'ah' är vårt favoritpåfyllningsord - eller vad som motsvarar texttexter.

Jag tycker att det är intressant att "tid" är ett så vanligt ord för oss båda, förmodligen återspeglar situationer när vi försöker organisera eller planera något ("vilken tid?", "Om vi ​​har tid", etc.). Det är också ganska uppenbart vem som säger "god natt" och "god morgon" oftast.

Totalförmörkelse av hjärtat (Emoji)

Emojis är en extremt populär kommunikationsform idag och används ofta för komisk effekt eller för att framställa känslor utan att behöva skriva orden. För att avsluta denna flyktiga analys av Whatsapp-chatten mellan min flickvän och jag, låt oss ta en titt på vad våra favoritemojier är:

Diagram som visar alla våra 10 mest använda emojis under tidsperioden

Ingen av oss är förvånade över vad våra mest använda emojis är. Jag är dock mycket förvånad över hur mycket jag använder emoji-ögonen på rullarna ... särskilt när du anser att det är mer än dubbelt så mycket som alla emoji som min flickvän använder, andra än de två bästa.

Jag tycker också att det är intressant att se hur diagrammet återspeglar skillnader i hur vi använder emojis. Jag brukar använda en bredare variation och - även om jag helt klart har några favoriter - spridningen av antalet gånger jag använder varje emoji är ganska jämn. Min flickvän, å andra sidan, har två emojis som helt klart är hennes "gå till" emojis - den se-ingen-onda apan och det skrattande gråtande ansiktet.

EDIT: Koden som används i den här artikeln är nu tillgänglig på min Github här.

Dina data är ett underland

Tja, jag hoppas att du har haft denna korta insikt i mitt förhållande - jag är säker på att du tyckte det är spännande. Sammantaget verkar det som om 3,5 år av en relation på Whatsapp kan sammanfattas med en ögonrullande emoji.

I allvar om denna typ av analys och presentation av data intresserar dig, ge mig en följning och ge min publicering (Data Slice) ett följ för att hålla mig uppdaterad med mina artiklar! Jag överväger också att skapa en app så att alla snabbt kan se en visualisering av sin Whatsapp-chatt med liknande diagram / diagram till det du ser här - låt mig veta i kommentarerna eller med direktmeddelande om det är något du skulle vara intresserad av.