Är det fler algoritmer och mer datorkraft bokvärlden behöver?

The Invention of Solitude

The Invention of Solitude (Photo credit: Wikipedia)

Häromdagen skrev vi ett inlägg om Stanford-universitetets LitLab och dess ledare, professor Franco Moretti, som hävdar att framtidens litteraturforskning kommer att gå ut på att processa enorma mängder text med hjälp av extremt kraftfulla datorer.

I en stort uppslagen artikel i Financial Times berättade man bland annat om Morettis ”upptäckt” att romantitlarna blev kortare under perioden 1740-1850. Inte helt imponerande. För det första är det en ganska gammal nyhet och vore det inte det skulle en dammig stackars gammalhumanist utan dator kunna komma fram till det på egen hand. LitLab sysselsätter ett trettiotal personer.

Det är fullt möjligt att LitLab kommer att ge stora bidrag till framtidens litteraturforskning, men ser av flera skäl, som egentligen är ganska uppenbara, inte ut att kunna ersätta den traditionella litteraturfoskningen än på ett tag. Som affärsidé är däremot LitLab briljant, lätt att sälja in i tider när humaniora inte direkt är jättehett.

Men om datorer kan vara till hjälp är det naturligtvis förträffligt, så vi följde ett spår i en liten faktaruta i artikeln om LitLab. Det är en helt kort text: ”BookLamp recognises how similar one book is to others in the same genre. Simply type into BookLamp’s search bar one of your favourite novels and it will return a data-driven list of 20 more titles that you’ll like.”

BookLamp presenteras alltså som ett exempel på ett fruktsamt möte mellan big data och litteraturen. Sajten gör anspråk på att kunna erbjuda meningsfulla sökningar bland tiotusentals titlar, skön- och facklitteratur, och få fram böcker som liknar den man söker på.

Vi sökte lite på svenska deckarer och fick fram förslag på fler svenska deckare. Vi sökte bland annat på Albert Camus självbiografi Den sista människan och fick fram en massa random självbiografier och biografier om andra författare, som inte har mycket med Camus att göra. Sökmotorn känns med andra ord inte helt hundra, det är lättare att hitta snarlika titlar på exempelvis Amazon. Matchningarna verkar helt enkelt mer relevanta.

BookLamp förser dessutom snarast läsaren med för mycket information. Språket delas upp i fem kategorier; motion, density, pacing, dialog, description. En procentsats, från noll till hundra, anger i vilken grad respektive kategori är verksam. Det är väldigt svårt att tolka den här statistiken, inte minst summan av delarna.

Utöver de fem kategorierna uppges böckernas ”StoryDNA”, vilken presenteras som en lista med kategorier. Paul Austers The Invention of Solitude har hela femton sammansatta ämneskategorier. Romanen har exempelvis väldigt mycket ”Family Relationships / Martial Dyynamics” och ”Pain & Fear / Negative Emotions” i sitt ”DNA”, men väldigt lite ”Libraries / Books / Studying” respektive ”Criminal Investigation / Detective Work”. Den här statistisken är också väldigt svår att tolka, även om den kan hjälpa en att hitta en annan bok med mycket negativa känslor och lite detektivarbete.

Många förslag som kommer upp är uppenbart befängda, i Austers fall en salig blandning av böcker på temat faderskap och fadersrelationer. Något har de uppenbarligen gemensamt, men BookLamp presenterar sig som ett högteknologiskt precisionsverktyg, men bland sajtens FAQ finns symptomatiskt nog frågan: ”What happens when BookLamp’s engine goes insane?”

I ett tidigare blogginlägg skrev vi om Whichbook, en brittisk sökmotor som är väldigt rolig att leka med. Det finns tolv reglage med motsatspar i vardera änden och man kan ställa in fyra av dem i taget för att få fram den bok man önskar. Några av paren är: funny-serious, safe-disturbing, expected-unpredictable, beautiful-disgusting, gentle-violent, easy-demanding, no sex-lots of sex, conventional-unusual, optimistic-bleak och, inte minst viktigt, short-long.

Man kan bli sittande länge med den här leksaken i början är det svårt att låta bli att dra reglagen på max som dessutom har flera andra sökfunktioner. Man kan söka på var man vill att boken ska utspela sig i världen och man kan välja huvudkaraktärens kön, ålder, etnicitet och sexuella läggning. Man kan till och med välja vilken typ av intrig man vill att boken ska ha.

Slutligen kan man i ett omfattande författarregister leta efter någon av sina favoriter. Låt säga att det för tillfället är Kate Atkinson. Klickar man på hennes namn kommer dock bara tre titlar upp. Trycker man på en av dem, låt säga ”Human Croquet”, så kan man sedan söka på liknande romaner. Enligt Whichbook kan man läsa vilken bok som helst av Angela Carter om man gillar ”Human Croquet” och även ”The Descendants” av Kaui Hart Hemmings påstås funka utmärkt. Vi har bland annat köpt två romaner av japanskan Hitomi Kanehara efter förslag från Whichbook och de motsvarade våra förväntningar mycket väl.

Den stora skillnaden mellan BookLamp och Whichbook, förutom att den förra i motsats till den senare inte verkar funka så bra, är att det är människor som matat in all information om böckerna i Whichbooks motor, det är människor som  läst böckerna och skrivit de korta kärnfulla beskrivningarna.

Varje bok på Whichbook ”has been read by one of a changing team of 70 people who are drawn from libraries and literature organisations”, heter det lite vagt. För att få vara med i databasen ska böckerna ha getts ut på engelska de senaste tio åren. Man premierar ”intriguing and less well-known titels” och väljer bort ”the biggest bestsellers”. Prova själv att söka böcker med Whichbook och jämför sedan med BookLamp. Vi vågar hävda att skillnaden är rätt stor.

BB

Lämna en kommentar

Under Artiklar

Kommentera

Fyll i dina uppgifter nedan eller klicka på en ikon för att logga in:

WordPress.com Logo

Du kommenterar med ditt WordPress.com-konto. Logga ut /  Ändra )

Google-foto

Du kommenterar med ditt Google-konto. Logga ut /  Ändra )

Twitter-bild

Du kommenterar med ditt Twitter-konto. Logga ut /  Ändra )

Facebook-foto

Du kommenterar med ditt Facebook-konto. Logga ut /  Ändra )

Ansluter till %s