Etikettarkiv: datoranalys

Så knäckte forskarna bestsellerkoden

Flertalet författare och förläggare skulle med största sannolikhet inte ha något emot om man på förhand skulle kunna avgöra om en bok blir en flopp eller succé. För en tid sedan presenterade ett forskarlag i USA en studie som pekar i riktning mot att det ska gå att ordna inom en inte helt avlägsen framtid. Forskarna lade fram sina resultat i ”Success with Style: Using Writing Style to Predict the Success of Novels.

Photo credit: Wikipedia

Berättar en av de tre forskarna, Yejin Choi: ”We examined the quantitative connection between writing style and successful literature. Based on novels across different genres, we investigated the predictive power of statistical stylometry in discriminating successful literary works, and identified the stylistic elements that are more prominent in successful writings.”

Och i pressmeddelandet reds begreppen ut: ”Statistical stylometry is the statistical analysis of variations in literary style between one writer or genre and another. The study reports, for the first time, that the discipline can be effective in distinguishing highly successful literature from its less successful counterpart, achieving accuracy rates as high as 84%.”

Det är en sak att i efterhand vaska fram vilka romaner som varit framgångsrika, men det är oerhört många saker som ska klaffa för att en bok ska bli en succé, som tur och tajming till exempel. Och så kan det vara behändigt med en skicklig redaktör och en bra förläggare. Bra marknadsföring. Välvilliga recensenter.

Men vad var det som skiljde de framgångsrika böckerna och de inte fullt så framgångsrika böckerna åt? Det liknar mer kuckelimuck-medicin än något i stil med ett framgångsrecept:

”For example, the research indicated that more successful books make more frequent use of discourse connectives (conjunctions such as ”and”, ”but”, ”or”) to join sentences and prepositions. Prepositions, nouns, pronouns, determiners (words that precede nouns to indicate whether the noun is specific or general, e.g. ”your letter”), and adjectives are also predictive of highly successful books. Less successful books are characterized by a higher percentage of verbs, adverbs, and foreign words. They also rely more on topical words that could be almost cliché (”love”), typical locations, and extreme (”breathless”) and negative (”bruised”) words.”

Det är svårt att tänka sig att författare, som kanske skrivit fyra fem böcker redan, skulle kunna ha någon större nytta av att känna till de här syntaktiska och stilistiska skillnaderna. Författare blir knappast framgångsrika för att de använder ”och”, ”men” och ”eller” lagom ofta. Det kanske hjälper, men kreativitet och fantasi är mer avgörande. Vem som helst svänger  inte ihop en berättelse om Hogwarts, Gregor Samsa eller Raskolnikov. Och hur många främmande ord finns det inte i Harry Potter-böckerna?

Men det märkligaste är några av de andra resultaten, som också är lite kontraintuitiva:

”We made an unexpected observation on the connection between readability and the literary success—that they correlate into the opposite directions,” säger Choi. Och påpekar snabbt att dessa resultat endast pekar på en korrelation, inte kausalitet, och lägger sedan till: ”We conjecture that the conceptual complexity of highly successful literary work might require syntactic complexity that goes against readability.”

O.W.

Lämna en kommentar

Under Artiklar