Ústav pro českou literaturu AV ČR Institute of Czech literature of the CAS
Obsah vašeho košíku

Nemáte žádné položky v košíku

Empirická analýza literatury

Autor: RICHARD ZMĚLÍK
Datum zveřejnění: 24. září 2018

V loňském roce vydalo nakladatelství XYZ, které náleží pod mediální skupinu Albatros Media, knihu s titulem Šifra mistra bestselleru (The Bestseller Code [2016]) dvojice amerických autorů Jodie Archerové a Matthew L. Jockerse. Z názvu si nelze učinit hned napoprvé jasnou představu, kam knihu zařadit. Teprve podtitul Anatomie knižního trháku může leccos napovědět. Na webových stránkách nakladatelství je kniha uvedena mezi kategoriemi non-fiction, poznání a vědění. Podíváme-li se, co zde tyto žánry zahrnují, povětšinou se jedná o skutečné žánrové bestselery, jakými jsou biografie slavných herců, sportovců a politiků nebo různorodé osobní sugestivní zpovědi a příběhy. V malém procentu se zde objevují i takové tituly, jakými jsou esejistická kniha Pavla Eisnera Chrám i tvrz nebo Ivanovova Důvěrná zpráva o Karlu Hynku Máchovi, tedy tituly odborněji profilované.
Čím je Šifra mistra bestselleru, nám může poodhalit, pokud se blíže seznámíme s jejími autory. Jodie Archerová, absolventka Ph.D. programu na Stanfordské univerzitě, má cenné praktické zkušenosti z literárního managmentu (působila u firmy Apple „jako vedoucí výzkumný pracovník na poli literatury“). U Matthew L. Jockerse je na zadní straně knihy pouze stručně uvedeno, že je docentem na univerzitě Nebraska-Lincoln a že své články o literatuře publikoval v New York Times a jinde. Avšak právě tato osobnost garantuje to, co z knihy činí něco mnohem víc než pouhé zajímavé čtení o amerických bestselerech a o mnohdy strastiplných cestách jejich autorů k vytoužené slávě.
V roce 2013 publikoval Jockers jednu z podnětných prací v oblasti, jež je dnes nazývána Digital Humanities, knihu Macroanalysis: Digital Methods and Literary History, ve které se zaměřil na oblast tematiky z hlediska statistické analýzy textu. Jockers využil rozsáhlého elektronického korpusu anglicky psané prózy (anglické i americké provenience) a pomocí statistických metod (zejména tzv. Latentní Dirichletovy alokace — LDA) analyzoval, jak se v čase proměňovaly základní vztahy mezi tematickými segmenty, národnostním původem autorů (ve výběru se ocitli britští, irští a američtí autoři) a jejich genderovou příslušností.
Statistická analýza velké množiny literárních textů je jednou z ústředních metodologických tendencí Digital Literary Studies, disciplíny, která v rámci Digital Humanities usiluje o funkční propojení potenciálu, jež dnes nabízejí digitální technologie (především počítače) a literární vědy. Do této oblasti náleží i Šifra mistra bestselleru.
Ve výsledku se však nejedná o pouhé kvantifikace vybraných literárních kategorií či markerů, ale o statistiku, konkrétně o snahu empiricky zjistit, zda se tzv. bestselery zakládají na společném strukturním principu, zda jej lze definovat, a dokonce predikovat u textů, které aspirují na to, stát se bestselerem. Za tímto účelem autoři vytvořili korpus více než dvaceti tisíc bestselerů, ze kterého extrahovali tisíce markerů, pomocí nichž statisticky poměřovali jejich symptomatiku v uvedeném typu literatury. Klíčovými ukazateli se pro oba autory staly tematické distribuce, autorské lexikum, styl, způsob vyprávění a volba postavy. V čem spočívá hlavní smysl takovéhoto formálního postupu, vysvětlují následovně: „Když spustíme algoritmus pro modelování motivů, získáme dva důležité údaje. Za prvé nám stroj řekne, jaké motivy se vyskytují v našem výběru, součástí čehož je i zobrazení toho, která slova vytvářejí jednotlivé motivy — […] Za druhé nám stroj ukáže podíl jednotlivých motivů v každé knize“ (s. 60). K čemu jsou takováto zjištění důležitá, vysvětlují autoři na příkladech knih, které se bestselery staly a které nikoli. V prvé řadě zjistili, které z motivů jsou pro bestselery typické, a především v jakém poměru se tyto motivy vztahují k motivům sekundárním. Výslednicí je potom motivický invariant, paradigma, které tvoří motivicko-kompoziční základ většiny úspěšných bestselerů. Vedle motivů se autoři věnovali měření průběhu zápletky a také zde zjistili, že pro množinu tržně velmi úspěšných románů platí určitý její typ, který vyjadřují sinusoidou, jejíž jednotlivé vrcholy zastupují pozitivní a negativní segmenty příběhu a pravidelně se opakující frekvence zase funkční dynamiku vyprávění neustále udržující čtenářovu pozornost.
Toto je pouze malý příklad z různých typů analýz, které jsou v knize prováděny. Jiné z nich se týkají lexikální stránky, větné stavby, její délky, autorského stylu, dále způsobů, jakým je vyprávění iniciováno, nebo typologie postav. Ve výsledku autoři předkládají jakousi komplexní ur-strukturu bestseleru, invariant vytvořený z kombinace základních strukturních komponent literárního díla, jež stojí v základech komerčně velmi úspěšných knižních titulů.
Výsledky, s nimiž autoři knihy přichází, mají několikerý dosah a platnost. Sami autoři hovoří o dvojím poslání své práce: „Naše práce spočívá pochopitelně ve snaze určit a vysvětlit strukturní vzorce latentně přítomné v naší kultuře. Z praktičtějšího hlediska nás ovšem zajímá možnost podporovat nové autory, přesvědčit vydavatelství, aby použila větší část rozpočtu vyhrazeného na Pattersona, Kinga či Steelovou ve prospěch mladých autorů“ (s. 23). Druhý z aspektů autoři aktuálně realizují projektem nazvaným Archer Jockers, v rámci kterého poskytují poradenství nejen autorům usilujícím se svým dílem uspět na knižním trhu, ale také vydavatelům. Tento aspekt nás však tolik nezajímá jako onen první. V průběhu celé knihy se totiž neustále a z mnoha úhlů ukazuje, jaký potenciál pro literárněvědné zkoumání nabízí statistická analýza rozsáhlých textových korpusů. V prvé řadě se jedná o schopnost modelovat vybrané literárněvědné aspekty v globálním měřítku a sledovat tak jejich distribuci či stratifikaci napříč určitým vývojovým obdobím či žánrem. Samozřejmě je otázkou, jak se takováto metodologie bude chovat v případě, budeme-li analyzovat typologicky heterogenní texty, než jakými jsou typické bestselery, u kterých lze předpokládat nemalou schematičnost. Přesto se domníváme, že takováto zjištění mohou být užitečná i při zkoumání jiného typu literatury, tj. tzv. literatury umělecké, konkrétně při statistické analýze tematiky, poetiky, ale také recepčních strategií.
Statistické metody dovolují nahlédnout na způsob, jakým fungují strukturní zákonitosti především v rámci rozsáhlého textového pole. (Výjimkou však nejsou ani menší korpusy uměleckých textů.) Jejich výhodou je kromě strojového zpracování především reprezentativní míra objektivity vycházející se statistického vyhodnocování; jejich úkolem je být nástrojem vědecké práce, který vybízí k určité interpretaci. A právě interpretace je vedle strategie kvantifikace dalším důležitým krokem tohoto přístupu. Nutnost interpretovat statistická data je samozřejmá, ovšem otázkou je, jakým způsobem je vysvětlovat. Zde potom nemůže platit jiná odpověď než ta, že tento způsob musí být oborový, vyplývající z teorie dané disciplíny, v rámci níž jsou tyto metody aplikovány. Nejeden takový příklad je dobře demonstrován i v této knize.
Šifra mistra bestselleru není klasickým vědeckým pojednáním, na které bývá odborné publikum zvyklé, neboť zde s výjimkou závěrečné kapitoly chybí podrobné představení metodologie a jejich parametrů. Nutno však dodat, že se jedná o záměr, neboť autoři měli v prvé řadě v úmyslu představit výsledky svého bádání co nejširšímu okruhu čtenářů. Jde tedy o poněkud volněji pojatý výklad jinak složité a náročné problematiky algoritmizace přirozeného jazyka, kvantifikace a statistiky rozsáhlých prozaických korpusů a způsobu, jakým lze takové výsledky smysluplně interpretovat. Není rovněž bez zajímavosti, že styl, jakým je kniha psána, de facto koresponduje s tím, co autoři zjišťují o bestseleru jako takovém. Svým způsobem je zde využito techniky psaní bestseleru pro prezentaci odborně náročné problematiky. Styl je tak spíše popularizační než striktně vědecký. To však knize v zásadě neubírá na odbornosti, která stojí v jejích základech.
V každém případě se jedná o velmi inspirativní práci (Jockers koncem roku za svůj projekt převzal na své domovské univerzitě cenu za inovaci roku), která vybízí ke kritickému uvažování o možnostech strojových algoritmů pro literární vědu. Statistické metody, kterých se to především týká, však mohou představovat nemalý praktický problém, který spočívá ve znalostní bariéře konkrétního programování. Nabízí se tedy otázka, jak iniciovat takovýto typ výzkumu tam, kde takto rozsáhlé znalosti přirozeně chybí. Je možné, že časem se základy programování pro literární vědu stanou podobnou disciplínou, jakou je dnes korpusová lingvistika (ostatně Jockers je rovněž autorem učebnice programování v jazyce R určené studentům literatury pod názvem Text Analysis with R for Students of Literature [2014]). Anebo dojde ke spolupráci mezi literárními vědci a programátory poučenými v literární teorii, jak je to dnes běžné v lingvistice. Šifra mistra bestselleru je z tohoto pohledu ideální kombinací obojího.

Jodie Archerová — Matthew L. Jockers: Šifra mistra bestselleru. Anatomie knižního trháku. Praha, XYZ 2017. 275 stran.

Vyšlo v České literatuře 2/2018.