News from the Czech Literary Bibliography

By clicking on Submit to newsletter you confirm, that you have read and you confirm to the Personel data protection of the Institute of Czech Literature of the CAS

 

Thank you

Novinky z literárněvědné bohemistiky

Kliknutím na Odebírat potvrzujete, že jste se seznámili se Zásadami zpracování osobních údajů v ÚČL AV ČR

 

Děkujeme

Ústav pro českou literaturu AV ČR Institute of Czech literature of the CAS

Nová verze Korpusu současné poezie

Korpus současné poezie (KSP) vzniká ve spolupráci Ústavu pro českou literaturu AV ČR a Ústavu Českého národního korpusu FF UK už od roku 2015. Nyní byla zveřejněna jeho nová, rozšířená a zdokonalená podoba: KSP verze 2.

Korpus současné poezie: verze 2

Korpus, který je veřejnosti dostupný na webu soucasnapoezie.cz, se oproti předchozí verzi rozrostl o téměř dvě stovky básnických sbírek, pět desítek autorů, přes šest tisíc básní a necelý milion slov – a to jen ve své části print, do které jsou zařazovány básnické knihy publikované po roce 1989. Další milion slov přibyl do části web, která obsahuje básně zveřejňované na amatérských literárních serverech. Nyní tedy v KSP naleznete přibližně 37,5 milionů slov, což ho činí největším korpusem svého druhu na světě.

Subkorpus tištěné poezie (print) se na tomto počtu podílí zhruba 2,7 miliony slov pocházejících z 20 498 básní otištěných ve 682 básnických sbírkách od 256 autorů. Webová složka korpusu (web) obsahuje více než 280 tisíc básní ze šestice literárních serverů čítajících přes 34 milionů slov. Do subkorpusu print byly texty vybírány s ohledem na generační vrstevnatost současné básnické scény: aktuálně jsou tu reprezentativně zastoupeni autoři generací X, Y a baby boomers (tj. narození po roce 1945). Subkorpus web nyní obsahuje básně zveřejněné na amatérských webech v rozmezí let 2000–2021.

KSP je nadále zpřístupňován prostřednictvím sady čtyř nástrojů: Slovo v poezii (prostředí vhodné pro první seznámení s korpusem); KonText (základní nástroj pro hledání slov v kontextech, sestavování frekvenčních či kolokačních přehledů apod.); Hex (aplikace pro hledání klíčových slov) a Gunstick (nástroj pro detekci rýmových párů, který byl pro KSP v2 významně zdokonalen). Tipli byste si například, že slovo život se v současné poezii nejčastěji rýmuje se slovem pilot?