12. září 2011

Vytvořit slovník rýmů bez počítače? To je dnes zhola nemožné

12. 9. 2011, autor: Lucie Kettnerová, rubrika: Rozhovory & portréty

Unikátní příručka obsahující 10 tisíc různých zakončení slov vznikla díky existenci korpusu současné psané češtiny, který zpracoval Český národní korpus FF UK. Velký slovník rýmů má dva autory – Václava a Ludmilu Cvrčkovy. My jsme na dálku vyzpovídali Mgr. Václava Cvrčka, Ph.D., jenž v současné době absolvuje studijní pobyt na Brownově univerzitě.

Proč trvalo tak dlouho, než dostala moderní čeština svůj slovník rýmů?

Tím asi narážíte na fakt, že poslední Rýmovník (Puchmajerův) je z roku 1824. To je způsobeno nejspíš tím, že je to záležitost relativně hodně úzkoprofilová a zároveň poměrně náročná na zpracování. Motivace Puchmajera byla naučit novou generaci rýmovat tak, aby se vyrovnala německému vzoru. My jsme žádnou takovou motivaci neměli, pouze nás napadlo, že by to mohla být zajímavá a užitečná pomůcka.

Jak se slovník rýmů vytváří a jak dlouho práce na něm trvala?

Slovník rýmů je poměrně specifický projekt, a proto jeho příprava vůbec nepřipomíná klasickou slovníkářskou práci. V podstatě je to velmi jednoduché. Musíte ke všem možným zakončením najít co nejvíc slov, která ho mají (a tudíž se vzájemně rýmují). Má to jenom dva háčky: 1) jak dlouhé má to zakončení být (poslední písmeno, poslední slabika nebo ještě víc?) a 2) slova se musí shodovat na úrovni výslovnosti, nikoli podle toho, jak se píšou. Musíte tedy všechna slova nejdřív převést na jejich pravděpodobnou výslovnostní podobu.

Když toto všechno máte, zbývá „jenom“ celý slovník ručně projít a zkontrolovat. To vše nám s přestávkami, které ale byly občas docela dlouhé, trvalo přes tři roky.

Cvrček, V., Cvrčková Porkertová, L.: Velký slovník rýmů. Nakladatelství Lidové noviny, Praha 2011.

Nakolik jde o „ruční“ práci a nakolik vytvoří slovník počítač?

Převedení na fonetickou podobu jsme dělali strojově (měli jsme pro to nástroje už z doby, kdy se vytvářela jiná publikace ČNK, a to Statistiky češtiny). Nicméně stroj nepozná, že slovo „home“ je anglické a vyslovuje se „houm“, a tudíž se nerýmuje třeba se slovem „strome“. Takže když jsme převedli slova na fonetickou podobu a vytvořili jsme počítačově první heslář s návrhy jednotlivých rýmů, přišla na řadu velmi úmorná a nekonečná ruční kontrola.

Na publikaci jste pracoval s manželkou. Jak jste měli rozděleny úkoly?

Úkoly byly rozděleny velmi nerovnoměrně, já jsem měl na starost automatickou část a manželka oddřela většinu ruční kontroly. Pak nám ještě pomohl náš kamarád Ondřej Skovajsa, který napsal krásnou předmluvu o rýmu.

Kolik slov publikace obsahuje a ze kterého korpusu jste čerpali?

Čerpali jsme z korpusu SYN2005 (dnes už je k dispozici i novější korpus SYN2010), který obsahuje 100 milionů textových slov (počítán každý výskyt slova zvlášť). Je složen z textů publicistických, beletristických i odborných, což se ve výsledku projevilo tím, že mezi rýmy zdaleka nejsou jen „slova poetická“, ale i všednodenní jevy, odborné termíny nebo vlastní jména. Přišlo nám to dobré, jako takové zajímavé oživení, tak jsme je tam nechali.

Celkově slovník obsahuje více než 10 tisíc různých zakončení a k nim zhruba 200 tisíc slov. Takový objem jsme si mohli dovolit jedině díky korpusovému přístupu, vytvářet takový slovník bez pomoci počítačů by bylo zhola nemožné.

Kde všude myslíte, že slovník najde uplatnění?

To zatím nevím, doufám, že do něj nahlédnou básníci a textaři a neotočí se nafoukaně k této podané ruce od moderních lingvistických metod zády. Asi se bude hodit všem kreativním lidem, kteří pracují s jazykem. Věříme ale také, že by mohl najít uplatnění i ve školách při výuce literatury tak, jako je tomu v zahraničí, kde jsou rýmovníky relativně hojně užívanou pomůckou pro praktickou výuku literární teorie.

V současné době jste na stipendijním pobytu v USA. Čemu se zde věnujete?

Díky Fulbrightovu stipendiu mám možnost trávit dva semestry na Brownově univerzitě v Providence, ve státě Rhode Island. Pracuju zde jednak jako lektor českého jazyka (univerzita má výtečný český program, který vede prof. Masako Fidlerová) a jednak jako visitng scholar tu mám čas pracovat na vlastním korpusovém výzkumu (na Brownu totiž vznikl na konci 60. let úplně první korpus na světě pod vedením nedávno zesnulého českého emigranta Henryho Kučery).