Vytvořit slovník rýmů bez počítače? To je dnes zhola nemožné ****************************************************************************************** * Vytvořit slovník rýmů bez počítače? To je dnes zhola nemožné ****************************************************************************************** 12. 9. 2011, autor: Lucie Kettnerová, rubrika: Rozhovory & portréty Unikátní příručka obsahující 10 tisíc různých zakončení slov vznikla díky existenci korpus češtiny, který zpracoval Český národní korpus FF UK. Velký slovník rýmů má dva autory – Vá Cvrčkovy. My jsme na dálku vyzpovídali Mgr. Václava Cvrčka, Ph.D. [ URL "http://ucnk.ff.cu 16"] , jenž v současné době absolvuje studijní pobyt na Brownově univerzitě. Proč trvalo tak dlouho, než dostala moderní čeština svůj slovník rýmů? Tím asi narážíte na fakt, že poslední Rýmovník (Puchmajerův) je z roku 1824. To je způsobe relativně hodně úzkoprofilová a zároveň poměrně náročná na zpracování. Motivace Puchmajera aby se vyrovnala německému vzoru. My jsme žádnou takovou motivaci neměli, pouze nás napadl pomůcka. Jak se slovník rýmů vytváří a jak dlouho práce na něm trvala? Slovník rýmů je poměrně specifický projekt, a proto jeho příprava vůbec nepřipomíná klasic velmi jednoduché. Musíte ke všem možným zakončením najít co nejvíc slov, která ho mají (a háčky: 1) jak dlouhé má to zakončení být (poslední písmeno, poslední slabika nebo ještě ví výslovnosti, nikoli podle toho, jak se píšou. Musíte tedy všechna slova nejdřív převést na Když toto všechno máte, zbývá „jenom“ celý slovník ručně projít a zkontrolovat. To vše nám dlouhé, trvalo přes tři roky. Nakolik jde o „ruční“ práci a nakolik vytvoří slovník počítač? Převedení na fonetickou podobu jsme dělali strojově (měli jsme pro to nástroje už z doby, jiná publikace ČNK, a to Statistiky češtiny). Nicméně stroj nepozná, že slovo „home“ je an vyslovuje se „houm“, a tudíž se nerýmuje třeba se slovem „strome“. Takže když jsme převedl fonetickou podobu a vytvořili jsme počítačově první heslář s návrhy jednotlivých rýmů, při úmorná a nekonečná ruční kontrola. Na publikaci jste pracoval s manželkou. Jak jste měli rozděleny úkoly? Úkoly byly rozděleny velmi nerovnoměrně, já jsem měl na starost automatickou část a manžel většinu ruční kontroly. Pak nám ještě pomohl náš kamarád Ondřej Skovajsa, který napsal krá rýmu. Kolik slov publikace obsahuje a ze kterého korpusu jste čerpali? Čerpali jsme z korpusu SYN2005 [ URL "http://ucnk.ff.cuni.cz/syn2005.php"] (dnes už je k d novější korpus SYN2010 [ URL "http://ucnk.ff.cuni.cz/syn2010.php"] ), který obsahuje 100 m slov (počítán každý výskyt slova zvlášť). Je složen z textů publicistických, beletristický což se ve výsledku projevilo tím, že mezi rýmy zdaleka nejsou jen „slova poetická“, ale i odborné termíny nebo vlastní jména. Přišlo nám to dobré, jako takové zajímavé oživení, tak nechali. Celkově slovník obsahuje více než 10 tisíc různých zakončení a k nim zhruba 200 tisíc slov jsme si mohli dovolit jedině díky korpusovému přístupu, vytvářet takový slovník bez pomoci zhola nemožné. Kde všude myslíte, že slovník najde uplatnění? To zatím nevím, doufám, že do něj nahlédnou básníci a textaři a neotočí se nafoukaně k tét ruce od moderních lingvistických metod zády. Asi se bude hodit všem kreativním lidem, kteř jazykem. Věříme ale také, že by mohl najít uplatnění i ve školách při výuce literatury tak zahraničí, kde jsou rýmovníky relativně hojně užívanou pomůckou pro praktickou výuku liter V současné době jste na stipendijním pobytu v USA. Čemu se zde věnujete? Díky Fulbrightovu stipendiu mám možnost trávit dva semestry na Brownově univerzitě v Provi Rhode Island. Pracuju zde jednak jako lektor českého jazyka (univerzita má výtečný český p vede prof. Masako Fidlerová) a jednak jako visitng scholar tu mám čas pracovat na vlastním výzkumu (na Brownu totiž vznikl na konci 60. let úplně první korpus na světě pod vedením n českého emigranta Henryho Kučery).