Matematické metody aplikoval na Rukopisy jako první Augustin Seydler (Athenaeum 3, 1886, s. 299-307). Bylo to první užití matematiky v české jazykovědě. Seydler vycházel ze sdělení Gebauerova, že v RK je přibližně 700 odchylek od "normální staročeské mluvnice". Rozhodl se ,že vypočítá pravděpodobnost, že by tyto odchylky vznikly nahodile, v důsledku roztržitosti, omylem písařů nebo přepisovačů. Výsledek byl ohromující: pravděpodobnost, že nejsou všechny zvláštnosti v RK pouhou náhodou, je přes 3000 milionů ku jedné.
Kde je slabina Seydlerových výpočtů? Samozřejmě, že záleží na správnosti poznatků Gebauerových, jak si již sám Seydler uvědomoval. Gebauer vytvořil "normální staročeskou mluvnici" na základě textů z druhé třetiny 14. století, tedy je celkem přirozené, že Rukopisy, pokud jsou starší, se od ní odchylují. U živého jazyka nelze mluvit o normální mluvnici, tím méně v době, kdy nebyly školy, tisk, ústředně prosazovaná jazyková pravidla. V jazyce RK se vyskytují prvky nářeční, zvláštní výrazy skladatele, starší tvary z doby vzniku básní. Jak známo, byly tvary, podle Gebauera nemožné a nedoložené, později nalezeny v pravých staročeských památkách. (Vrzalík - Poučení o nepadělaných RKZ).
Co lze vytknout z matematického hlediska: Pravdivost matematického deduktivního závěru je podmíněna tím, že v něm používáme některých obecných zákonů k řešení zvláštních případů, neboť je zcela zřejmé, že vše, co platí obecně a vždy, platí také pro každý jednotlivý případ.
K výpočtu pravděpodobnosti podle Bayesova vzorce, jak to učinil Seydler, potřebujeme znát 1) pravděpodobnost, že odchylka vznikla náhodou, 2) pravděpodobnost, že odchylka vznikla v důsledku jazykové zákonitosti, nám neznámé. Abychom tyto pravděpodobnosti zjistili, museli bychom vzít v úvahu všechny odchylky ve všech literárních dílech, která kdy byla napsána, a určit, kdy odchylka vznikla náhodou a kdy jazykovou zákonitostí. Tím se ovšem Seydler nezabýval a na základě intuice stanovil, že obě hledané pravděpodobnosti jsou stejně velké.
To je sice, jak hodnotí Vašák, nestranné, ale není to dostatečně solidní podklad pro výpočet. (Podobný případ je, když někdo stanoví pravděpodobnost existence mimozemské civilizace na 0,5, protože mimozemská civilizace buď existuje, nebo neexistuje. Je to také nestranné, ale nic víc.)
Nicméně si myslím, že se závěrem zkoumání, tedy že všechny zvláštnosti RK pravděpodobně nejsou zaviněny náhodou, můžeme souhlasit.
Seydler dále dokazoval, že není náhodou shoda jistých zvláštností RK s jistými zvláštnostmi u Hanky před objevením RK. I tyto tzv. koincidence již byly obránci vysvětleny. Většinou se ukázalo, že jde o skutečné staročeské tvary. Existuje též hypotéza (Grégr - Na obranu RKZ), že oba Rukopisy byly nalezeny dávno před rokem 1817, vlastenci je ukradli z nějaké knihovny a drželi je v tajnosti, aby krádež nevyšla najevo.
V roce 1976 byly RKZ podrobeny kvantitativní analýze v Ústavu pro jazyk český ČSAV. Výzkum provedli Marie Těšitelová, Iva Nebeská a Jan Králík. (Prag Studies in Mathematical Linguistics 5, 1976, s.119-147). Tito vědci považovali problém pravosti RKZ za nezvratně rozhodnutý, nicméně v Rukopisech nacházeli nejasná a obtížná místa.
Proto se rozhodli podrobit je statistické analýze a porovnat s texty staročeskými, obrozeneckými a novodobými. Ke každé básni RKZ se pokusili vybrat jeden text z Dalimilovy kroniky a jeden text z doby nár. obrození, odpovídající tématem i rozsahem. Bohužel texty vybrané z Dalimila obsahují nějakou nešťastnou náhodou pouze 2,439 slov, zatímco RKZ obsahují 6,463 slov. (Vybrané obrozenecké texty obsahují 6,457 slov.)
Zjišťovalo se tzv. bohatství jazyka, zastoupení slovních druhů, zejména zastoupení předložek a spojek, nejčastější slova. Vypočítané hodnoty zde prezentujeme v tabulkách.
Ve veličinách, ukazujících bohatství jazyka, má RK blíže Dalimilově kronice, než obrozeneckým textům, ve veličinách, ukazujících zastoupení slovních druhů, je tomu naopak. Nápadný je velký rozdíl mezi RK a RZ. Není vyloučeno, že zkoumané veličiny nějak závisejí na délce textu.
Nejobtížnější je interpretace získaných poznatků. Například u proměnné Knr se zdá (na základě pěti údajů), že závisí na tom, zdali má dílo jednoho, nebo více autorů. Potom by Rukopisy byly dílem více autorů. K podobným závěrům by však bylo třeba stanovit, jak zkoumané veličiny skutečně závisejí na době vzniku textu, žánru, předpokládaném publiku, zvláštnostech autora, nářečí, způsobu prezentace díla, umělecké kvalitě, délce díla.
Další výtka: Nemá velký význam vyslovovat hypotézy o vývoji českého jazyka na základě hodnot vypočítaných pro Dalimila, obroz. texty, Halase, Nezvala a novou českou poezii. Údajů je málo a navíc nepokrývají dobu předpokládaného vzniku básní z Rukopisů. Tvrzení, že Rukopisy se odchylují od vývojového trendu češtiny, by muselo být podepřeno lépe.
Pro matematiku v rukopisném sporu se nabízejí tyto úkoly: Využít více poznatků o číselných charakteristikách literárních děl, aby bylo možno spolehlivěji interpretovat údaje již vypočítané. Zajímavým úkolem je určení autorství básní matematickými metodami - nebo vyloučení některých osob, podezřelých z autorství.
Legenda k tabulkám:
ObtRK...obrozenecké texty odpovídající RK
Dal...texty z Dalimilovy kroniky
DalRK...texty z Dalimilovy kroniky odpovídající RK
R80 | R70 | D | K | |
RK | 34,50 | 39,42 | 83,27 | 18,86 |
RZ | 56,94 | 65,07 | 98,47 | 21,12 |
ObtRK | 45,43 | 51,92 | 93,32 | 15,35 |
Dal | 39,36 | 44,98 | 91,02 | 19,60 |
Kde:
R80 = 100 (počet různých slov v textu ⁄ počet podst. jmen, příd. jmen, zájmen, číslovek, sloves, příslovcí)
R70 = 100 (počet různých slov v textu ⁄ počet podst. jmen, příd. jmen, sloves, příslovcí)
D = 100 (počet významových slov mezi deseti nejčastějšími slovy ⁄ počet různých slov v textu)
K = 100 (počet 10 nejčastějších slov v textu ⁄ počet všech slov v textu)
Kz | Kn | Knr | KBus | Kvr | |
RK | 1,4273 | 1,0956 | 0,5026 | 0,5507 | 0,2524 |
RZ | 2,0495 | 1,7368 | 0,5354 | 0,9298 | 0,2105 |
ObtRK | 1,1690 | 1,1725 | 0,5234 | 0,6137 | 0,3053 |
Dal | 0,8093 | 0,9479 | 0,3608 | 0,3420 | 0,2319 |
Kde:
Kz = počet všech podst. jmen, příd. jmen a předložek ⁄ počet všech sloves, zájmen, příslovcí a spojek
Kn = počet různých podst. jmen, příd. jmen a předložek ⁄ počet všech sloves, zájmen, příslovcí a spojek
Knr = počet různých příd. jmen ⁄ počet různých podst. jmen
KBus = počet různých příd. jmen ⁄ počet různých sloves
Kvr = počet různých příslovcí ⁄ počet různých sloves
RZ | 715,14 |
DalRK | 611,31 |
RK | 602,91 |
ObtRK | 373,31 |