Strč prst skrz sanskrt
Dostal jsem mailem nevšední lingvistický dotaz, který mě přinutil zapátrat trochu v hlubinách internetu a rozšířit si obzory. Jednalo se ponejprve o oficiální transliteraci sanskrtu, ale nakonec jsem se zvědavostí v bádání pokračoval, a tak nashromáždil pár užitečných zdrojů, které se mohou jednou za čas hodit. Nejdřív trocha teoretické průpravy z české verze Wikipedie:
Sanskrt je jedním z nejstarších známých jazyků. Patří do indoíránské skupiny indoevropské jazykové rodiny. Je liturgickým jazykem hinduismu, buddhismu a jainismu, jakož i jedním ze 22 úředních jazyků Indie. V Indii a jihovýchodní Asii má sanskrt podobnou úlohu jako řečtina a latina v Evropě, je jím psaná významná část indické filosofie a hinduistické tradice. Tento mrtvý jazyk se hojně používá i dnes — např. v terminologii jógy a jiných indických vědách. Je oficiálním jazykem Indie. Podstatné je, že pro přepis do latinky je nutné vlastnit font s ne tak docela obvyklými akcentovanými znaky (viz obrázek). Diakritická znaménka jsou sice známá, střídá se jen tečka, macron a klasická čárka, ovšem pátrání v dostupných unicode fontech nepřineslo kýžený efekt, protože některé potřebné znaky zkrátka neobsahují (marně jsem hledal například h nebo d s tečkou pod písmenem). Naštěstí existují lidé jako Pratyatoṣa Dāsa, kteří se snaží tento stav napravit. Na jeho stránkách je v současnosti zdarma ke stažení 50 fontů (vesměs systémové z Windows) s doplněnými standardními znaky pro transliteraci. Použitelné se mi jeví také písmo URW Palladio ITU (Palatino Hermanna Zapfa doplněné o inkriminované symboly), lze jej stáhnout (zip archiv) z webu omkarananda-ashram.org. Když už jsme se dostali tak daleko, dovolím si upozornit na webové stránky, z nichž je možno stáhnout si písmo Devanāgarī používané pro zápis sanskrtu v originální podobě. Font Sanskrit 2003 (zip archiv) je ke stažení zdarma ze stránek omkarananda-ashram.org, ale univerzálním řešením se zdá být megafont Chandas, jenž kromě znaků pro sanskrt a zároveň jeho transliteraci obsahuje též latinkovou abecedu s kompletní středoevropskou diakritikou, a dokonce i azbuku. Ideální pro multijazyčné texty. Stránka věnovaná písmu Chandas je vlastně užitečná několikanásobně — obsahuje seznam ligatur, ukázkové texty, rozložení klávesnice a odkazy na další písma Devanāgarī. A nakonec ještě zmíním výborný web South Asia Resource Center nabízející kromě fontů i odkazy na další hodnotné zdroje.

17. 9. 2006 at 22.52
Jen malá chybka – nevšedNí.
17. 9. 2006 at 22.58
17. 9. 2006 at 23.19
17. 9. 2006 at 23.34
18. 9. 2006 at 1.37
18. 9. 2006 at 6.31
18. 9. 2006 at 10.45
18. 9. 2006 at 10.49
18. 9. 2006 at 10.53
Jen bych rád upozornil, že Win XP obsahují kromě Lucida Sans i písmovou rodinu Lucida Sans Unicode — to je slušné řešení pro zobrazení většiny „standardních“ jazyků.
Osobně jsem zvědavý, s čím se vytáhnou Windows Vista. Novým písmem pro rozhraní operačního systému má být Segoe (aneb Věčná sláva Frutigeru). Třeba se pokusí šíři macovské znakové sady vyrovnat. A nebo vědí něco, co nevím já, a všechno bude jinak.
18. 9. 2006 at 11.28
18. 9. 2006 at 11.52
Nicméně Open Type verze Arialu — Arial Unicode MS (dostupný po instalaci Microsoft Office) — má celých 38917 znaků, což dohromady tvoří úctyhodných 50377 různých písmen, glyfů.
Více se skrývá pod odkazem Unicodová písma http://en.wikipedia.org/wiki/Unicode_typefaces
18. 9. 2006 at 12.16
(jen to maličko kazí fakt, z jakých ohyzdností je ten Arial tvořen, že :) – ale to sem nepatří.)
18. 9. 2006 at 12.22
18. 9. 2006 at 12.45
ské a ruské mp3, ty japonské jsou zatím bez šance, ale u těch ruských je to zajímavé, jedna jediná mp3 ze všech se mi zobrazuje správně, je možné že je to jediná jedna ripovaná v novějších windows? že by ostaní byly z 98ček?, spíš bych věřil že je jediná jedna z MACka a ostatní jsou z windows, zkusím ještě mrknout do ID tagu té Ljediné správné“ :)
18. 9. 2006 at 19.15
18. 9. 2006 at 20.14
18. 9. 2006 at 22.38
19. 9. 2006 at 23.02
20. 9. 2006 at 11.40
20. 9. 2006 at 16.18
7. 10. 2006 at 7.36
Nebo jeste toto reseni.
13. 10. 2006 at 12.40
7. 11. 2006 at 21.44
Pro publikování sanskrtského transliterovaného textu na internetu používám vlastní crossbrowser metodu, která je kompatibilní se všemi systémy a je založena jen na css. Nepotřebuje ani unicode font, který není ! na všech strojích.
Rád bych autora upozornil, že unicodová sada jinak obsahuje ! kompletně i všechna „tečkovaná“ písmena potřebná k transliteraci sanskrtu-hindštiny, myslím marathi i dalších jazyků a celou dévanágarí sadu písem. Vaše „h“ s tečkou pod je ḥ a „d“ s tečkou pod je ḍ – FF i opera s tím nemá problémy (je-li naistal. nějaký unicode font), ie je zobrazuje správně, jen když nastavíme arial unicode či jiný unicode font přímo v css a kódování musí být utf-8. S unicodem však není řešen typ písma, používáte-li text Palatino, unicode znak z arialu uprostřed není hezké. Taky jsem zjistil různorodost (ne)zobrazování některých znaků dévanágarí písma v arial unicode vs. lucida sans unicode. Takže to řešení není.
Jak se to řeší v praxi? viz transliteraci sanskrtského textu:
http://www.tantrajoga.cz/hlavniokno.php?rub=kasmir_4_1_3
Máte-li unicode font, tak uvidíte i dévanágarí viz:
http://www.tantrajoga.cz/hlavniokno.php?rub=kasmir_0_0
V download sekci jsou fonty ktransliteraci i písma dévanágarí:
http://www.tantrajoga.cz/download/fonty/
O transliteraci obecně i v češtině viz:
http://www.tantrajoga.cz/hlavniokno.php?rub=vedlejsi_translit
Wiki názor na transliteraci není moc povedený. Z tzv. combining diactriticals (non-space šířka) lze použít bez nutností mít i unicode font pouze ̣ = což je tečka pod jakýmkoliv písmenem. Toto ale nelze ! v praxi používat, protože se vypočítává střed a spodek písmene na základě nestálé velikosti daného fontu, což je s použitím různých fontů naprosto odlišné – správné je pouze u monospace fontů.
Z toho všeho je vidět, že zde nikdo (ani pánové z komentářů) problematiku z praxe neznají, což mě ale nepřekvapuje. Sanskrt je okrajovou zálažitostí…
7. 11. 2006 at 22.24