Dostal jsem mailem nevšední lingvistický dotaz, který mě přinutil zapátrat trochu v hlubinách internetu a rozšířit si obzory. Jednalo se ponejprve o oficiální transliteraci sanskrtu, ale nakonec jsem se zvědavostí v bádání pokračoval, a tak nashromáždil pár užitečných zdrojů, které se mohou jednou za čas hodit.
Nejdřív trocha teoretické průpravy z české verze Wikipedie:
Sanskrt je jedním z nejstarších známých jazyků. Patří do indoíránské skupiny indoevropské jazykové rodiny. Je liturgickým jazykem hinduismu, buddhismu a jainismu, jakož i jedním ze 22 úředních jazyků Indie. V Indii a jihovýchodní Asii má sanskrt podobnou úlohu jako řečtina a latina v Evropě, je jím psaná významná část indické filosofie a hinduistické tradice. Tento mrtvý jazyk se hojně používá i dnes — např. v terminologii jógy a jiných indických vědách. Je oficiálním jazykem Indie.
Podstatné je, že pro přepis do latinky je nutné vlastnit font s ne tak docela obvyklými akcentovanými znaky (viz obrázek). Diakritická znaménka jsou sice známá, střídá se jen tečka, macron a klasická čárka, ovšem pátrání v dostupných unicode fontech nepřineslo kýžený efekt, protože některé potřebné znaky zkrátka neobsahují (marně jsem hledal například h nebo d s tečkou pod písmenem).
Naštěstí existují lidé jako Pratyatoṣa Dāsa, kteří se snaží tento stav napravit. Na jeho stránkách je v současnosti zdarma ke stažení 50 fontů (vesměs systémové z Windows) s doplněnými standardními znaky pro transliteraci. Použitelné se mi jeví také písmo URW Palladio ITU (Palatino Hermanna Zapfa doplněné o inkriminované symboly), lze jej stáhnout (zip archiv) z webu omkarananda-ashram.org.
Když už jsme se dostali tak daleko, dovolím si upozornit na webové stránky, z nichž je možno stáhnout si písmo Devanāgarī používané pro zápis sanskrtu v originální podobě. Font Sanskrit 2003 (zip archiv) je ke stažení zdarma ze stránek omkarananda-ashram.org, ale univerzálním řešením se zdá být megafont Chandas, jenž kromě znaků pro sanskrt a zároveň jeho transliteraci obsahuje též latinkovou abecedu s kompletní středoevropskou diakritikou, a dokonce i azbuku. Ideální pro multijazyčné texty. Stránka věnovaná písmu Chandas je vlastně užitečná několikanásobně — obsahuje seznam ligatur, ukázkové texty, rozložení klávesnice a odkazy na další písma Devanāgarī.
A nakonec ještě zmíním výborný web South Asia Resource Center nabízející kromě fontů i odkazy na další hodnotné zdroje.
Jen malá chybka – nevšedNí.
Jen bych rád upozornil, že Win XP obsahují kromě Lucida Sans i písmovou rodinu Lucida Sans Unicode — to je slušné řešení pro zobrazení většiny “standardních” jazyků.
Osobně jsem zvědavý, s čím se vytáhnou Windows Vista. Novým písmem pro rozhraní operačního systému má být Segoe (aneb Věčná sláva Frutigeru). Třeba se pokusí šíři macovské znakové sady vyrovnat. A nebo vědí něco, co nevím já, a všechno bude jinak.
Nicméně Open Type verze Arialu — Arial Unicode MS (dostupný po instalaci Microsoft Office) — má celých 38917 znaků, což dohromady tvoří úctyhodných 50377 různých písmen, glyfů.
Více se skrývá pod odkazem Unicodová písma http://en.wikipedia.org/wiki/Unicode_typefaces
(jen to maličko kazí fakt, z jakých ohyzdností je ten Arial tvořen, že :) – ale to sem nepatří.)
ské a ruské mp3, ty japonské jsou zatím bez šance, ale u těch ruských je to zajímavé, jedna jediná mp3 ze všech se mi zobrazuje správně, je možné že je to jediná jedna ripovaná v novějších windows? že by ostaní byly z 98ček?, spíš bych věřil že je jediná jedna z MACka a ostatní jsou z windows, zkusím ještě mrknout do ID tagu té Ljediné správné” :)
Nebo jeste toto reseni.
Pro publikování sanskrtského transliterovaného textu na internetu používám vlastní crossbrowser metodu, která je kompatibilní se všemi systémy a je založena jen na css. Nepotřebuje ani unicode font, který není ! na všech strojích.
Rád bych autora upozornil, že unicodová sada jinak obsahuje ! kompletně i všechna “tečkovaná” písmena potřebná k transliteraci sanskrtu-hindštiny, myslím marathi i dalších jazyků a celou dévanágarí sadu písem. Vaše “h” s tečkou pod je ḥ a “d” s tečkou pod je ḍ – FF i opera s tím nemá problémy (je-li naistal. nějaký unicode font), ie je zobrazuje správně, jen když nastavíme arial unicode či jiný unicode font přímo v css a kódování musí být utf-8. S unicodem však není řešen typ písma, používáte-li text Palatino, unicode znak z arialu uprostřed není hezké. Taky jsem zjistil různorodost (ne)zobrazování některých znaků dévanágarí písma v arial unicode vs. lucida sans unicode. Takže to řešení není.
Jak se to řeší v praxi? viz transliteraci sanskrtského textu:
http://www.tantrajoga.cz/hlavniokno.php?rub=kasmir_4_1_3
Máte-li unicode font, tak uvidíte i dévanágarí viz:
http://www.tantrajoga.cz/hlavniokno.php?rub=kasmir_0_0
V download sekci jsou fonty ktransliteraci i písma dévanágarí:
http://www.tantrajoga.cz/download/fonty/
O transliteraci obecně i v češtině viz:
http://www.tantrajoga.cz/hlavniokno.php?rub=vedlejsi_translit
Wiki názor na transliteraci není moc povedený. Z tzv. combining diactriticals (non-space šířka) lze použít bez nutností mít i unicode font pouze ̣ = což je tečka pod jakýmkoliv písmenem. Toto ale nelze ! v praxi používat, protože se vypočítává střed a spodek písmene na základě nestálé velikosti daného fontu, což je s použitím různých fontů naprosto odlišné – správné je pouze u monospace fontů.
Z toho všeho je vidět, že zde nikdo (ani pánové z komentářů) problematiku z praxe neznají, což mě ale nepřekvapuje. Sanskrt je okrajovou zálažitostí…