Strč prst skrz sanskrt

Dostal jsem mailem nevšední lingvistický dotaz, který mě přinutil zapátrat trochu v hlubinách internetu a rozšířit si obzory. Jednalo se ponejprve o oficiální transliteraci sanskrtu, ale nakonec jsem se zvědavostí v bádání pokračoval, a tak nashromáždil pár užitečných zdrojů, které se mohou jednou za čas hodit.

Sanskrt

Nejdřív trocha teoretické průpravy z české verze Wikipedie:

Sanskrt je jedním z nejstarších známých jazyků. Patří do indoíránské skupiny indoevropské jazykové rodiny. Je liturgickým jazykem hinduismu, buddhismu a jainismu, jakož i jedním ze 22 úředních jazyků Indie. V Indii a jihovýchodní Asii má sanskrt podobnou úlohu jako řečtina a latina v Evropě, je jím psaná významná část indické filosofie a hinduistické tradice. Tento mrtvý jazyk se hojně používá i dnes — např. v terminologii jógy a jiných indických vědách. Je oficiálním jazykem Indie.

Podstatné je, že pro přepis do latinky je nutné vlastnit font s ne tak docela obvyklými akcentovanými znaky (viz obrázek). Diakritická znaménka jsou sice známá, střídá se jen tečka, macron a klasická čárka, ovšem pátrání v dostupných unicode fontech nepřineslo kýžený efekt, protože některé potřebné znaky zkrátka neobsahují (marně jsem hledal například h nebo d s tečkou pod písmenem).

Transliterace sanskrtu

Naštěstí existují lidé jako Pratyatoṣa Dāsa, kteří se snaží tento stav napravit. Na jeho stránkách je v současnosti zdarma ke stažení 50 fontů (vesměs systémové z Windows) s doplněnými standardními znaky pro transliteraci. Použitelné se mi jeví také písmo URW Palladio ITU (Palatino Hermanna Zapfa doplněné o inkriminované symboly), lze jej stáhnout (zip archiv) z webu omkarananda-ashram.org.

Když už jsme se dostali tak daleko, dovolím si upozornit na webové stránky, z nichž je možno stáhnout si písmo Devanāgarī používané pro zápis sanskrtu v originální podobě. Font Sanskrit 2003 (zip archiv) je ke stažení zdarma ze stránek omkarananda-ashram.org, ale univerzálním řešením se zdá být megafont Chandas, jenž kromě znaků pro sanskrt a zároveň jeho transliteraci obsahuje též latinkovou abecedu s kompletní středoevropskou diakritikou, a dokonce i azbuku. Ideální pro multijazyčné texty. Stránka věnovaná písmu Chandas je vlastně užitečná několikanásobně — obsahuje seznam ligatur, ukázkové texty, rozložení klávesnice a odkazy na další písma Devanāgarī.

A nakonec ještě zmíním výborný web South Asia Resource Center nabízející kromě fontů i odkazy na další hodnotné zdroje.

24 komentářů

  • Díky, až budu zase jednou psát sanskrtem, bude se to hodit :).

    Jen malá chybka – nevšedNí.

  • → pixy: A vida ho! Zajímavé. Lucida byla zmiňována někde na páně Pratyatoṣa Dāsa webu, jenže ve Woknech se nachází Lucida Sans Unicode bez potřebných glyfů. Hádám, že macovská Lucida Grande je nějaká speciální „megaverze“. Ale fakt má mac těch vhodných fontů více…

  • → Pavel Kout: Ano, mezi Adobe Pro fonty jsem taky hledal, bezvýsledně. Je to zvláštní, protože přidat do písmového souboru pár glyfů „s tečkou pod“ je otázkou několika minut.

  • Jo jo, masoxová Lucida Grande a wokenní Lucida Sans sice vypadají stejně, ale jinak to je tak trochu nebe a dudy. Ta macovská je defaultní systémový font (prakticky vše, co člověk vidí na macu, je Lucidou) a podporuje snad všechny existující jazyky – ten font obsahuje 2826 (!) znaků. Viz též http://en.wikipedia.org/wiki/Lucida_Grande

  • → pixy: V článku zmíněný Chandas obsahuje 4347 (!!) znaků. ;)

    Jen bych rád upozornil, že Win XP obsahují kromě Lucida Sans i písmovou rodinu Lucida Sans Unicode — to je slušné řešení pro zobrazení většiny „standardních“ jazyků.

    Osobně jsem zvědavý, s čím se vytáhnou Windows Vista. Novým písmem pro rozhraní operačního systému má být Segoe (aneb Věčná sláva Frutigeru). Třeba se pokusí šíři macovské znakové sady vyrovnat. A nebo vědí něco, co nevím já, a všechno bude jinak.

  • → pixy: Trochu jsem se ještě šťoural ve Wikipedii a asi to nebude zase tak horké. Zatímco Lucida Grande obsahuje 2245 znaků (a 2826 „glyfů“), verze pro Windows, tedy Lucida Sans Unicode obsahuje 1765 znaků (1776).

    Nicméně Open Type verze Arialu — Arial Unicode MS (dostupný po instalaci Microsoft Office) — má celých 38917 znaků, což dohromady tvoří úctyhodných 50377 různých písmen, glyfů.

    Více se skrývá pod odkazem Unicodová písma http://en.wikipedia.org/wiki/Unicode_typefaces

  • Úžasné. Bez ironie.

    (jen to maličko kazí fakt, z jakých ohyzdností je ten Arial tvořen, že :) – ale to sem nepatří.)

  • s tímhle článkem jsi mi kápnul do noty, právě teď se snažím vyřešit špatné zobrazování názvů souborů v XP, jde mi o  japon
    ské a ruské mp3, ty japonské jsou zatím bez šance, ale u těch ruských je to zajímavé, jedna jediná mp3 ze všech se mi zobrazuje správně, je možné že je to jediná jedna ripovaná v novějších windows? že by ostaní byly z 98ček?, spíš bych věřil že je jediná jedna z MACka a ostatní jsou z windows, zkusím ještě mrknout do ID tagu té Ljediné správné“ :)

  • „Ale no tak“? Řekl jsem něco špatného? Nebo že bychom si nad tématem „20 největších ohyzdností písma Arial“ neporozumněli? To by pak určitě stálo za článek…

  • Ach tak, to pak ano. Nechápal jsem jen prve směr té narážky. Už mlčím. :)

  • Prosím opravit slovo buddhimu na buddhismu. Jinak to je velice zajímavý článek, netušil jsem že ve Windows je Lucida Sans Unicode. Možná bych to mohl použít pro některé výrazy na stránkách.

  • To, o čem velmi matně a bez konkrétní znalosti problematiky píšete, řeším od roku 1995, kdy jsem ještě na Win3.11 vytvářel TT font pro psaní translit. sanskrtu (editace Timesů). Takto jsem i publikoval knihy…
    Pro publikování sanskrtského transliterovaného textu na internetu používám vlastní crossbrowser metodu, která je kompatibilní se všemi systémy a je založena jen na css. Nepotřebuje ani unicode font, který není ! na všech strojích.
    Rád bych autora upozornil, že unicodová sada jinak obsahuje ! kompletně i všechna „tečkovaná“ písmena potřebná k transliteraci sanskrtu-hindštiny, myslím marathi i dalších jazyků a celou dévanágarí sadu písem. Vaše „h“ s tečkou pod je ḥ a „d“ s tečkou pod je ḍ – FF i opera s tím nemá problémy (je-li naistal. nějaký unicode font), ie je zobrazuje správně, jen když nastavíme arial unicode či jiný unicode font přímo v css a kódování musí být utf-8. S unicodem však není řešen typ písma, používáte-li text Palatino, unicode znak z arialu uprostřed není hezké. Taky jsem zjistil různorodost (ne)zobrazování některých znaků dévanágarí písma v arial unicode vs. lucida sans unicode. Takže to řešení není.

    Jak se to řeší v praxi? viz transliteraci sanskrtského textu:
    http://www.tantrajoga.cz/hlavniokno.php?rub=kasmir_4_1_3

    Máte-li unicode font, tak uvidíte i dévanágarí viz:
    http://www.tantrajoga.cz/hlavniokno.php?rub=kasmir_0_0

    V download sekci jsou fonty ktransliteraci i písma dévanágarí:
    http://www.tantrajoga.cz/download/fonty/

    O transliteraci obecně i v češtině viz:
    http://www.tantrajoga.cz/hlavniokno.php?rub=vedlejsi_translit

    Wiki názor na transliteraci není moc povedený. Z tzv. combining diactriticals (non-space šířka) lze použít bez nutností mít i unicode font pouze ̣ = což je tečka pod jakýmkoliv písmenem. Toto ale nelze ! v praxi používat, protože se vypočítává střed a spodek písmene na základě nestálé velikosti daného fontu, což je s použitím různých fontů naprosto odlišné – správné je pouze u monospace fontů.

    Z toho všeho je vidět, že zde nikdo (ani pánové z komentářů) problematiku z praxe neznají, což mě ale nepřekvapuje. Sanskrt je okrajovou zálažitostí…

  • Není snad divu, že málokdo problematice tak okrajové věci rozumí. Svou neznalost nijak nezakrývám. Případů, kdy se člověk setká podobným problémem na pomezí jazyka a techniky, je přece jen minimum. Proto tady kolektivně oceníme každý přínosný (a zároveň shovívavý) komentář.

Píše Martin T. Pecina, knižní grafik, autor publikace Knihy a typografie. Portfolio: book-design.eu

Archiv

Rubriky