天城文 (देवनागरी devanāgarī )又称天城体 。是印度 和尼泊尔 所使用的一种文字 ,用来书写印地语 、梵語 、尼泊尔语 等语言。天城文最早出现在13世纪初,是城文 变体之一,天城文是对城文的改良而成,改良后的城文为突出其神圣性多加了个梵文“天”字(देव deva )成为天城文[ 1] 。城文来自笈多文 ,笈多文犹如印度的其他文字一样,源自於前3世纪的婆罗米文 。現在亞洲不少民族使用的字母与天城文的关系密切,而从帕拉瓦文 派生的文字则在緬甸 、泰國 、柬埔寨 、老撾 等地使用。[ 2]
原理
作為婆羅米系 元音附標文字 ,天城文基本原理是多數字母表示一個輔音,并承載一個固有的元音a [ə]或[a] 。[ 3] 例如字母क 讀作ka ,兩個字母कन 讀作kana ,三個字母कनय 讀作kanaya 等等。与其他元音拼合或去掉元音时,這些輔音或它們的字母会有变化:
复辅音 要寫成半字的合寫 (saṃyuktākṣara “复合”)。例如,三個字母कनय kanaya 可以合寫形成क्नय knaya 、कन्य kanya 或क्न्य knya 。但在從悉曇文 發展成現代天城文 的過程中,疊字能力大減,同時由於大多數天城文電腦字體疊字能力均較弱,造成很多輔音叢是用毗蓝摩(下述) 表達的。EKType開發的開源字體耆那弗婆体 (页面存档备份 ,存于互联网档案馆 )(Jainī Pūrvā,耆那敎 古經 體)是少數具有強大疊字能力的字體,甚至接近藏文的疊字能力。
除固有元音短a外的元音在拼合辅音时寫為附加符号 。例如,क ka 可能写成के ke 、कु ku 、की kī 、का kā 等,;其中i(ि)位於左側,應當注意。
無輔音的元音(詞首或其他元音後),寫作一個字母。例如,ū 在कू kū 中寫為變音符號 ू ,而在ऊक ūka 和कऊ kaū 中会写成字母ऊ 。
詞尾的輔音標記的怛達點 畫् 是去元音符号,梵語中称做“毗蓝摩”,在印地語中又叫“诃兰多”。它去除固有元音,所以क्नय knaya 可以写成क्नय् knay 。当輔音音叢不能通过字母变形做到合寫的時候經常就会使用去元音符号。
這样一个字母或帶有變音符號的合寫,称做一个“阿叉罗 ”(音節、單字)。例如कनय kanaya 被算作三個音節,而क्न्य knya 和कु ku 则都被算作一個音節。
字母
由於古印度發達的語言學傳統,天城文的字母排序,類似幾乎所有其他婆羅米系文字,以元音 和輔音 發音方式 和發音位置 二者的語音 原理为依据。該安排常稱為varṇamālā “字母的花環”。[ 4] 用於梵語 的天城文樣式被看做原型,其他語言使用时会有小的變化或扩充。[ 5]
元音
下表爲輔音和它們的排列順序:[ 6]
獨立形式
羅馬化
作為प的符号
獨立形式
羅馬化
作為प的符号
kaṇṭhya (喉音 )
अ
a
प
आ
ā
पा
tālavya (腭音 )
इ
i
पि
ई
ī
पी
oṣṭhya (唇音 )
उ
u
पु
ऊ
ū
पू
mūrdhanya (頭音 )
ऋ
ṛ
पृ
ॠ
ṝ
पॄ
dantya (齒音 )
ऌ
ḷ
पॢ
ॡ
ḹ
पॣ
kaṇṭhatālavya (喉腭音)
ए
e
पे
ऐ
ai
पै
kaṇṭhoṣṭhya (喉唇音)
ओ
o
पो
औ
au
पौ
和元音在一起的還有兩個輔音變音符號,詞尾的鼻音 anusvāra ं ṃ 和詞尾的擦音 visarga ः ḥ (叫做अं aṃ 和अः aḥ )。Masica (1991 :146頁)記錄梵語中的anusvāra 為“它是表示同部位鼻音 [...],還是鼻音化元音 ,還是鼻音化半元音 ,還是依據上下文決定是它們中的哪一個,是有爭議的”。visarga表示元音后清喉擦音 [h] ,梵語中是s 和少見些的r 在詞尾位置上的同位異音 。某些誦讀傳統在這個氣息聲后附加前面元音的回響:[ 7] इः [ihi ] 。Masica (1991 :146頁)認為visarga 和“在很大程度上可預測出來的”軟腭鼻音 和硬腭鼻音 的字母ङ ṅa 與ञ ña 一起是“這個系統在語音上的過猶不及”的例證。
另一個變音符號是candrabindu /anunāsika ँ 。Salomon (2003 :76-77頁)描述它為anusvāra 的“更加用力的形式”,“有時[...]用來標記真正的[元音]鼻音化”。在新的印度-雅利安語比如印地語 中,這種區別是正式的:candrabindu 指示元音鼻音化 [ 8] ,而anusvāra 指示在另一個輔音前的同部位鼻音 :[ 9] 比如,हँसी [ɦə̃si] “笑”,गंगा [gəŋgɑ] “恒河”。當 akṣara 有一個元音附標在頂上的時候,沒有地方寫candra (“月亮”)筆畫,candrabindu 可以只寫一個單獨的點:[ 10] हूँ [ɦũ] “am”,而हैं [ɦɛ̃] “are”。某些書寫者和打字機免除所有的“月亮”,在所有的位置都只寫點。[ 11]
avagraha ऽ (通常轉寫為元音省略號 ʼ 或' )是梵語中表示連接音變 中的元音省略 的標點符號 :एकोऽयम ekoyam (< ekas + ayam )“this one”。最初的長元音 在連接中失去有時用雙avagraha 標記:सदाऽऽत्मा sadātmā (< sadā + ātmā )“always, the self”。[ 12] 在印地語中,Snell (2000 :77頁)聲稱它的“主要功能是展示元音在哭喊中是持續的”(its main function is to show that a vowel is sustained in a cry or a shout.):आईऽऽऽ! āīīī! 。
音節主音輔音ṝ 、ḷ 和ḹ 特定於梵語并且不包含在其他語言的varṇamālā 中。ṛ 所表示的聲音也同樣遺失,它的發音從[ɾɪ] (印地語)到[ɾu] (馬拉地語 )都有。
ḹ 不是梵語的實際音素,而是包含在元音中的一個圖形約定,用來維持字母的短-長對的對稱性。[ 5]
रु ru 和रू rū 也有一些非正规的写法。
輔音
下表爲輔音和它們的排列順序:[ 13]
sparśa (塞音 )
anunāsika (鼻音 )
antastha (近音 )
ūṣma/saṃghashrī (擦音 )
清濁
aghoṣa (清音)
ghoṣa (濁音)
aghoṣa (清音)
ghoṣa (濁音)
送氣 與否
alpaprāṇa (不送氣音)
mahāprāṇa (送氣音)
alpaprāṇa (不送氣音)
mahāprāṇa (送氣音)
alpaprāṇa (不送氣音)
mahāprāṇa (送氣音)
kaṇṭhya (喉音 )
क
ka /k/
ख
kha /kʰ/
ग
ga /g/
घ
gha /gʱ/
ङ
ṅa /ŋ/
ः
ḥ /h/
ह
ha /ɦ/
tālavya (腭音 )
च
ca /c,ʧ/
छ
cha /cʰ,ʧʰ/
ज
ja /ɟ,ʤ/
झ
jha /ɟʱ,ʤʱ/
ञ
ña /ɲ/
य
ya /j/
श
śa /ɕ,ʃ/
mūrdhanya (頭音 )
ट
ṭa /ʈ/
ठ
ṭha /ʈʰ/
ड
ḍa /ɖ/
ढ
ḍha /ɖʱ/
ण
ṇa /ɳ/
र
ra /r/
ष
ṣa /ʂ/
dantya (齒音 )
त
ta /t̪/
थ
tha /t̪ʰ/
द
da /d̪/
ध
dha /d̪ʱ/
न
na /n/
ल
la /l/
स
sa /s/
oṣṭhya (唇音 )
प
pa /p/
फ
pha /pʰ/
ब
ba /b/
भ
bha /bʱ/
म
ma /m/
व
va /ʋ/
最多產的變音符號是下標 nuqtā ़ 。印地語 使用它來表示波斯 音素क़ qa /q/ ,ख़ xa /x/ ,ग़ ġa /ɣ/ ,ज़ za /z/ 和फ़ fa /f/ ,并用於發展出來的同位異音ड़ ṛa /ɽ/ 和ढ़ ṛha /ɽʱ/ 。(ऴ ḷha /𝼈ʱ/ 在印地語中沒有用到但是可以存在的。)
信德語 的內爆音 用下劃線 ॒ 表示:ग॒ [ɠ] , ज॒ [ʄ] , ड॒ [ɗ] , ब॒ [ɓ] 。
送氣 響音 可以表示為同ह ha 的合寫:म्ह mha , न्ह nha , ण्ह ṇha , व्ह vha , ल्ह lha , ळ्ह ḷha , र्ह rha 。
Masica (1991 :147頁)記錄了馬爾瓦里語 使用了特殊符號表示ḍa [ɗə] (而ड = [ɽə] )。
合寫
JanaSanskritSans字体下द्ध्र्य ddhrya 的合寫。[ 14]
如上所述,其間去除元音的連續的輔音可以按照法则合寫在一起為合字 (复辅音或多个辅音)。這些支配輔音音叢的規則,有的普遍适用,有的仅对少数辅音适用,还有一些例外。儘管绝大部分已经标准化,但是在輔音音叢中仍有特定的變體,本頁所基於的Unicode 用到的只是一種方案。下面是一些規則:
36個輔音中有24個包含右豎杠(ख 、घ 、ण 等)。作為輔音音叢的第一或中間片段,它們要去掉這個豎杠。比如त + व = त्व ,ण + ढ = ण्ढ ,स + थ = स्थ 。श ś(a) 在व va 、न na 、च ca 、ल la 和र ra 之前時,要寫為श्व śva 、श्न śna 、श्च śca श्ल śla 和श्र śra 。
र r(a) 去元音后作為合字的第一个字母時,写作后面字母或后面字母ा ā- 附標上的彎曲上折線,比如र्व rva 、र्वा rvā 、र्स्प rspa 、र्स्पा rspā 。当它被置于去元音后的ट ठ ड ढ ङ छ 字母之後,两者合写时,则写成這些字母下分叉的兩条斜線,即ट्र ठ्र ड्र ढ्र ङ्र छ्र 。在其他地方作為最后一個字母时,它被表示為左下角的斜線,比如क्र ग्र भ्र 。त ta 上移得到त्र tra 。
第一個字母無右豎杠(例如द d(a) 和ह h(a) )的,可以對第二个字母做縮小和去橫杠處理,然后写在第一个字母的下方。क k(a) 、छ ch(a) 和फ ph(a) 则将右半边钩状的部分縮短然后直接連接上隨后的字符。
合寫क्ष kṣ 和ज्ञ jñ 不能直接從被复合的辅音中变形而来。क्ष 是क् + ष 的合写,而ज्ञ 是ज् + ञ 的 合寫。
下表列出梵語 36個基本字母所組成的1296個所有 可能的雙輔音音叢 (大多不見於固有詞),将光标滚动至連寫處可显示其羅馬化形式。其中橙底表示例外形式的連寫,灰底表示帶有virāma的連寫。
क
ख
ग
घ
ङ
च
छ
ज
झ
ञ
ट
ठ
ड
ढ
ण
त
थ
द
ध
न
प
फ
ब
भ
म
य
र
ल
व
श
ष
स
ह
ळ
क्ष
ज्ञ
क
ख
ग
घ
ङ
च
छ
ज
झ
ञ
ट
ठ
ड
ढ
ण
त
थ
द
ध
न
प
फ
ब
भ
म
य
र
ल
व
श
ष
स
ह
ळ
三字合寫
三合及更長的輔音叢:
क्ष्ण kṣṇ क्ष्म kṣm क्ष्य kṣy त्र्य try स्त्य sty स्त्र str प्त्र ptr प्स्य psy त्क्र tkr त्क्व tkv त्क्ष tkṣ त्त्न ttn त्त्र ttr त्त्व ttv त्प्र tpr त्प्ल tpl त्स्न tsn त्स्य tsy त्स्व tsv च्छ्य cchy च्छ्र cchr ज्ज्य jjy ज्ज्व jjv क्त्र ktr क्त्व ktv क्ष्ण्य kṣṇy ग्ध्र gdhr ग्न्य gny ग्र्य gry म्प्र mpr न्त्य nty न्त्र ntr न्द्ध nddh न्द्र ndr न्ध्य ndhy न्ध्र ndhr ण्ड्र ṇḍr र्ग्य rgy र्ग्र rgr र्घ्य rghy र्ङ्ग rṅg र्ज्य rjy र्ढ्य rḍhy र्ण्य rṇy र्त्त rtt र्त्त्र rttr र्त्म rtm र्त्य rty र्त्र rtr र्त्स rts र्द्ध rddh र्द्र rdr र्द्व rdv र्ध्म rdhm र्ध्र rdhr र्ध्व rdhv र्म्य rmy र्स्व rsv र्ष्ट्र rṣṭr र्ष्ण rṣṇ र्ष्म rṣm र्ष्य rṣy ष्क्र ṣkr ष्क्व ṣkv ष्प्य ṣpy ष्म्य ṣmy द्व्य dvy द्ध्म ddhm द्ध्व ddhv ण्ड्व ṇḍv द्ग्र dgr द्द्य ddy द्द्र ddr द्ब्र dbr ङ्क ṅkt ङ्क्र ṅkr ङ्क्ष ṅkṣ ङ्क्ष्य ṅkṣy ण्ड्य ṇḍy ष्ट्व ṣṭv ष्ठ्य ṣṭhy
新的印度-雅利安語言也可以對梵語借詞使用上述形式。
重音標號
吠陀梵語的音高重音 依賴於shakha 而寫為各種符號。在《梨俱吠陀 》中,低调anudātta 寫為下橫線(॒ ),降调svarita 寫為上豎線(॑ ),而高调udātta 不標記。
數字
天城文數字
०
१
२
३
४
५
६
७
८
९
0
1
2
3
4
5
6
7
8
9
书写形式
天城文,自左向右,横向书写。原本的书写形式類似藏文和城文,相邻两个阿叉罗之間存在空隙。基於15世紀天城文字體的耆那伏婆OpenType字體仍然使用這種形式。
近代天城文转用连书形式,词与词之间不留空隙,一句话从头到尾连续不断地拼写。
至於词与词之间用西式半角大空格隔开,则也是近代的事。
轉寫
把天城文轉寫成羅馬文字 的方法有许多。最廣泛使用的轉寫方案是IAST 。下面列出主要的天城文轉寫方法:
IAST
國際梵語轉寫字母(IAST) 是梵語羅馬化的學術標準。IAST成为了用在書籍和期刊等印刷品中事实上的標準,加之其Unicode字體更容易得到,它也日益用於電子文本。它根据的是1912年在雅典 召開的“東方學學者大會”所確立的標準。
加爾各答國家圖書館羅馬化 意圖羅馬化所有印度文字 ,它是IAST的擴展。
Harvard-Kyoto
相對於IAST,Harvard-Kyoto 看起來更簡單。它不包含所有IAST的變音符號。這使得錄入Harvard-Kyoto要比IAST容易。Harvard-Kyoto使用大寫字母 。
ITRANS
ITRANS 是廣泛用於Usenet 的天城文到ASCII 的無損轉寫方案。它是Harvard-Kyoto方案的擴展。在ITRANS中,詞Devanāgarī 寫為“Devanaagarii”。ITRANS有同名應用程序確保錄入印度文字 。用戶輸入羅馬字母而ITRANS預處理器把羅馬字母顯示為天城文(或其他印度語言)。最新版本的ITRANS是2001年7月的5.30版。
ISO 15919
ISO 15919是2001年確立的轉寫國際標準。特定於天城文的那部分內容幾乎同一於作為梵語學術標準的IAST。
ALA-LC羅馬化
ALA-LC (页面存档备份 ,存于互联网档案馆 )是美國國會圖書館 和美國圖書館協會 的轉寫標準,廣泛的用於北美圖書館。轉寫表基於各種語言,有對印地語 (页面存档备份 ,存于互联网档案馆 )的表格,也有對梵語和俗語 (页面存档备份 ,存于互联网档案馆 )的表格。
編碼
ISCII
ISCII 是定長 8-位編碼。低128代碼點是普通ASCII ,高128代碼點是ISCII-專屬。
它被設計用來不只表示天城文,所以還有各種其他印度文字 和用於轉寫印度文字的基於拉丁文字的變音符號。
ISCII在很大程度上被Unicode所替代,但已經嘗試在它的印度語區塊中保持了ISCII格局。
Unicode中的天城文
Unicode的天城文區間是U+0900 .. U+097F,U+1CD0 .. U+1CFF和U+A8E0 .. U+A8FF。灰色區域指示未指派的代碼點。
天城文 Devanagari [1] Unicode Consortium 官方碼表 (PDF)
0
1
2
3
4
5
6
7
8
9
A
B
C
D
E
F
U+090x
ऀ
ँ
ं
ः
ऄ
अ
आ
इ
ई
उ
ऊ
ऋ
ऌ
ऍ
ऎ
ए
U+091x
ऐ
ऑ
ऒ
ओ
औ
क
ख
ग
घ
ङ
च
छ
ज
झ
ञ
ट
U+092x
ठ
ड
ढ
ण
त
थ
द
ध
न
ऩ
प
फ
ब
भ
म
य
U+093x
र
ऱ
ल
ळ
ऴ
व
श
ष
स
ह
ऺ
ऻ
़
ऽ
ा
ि
U+094x
ी
ु
ू
ृ
ॄ
ॅ
ॆ
े
ै
ॉ
ॊ
ो
ौ
्
ॎ
ॏ
U+095x
ॐ
॑
॒
॓
॔
ॕ
ॖ
ॗ
क़
ख़
ग़
ज़
ड़
ढ़
फ़
य़
U+096x
ॠ
ॡ
ॢ
ॣ
।
॥
०
१
२
३
४
५
६
७
८
९
U+097x
॰
ॱ
ॲ
ॳ
ॴ
ॵ
ॶ
ॷ
ॸ
ॹ
ॺ
ॻ
ॼ
ॽ
ॾ
ॿ
注释
1.^ 依据 Unicode 14.0
天城文擴展 Devanagari Extended [1] Unicode Consortium 官方碼表 (PDF)
0
1
2
3
4
5
6
7
8
9
A
B
C
D
E
F
U+A8Ex
꣠
꣡
꣢
꣣
꣤
꣥
꣦
꣧
꣨
꣩
꣪
꣫
꣬
꣭
꣮
꣯
U+A8Fx
꣰
꣱
ꣲ
ꣳ
ꣴ
ꣵ
ꣶ
ꣷ
꣸
꣹
꣺
ꣻ
꣼
ꣽ
ꣾ
ꣿ
注釋
1.^ 依據 Unicode 14.0
吠陀擴展 Vedic Extensions [1] [2] Unicode Consortium 官方碼表 (PDF)
0
1
2
3
4
5
6
7
8
9
A
B
C
D
E
F
U+1CDx
᳐
᳑
᳒
᳓
᳔
᳕
᳖
᳗
᳘
᳙
᳚
᳛
᳜
᳝
᳞
᳟
U+1CEx
᳠
᳡
᳢
᳣
᳤
᳥
᳦
᳧
᳨
ᳩ
ᳪ
ᳫ
ᳬ
᳭
ᳮ
ᳯ
U+1CFx
ᳰ
ᳱ
ᳲ
ᳳ
᳴
ᳵ
ᳶ
᳷
᳸
᳹
ᳺ
注釋
1.^ 依據 Unicode 14.0
2.^ 灰色區域為未分配碼位
天城文鍵盤布局
INSCRIPT
InScript 是給天城文的標準鍵盤 佈局。它內建於所有主要操作系统 中。Microsoft Windows 支持InScript佈局(使用Mangal 字體),它可以被用來輸入Unicode天城文字符。InScript在一些觸控螢幕手機 上也可獲得。
INSCRIPT鍵盤布局(Windows、Solaris、Java)
打字機
這種佈局在没有計算機或计算机不常用的時代用在手動打字機 上。出於向後兼容性一些錄入工具如Indic IME 仍提供這種佈局。
印度標準打字機鍵盤佈局
引用
參考書目
外部連結