音と文字の対応

音節

「バナナ」/banana/の中の、/b/、/a/、/n/のように、これ以上は分割できない個々の音のことを分節音(segment)または音素(phoneme)と呼びます。

これに対し、「バナナ」/banana/の中の、/ba/と/na/のように、母音を中心とした発音しやすい音の集まりを音節(syllable)と呼びます。

英語のstrike /straik/という単語は、これで1音節ですが、日本語の「ストライク」/sutoraiku/という単語は5音節です。このように、音節の形は言語毎に異なります。

/ba/や/na/のように、母音で終わる音節を開音節(Open Syllable)と呼びます。開音節は形が単純になる傾向があります。これに対して、/straik/のように、子音で終わる音節を閉音節(Closed Syllable)と呼びます。閉音節は形が複雑になる傾向があります。

日本語は、閉音節もありますが、閉音節は特殊な環境に限られていて、開音節が中心の言語です。このような言語は開音節言語と呼ばれます。これに対して、英語は、閉音節が特殊な環境に限られていません。このような言語のことを閉音節言語と呼びます。

日本語やイタリア語、スペイン語などは、開音節言語で、音節の型は数百程度と比較的少なくなります。これに対して、英語、中国語、朝鮮語等は、閉音節言語で、音節の型は数千から万を超える程多くなります。

文字と音の対応

文字は、これまで見てきた分節音と音節のどちらに対応してるかで二つに分かれます。

字母

分節音に対応している文字を字母(alphabet)と呼びます。代表的な字母としては次のようなものがあります。

ローマ字(Latin Alphabet)
ABCDEFGHIJKLMNOPQRSTUVWXYZ abcdefghijklmnopqrstuvwxyz
ギリシャ文字(Greek Alphabet)
ΑΒΓΔΕΖΗΘΙΚΛΜΝΞΟΠΡΣΤΥΦΧΨΩαβγδεζηθικλμνξοπρσ(ς)τυφχψω
キリル文字(Cyrillic Alphabet)
АБВГДЕЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯабвгдежзийклмнопрстуфхцчшщъыьэюя
ヘブライ文字(Hebrew Alphabet)
לםמןנסעףפץצקרשתיךכלםמןנסעףפץצקרשת(alef bet gimel dalet ...)
アラビア文字(Arabic Alphabet)
سشصضطظعغفقكلمنهوى(alef beh marbuta teh ...)

ローマ字とキリル文字はギリシャ文字から派生し、ヘブライ文字とアラビア文字はアラム文字(Aramaic alphabet)から派生しました。これらの文字は、フェニキア文字(Phoenician Alphabet)という共通の祖先から派生したものです。フェニキア文字の一部は、エジプトのヒエログリフ(Hieroglyph)にまで遡ることができます。

ヘブライ文字、アラビア文字あるいはその祖先であるアラム文字、フェニキア文字、ヒエログリフ等は、中近東地域の支配的言語勢力であるセム語族(Semitic languages)の文字として発展しました。セム語族の言語の特徴として、母音の種類が少なく(3)音節の形も比較的単純であることが上げられます。そのため、これらの文字においては、通常、母音は表記されません。したがって、母音を表す文字・記号は存在しないか、存在しても補助的なものでしかありません。フェニキア文字は、母音を表す文字を全く持ちませんが、このような子音字だけからなる文字体系をアブジャド(Abjad)と呼びます。

ローマ字、キリル文字、ギリシャ文字は、主に、ヨーロッパのインド・ヨーロッパ語族(Indo-European languages)の文字として発展しました。フェニキア文字がギリシャ語に取り入れられて、ギリシャ文字になりましたが、ギリシャ語はインド・ヨーロッパ語族の言語です。インド・ヨーロッパ語族の言語の特徴は、母音の種類が多く、音節の型が多くなっています。そのため、子音のみを表記すると多くの情報が失われてしまうことになります。そのため、母音を表す文字を工夫して追加しました。その結果、現在の子音と母音の両方を表記するアルファベットが誕生したのです。

  1. 例えば、標準的なアラビア語では、母音は、/a/、/i/、/u/の3つしかありません。

音節文字

音節に対応している文字を音節文字(syllabary)と呼びます。現在使用されている代表的な音節文字としては次のようなものがあります。

漢字
中国・台湾・日本・韓国・(ベトナム)で使用
ひらがな・カタカナ
日本で使用
ハングル
韓国・北朝鮮で使用
チュノム(字喃)
(ベトナム)で使用

これらの文字は全て東アジア地域で使われていて、漢字に起源を持つ、あるいは、漢字に強い影響を受けたものばかりです。

漢字

漢字は、中国語を表記するために発展した文字です。中国語の特徴として、1音節が1語に対応し、1文字で表記されることが上げられます。中国語は、閉音節言語で母音と子音に加えて、声調(tone)の区別も音節の型の重要な要素になります。そのため、可能な音節の型は1万程度になるとも言われています。

漢字の文字数はどのくらいあるのでしょうか?そのことを知る手がかりとして、中国の各時代ごとの字書に収録されている漢字の数を示したものが次の表です。(4)

漢字の数の変遷
書名 成立年 字数
説文解字(許慎) 100(後漢) 9,353
玉編(顧野王) 543(南北朝) 16,917
唐韻(孫愐) 751(唐) 26,194
類編 1066(北宗) 31,319
字彙(梅膺祚) 1615(明) 33,179
康煕字典(康熙帝) 1717(清) 49,030
大漢和辞典(諸橋轍次) 1986 51,701
漢語大字典 1986 59,170
中華字海 1994 85,568

後漢の説文解字の時点で既に1万字近く存在していましたが、時代が下るにつれてどんどん増加していきました。なぜこのように漢字は増え続けてきたのでしょうか?

一つには、文化が発展するにつれて、語彙が増加したことが挙げられます。中国語は、一語一音節が原則でしたから、同音異義語が多く出来ることになります。同じ音でも異なる意味の語を表記するのに、形声という方法を用いました。形声とは、音を表す記号である音符に意味の違いを示す記号である意符を組み合わせて新しい字を作る方法です。例えば、音符として「工(コウ)」を使って作られ、「コウ」の音読みを持つ漢字は以下のようなものがあります。(5)

「工(コウ)」に、直接、意符を組み合わせたもの
仜、江、叿、屸、扛、肛、杠、玒、疘、矼、空、紅、虹、䉺、缸、羾、舡、貢、訌、豇、魟、䲨
「空(コウ)」に意符を組み合わせたもの
倥、椌、啌、崆、悾、涳、控、腔、箜、䜫、鞚、鵼
「貢(コウ)」に意符を組み合わせたもの
嗊、摃、熕、槓、䔈、碽
「江(コウ)」に意符を組み合わせたもの
茳、鴻

では、形声以外に漢字の音を伝える方法はあるのでしょうか。その方法として反切があります。漢字の表す音節を、音節の始めから母音の前までの声母と、母音から音節末までの韻母に分け、この声母と韻母の組み合わせで漢字の音を表記する方法です。例えば、「東」の音[toŋ]は「徳紅切」(『広韻』)として表記します。

徳[tok] + 紅[h] --> 東[toŋ]

これは、上に示したように、「東」の音は、「徳」の声母[t]と「紅」の韻母[oŋ]を繋げた[toŋ]であることを表しています。

これ以外に、発音記号的な方式として、注音符号(Bopomofo)、拼音(pinyin)方式、韋氏(Wade-Giles)方式などの音声表記があります。

漢字の音声表記の例
反切 Bopomofo pinyin Wade-Giles
徳紅切 平 ㄉㄨㄥ dōng tung
博墨切 入 ㄅㄟ běi pei
舉卿切 平 ㄐ丨ㄥ jīng king

北京を英語で、現在主流となっているBeijingと表記するか、以前主流だったPekingと表記するかの違いは、このpinyin方式とWade-Giles方式の違いに起因しています。

漢字は、よく表意文字(Ideograph)であると言われます。しかし、これまで見てきたように、漢字はまず、音節を単位とする、表音文字(phonograph)です。中国語の場合、1音節が1語に対応していることから、漢字は、1文字が1語を表す表語文字(logogram)に、副次的になったと考えられます。

しかし、「1音節=1語=1文字」ということが中国語の全てに当てはまる訳ではありません。例えば、「忸怩」、「彷彿」、「恍惚」などは2音節で1語を形成する擬音語・擬態語(onomatopoeia)の例です。また、「葡萄」や「琵琶」などは、外国語を転写した2音節で1語を形成する外来語す。これらの語を構成する各文字は、本来、単独では意味を持ちません。

漢字の文字数は膨大な数になるため、現在、中華人民共和国において漢字の使用制限・簡略化が進められています。

日常生活においては、6,000字程度の漢字で十分であるとする調査結果があります。

1988年に「現代漢語常用字表(2,500字)」、「現代漢語次常用字表(1,000字)」、「現代漢語通用字表(7,000字)」が制定され、使用する漢字の数を制限しています。

同時に、中華人民共和国においては、漢字の字形の簡略化も推し進められています。このため、漢字の字形の簡略化を行っている中華人民共和国と、簡略化を行っていない中華民国などの間で漢字の字形が大きく異なることになりました。中華民国などの字体(例えば「漢字」、「中華」)を繁体字と呼びます。これに対し、簡略化を行っている中華人民共和国の字体(例えば「汉字」、「中华」)を簡体字と呼びます。中華人民共和国の漢字の簡略化は、単に1字の字形を簡略化するだけでなく、同じ音価を持つ複数の字を1字に統合することも同時に行われています。例えば、「個」・「箇」は「个」に、「係」・「繋」は「系」に、「衝」・「沖」は「冲」に統合されています。

  1. 大漢和辞典、漢語大字典、中華字海の文字数は、鎌田正「果てしない漢字の収録について」に拠っています。
  2. 藤堂明保・加納喜光編『学研新漢和大字典』(2005)の音読み「コウ」に掲げてあるものを列挙しました。しかし、コンピュータでまだ使えない字もあるため、全部ではありません。

インド系文字

アルファベットや漢字とは異なる文字のグループとして、インド系文字(Indian script)があります。インドには、デーヴァナーガリ文字(Devanagari)、グジャラート文字(Gujarati)、テルグ文字(Telugu)、ベンガル文字(Bengali)、オリヤー文字(Oriya)、カンナダ文字(Kannada)、グルムキー文字(Gurmukhi)、タミル文字(Tamil)、マラヤーラム文字(Malayalam)など多くの文字があります。また、インド系文字の影響を受けて発達した文字に、チベット文字(Tibetan)やタイ文字(Thai)などがあります。

デーヴァナーガリ文字(Devanagari)
अआइईउऊऋऌऍऎएऐऑऒओऔकखगघङचछजझञटठडढणतथदधनऩपफबभमयरऱलळऴवशषसह
グジャラート文字(Gujarati)
અઆઇઈઉઊઋઍએઐઑઓઔકખગઘઙચછજઝઞટઠડઢણતથદધનપફબભમયરલળવશષસહ
テルグ文字(Telugu)
అఆఇఈఉఊఋఌఎఏఐఒఓఔకఖగఘఙచఛజఝఞటఠడఢణతథదధనపఫబభమయరఱలళవశషసహ
ベンガル文字(Bengali)
অআইঈউঊঋঌএঐওঔকখগঘঙচছজঝঞটঠডঢণতথদধনপফবভমযরলশষসহ
オリヤー文字(Oriya)
ଅଆଇଈଉଊଋଌଏଐଓଔକଖଗଘଙଚଛଜଝଞଟଠଡଢଣତଥଦଧନପଫବଭମଯରଲଳଵଶଷସହ
カンナダ文字(Kannada)
ಅಆಇಈಉಊಋಌಎಏಐಒಓಔಕಖಗಘಙಚಛಜಝಞಟಠಡಢಣತಥದಧನಪಫಬಭಮಯರಱಲಳವಶಷಸಹ
グルムキー文字(Gurmukhi)
ਅਆਇਈਉਊਏਐਓਔਕਖਗਘਙਚਛਜਝਞਟਠਡਢਣਤਥਦਧਨਪਫਬਭਮਯਰਲਵਸ਼ਸਹ
タミル文字(Tamil)
அஆஇஈஉஊஎஏஐஒஓஔகஙசஜஞடணதநனபமயரறலளழவஷஸஹ
マラヤーラム文字(Malayalam)
അആഇഈഉഊഋഌഎഏഐഒഓഔകഖഗഘങചഛജഝഞടഠഡഢണതഥദധനപഫബഭമഹയരറലളഴവശഷസഹൊിീുൂൃെേേൈൊോൌംഃ്ൗൠൡ
チベット文字(Tibetan)
ཀཁགགྷངཅཆཇཉཊཋཌཌྷཎཏཐདདྷནཔཕབབྷམཙཚཛཛྷཝཞཟའཡརལཤཥསཧཨཀྵཪ
タイ文字(Thai)
กขฃคฅฆงจฉชซฌญฎฏฐฑฒณดตถทธนบปผฝพฟภมยรฤลฦวศษสหฬอฮฯะ

ここでは、サンスクリットの表記に使われるデーヴァナーガリ文字をインド系文字の代表例として扱います。

デーバナーガリー文字とその音価
 अ  (a)  आ (aa)  इ  (i)  ई  (ii)  उ  (u)  ऊ (uu)  ऋ  (ṛ)  ऌ  (ḷ)  ऍ  (e)  ऎ (ĕ)  ए  (e)  ऐ  (ai)  ऑ  (o)  ऒ  (ŏ)
 ओ (o)  औ (au)  क (ka)  ख (kha)  ग (ga)  घ (gha)  ङ (nga)  च (ca)  छ (cha)  ज (ja)  झ (jha)  ञ (nya)  ट (tta)  ठ (ttha)
 ड (dda)  ढ (ddha)  ण (nna)  त (ta)  थ (tha)  द (da)  ध (dha)  न (na)  ऩ (nnna)  प (pa)  फ (pha)  ब (ba)  भ (bha)  म (ma)
 य (ya)  र  (ra)  ऱ (rra)  ल (la)  ळ (lla)  ऴ (llla)  व (va)  श (sha)  ष (ssa)  स (sa)  ह (ha)

インド系文字の特徴として、ヴィラーマ(virāma)と呼ばれる仕組みを持つことがあげられます。これは、子音を表す文字は、本来は/a/を含んだ音節文字ですが、/a/以外の母音を持つ音節を表記する場合には、その文字に含まれる/a/を打ち消すというものです。例えば、/ka/を表記する場合は、単独の文字कですが、/ko/を表記する場合はकी(/ka/+/o/)と表記します。このような仕組みを持つ、アルファベットと音節文字の中間的な文字システムをアブギダ(abugida)と呼びます。

これはインドの言葉では母音/a/または/ā/で終わる音節の比率が高いことから生まれた工夫であると考えられます。サンスクリットに関する調査では、/a/で終わる音節が46.3%、また、/ā/で終わる音節が19.2%という結果が出ています。(6)

  1. 町田・澤田 (2005)

ハングル

これまで見てきた文字は、自然発生的に生まれ、それが記述する言語の変化や他の言語への転用に対応する形で変化したものですが、朝鮮語(Korean)の文字であるハングル(한글)は全く異なった成立過程を持っています。

まず、ハングルが用いられている言語である朝鮮語の音韻的特徴を見てみましょう。

朝鮮語は、閉音節言語であり、音節の始めの子音(連鎖)は19通り、母音(連鎖)は21通り、音節末の子音(連鎖)は27通りあります。そして、これらに基づくと、可能な音節パターンは11,172種類になります。(7)

ハングルの成立以前の朝鮮半島においては、漢字を利用した吏読(りとう)という表記方法が用いられていました。しかし、朝鮮語は中国語とかなり異なる音韻的な性質を持っていたため、その利用は複雑で、朝鮮語を効率的に表示するシステムではありませんでした。

そこで、李氏朝鮮の世宗は、朝鮮語に適した文字システムの開発を命じました。その結果、世宗25年(1443年)に訓民正音 (훈민정음)として制定されたものがハングルです。

以下に世宗28年(1446年)に出たこの文字システムの解説である『訓民正音(훈민정음)』の序文を示します。(8)

國之語音、異乎中國、與文字不相流通、故愚民、有所欲言、而終不得伸其情者多矣。予為此憫然、新制二十八字、欲使人人易習、便於日用耳。

制定時は、28字(子音17字、母音11字)ありましたが、中国語表記専用の文字が除かれ、現在ではそのうち24字のみが使われています。

ハングルの要素と音の対応(子音)
   両唇音   歯茎音   歯茎摩擦音   硬口蓋破擦音   軟口蓋音   喉頭音 
 口音(平音)   ㅂ /p, b/   ㄷ /t, d/   ㅅ /s,ʃ/   ㅈ /j, č/   ㄱ /k, g/    
 口音(激音)   ㅍ /ph/   ㅌ /th/      ㅊ /čh/   ㅋ /kh/   ㅎ /h/ 
 口音(濃音)   ㅃ /ʼp/   ㄸ /ʼt/   ㅆ /ʼs/   ㅉ /ʼz/   ㄲ /ʼk/    
 鼻音   ㅁ /m/   ㄴ /n/         ㅇ /ŋ/    
 流音      ㄹ /r, l/             
ハングルの要素と音の対応(母音)
 単母音   ㅏ /a/   ㅓ /ɔ/   ㅗ /o/   ㅜ /u/   ㅡ /ü/   ㅣ /i/   ㅐ /ä/   ㅔ /e/ 
 /y/+単母音   ㅑ /ya/   ㅕ /yɔ/   ㅛ /yo/   ㅠ /yu/         ㅒ /yä/   ㅖ /ye/ 
 /w/+単母音   ㅘ /wa/   ㅝ /wɔ/            ㅟ /ui/   ㅙ /wä/   ㅞ /we/ 
 二重母音               ㅢ/üi/          

ハングルの成立には、悉曇学を通じたインドの音韻研究と、音節単位で音を表記する漢字の強い影響があったと考えられます。

  1. unicode 4.0 p.315
  2. 以下の文は、趙義成氏の「訓民正音 解例」を引用したものであり、『訓民正音』の全文やその解説もこのページで見ることが出来ます。

かな

日本語においては、漢字、ひらがな、カタカナ、ローマ字が混用されています。その内、日本だけでしか使われていない文字はひらがなおよびカタカナです。

ひらがなおよびカタカナは、それぞれ、基本的な文字として「あ」から「ん」までの48の記号を持ち、さらに、濁点(゛)、半濁点(゜)、拗音(ゃゅょ)・促音(っ)表記のための小型のかなを補助的な記号として用いています。

古代日本においては、下のいろは歌のように、濁点は使用されていませんでした。

いろはにほへと ちりぬるを わかよたれそ つねならむ うゐのおくやま けふこえて あさきゆめみし ゑひもせす

これは、古代の日本語においては、清音と濁音の分布が規則的であり、清濁の区別を明記しなくても問題が起きなかったためです。

しかし、室町時代から江戸時代にかけて、清音と濁音の分布が変化し、清濁の区別を明記しなければならなくなりました。

そこで、仏教の経典の発音を表記する手段として用いられていた声点(しょうてん)を利用し、声点の中でもあまり使われることが多くなかった右肩の位置(声点では「去声」を表す位置)に、(1個の点で表記する)声点と区別するため点を2個置いて濁音の印としました。

逆に、濁音ではなく清音であることを示すために、下の例のように、濁点と同じ右肩の位置に丸を置いて表記しました。これを不濁点と言います。

「鴬の谷より出るこゑなくは゜春くることを誰か知らまし゜」

本居宣長『古今和歌集遠鏡』

これが、明治以降大量に流入した欧米起源の外来語の/p/音を表記するための半濁点に転用されました。