ユニコードタグのすすめ
註:このコラムは、環境によっては甚だしく文字化けすることがあります。m(_ _)m
コラムページのトップへもどる
「枕流亭」ホームへもどる
WEBで扱う漢字の問題
WEB上で中国を扱う上で、必ずぶつかる問題に「漢字」があります。
コンピューターの日本語文字コードに定義されている漢字の数に限りがあるからです。
たとえば「褒姒」の「姒」、「兗州」の「兗」、「澠池」の「澠」を挙げてみましょう。
これらの漢字をHTMLで表記するにはどうしたらよいのでしょうか?
1). 「褒ジ」「エン州」「メン池」などの表記で我慢する。
2). 「褒[女以]」「[亠+兌]州」「[水+黽]池」のような表記をする。
のような方法がまずあります。
これらの方法にもメリットがあります。文字化けする心配がまずない上に、作成者の手間も少なくてすみます。
3). GIF画像の外字を作成してHTML文書に貼りつける。
これはhttp://www2.snowman.ne.jp/~hiroto/ie4/index.htmlに外字の作成法が解説されていますし、
http://www.mojikyo.orgのような既成の画像を利用する方法もあります。
4). HTML文書を最初からユニコードテキストとして作成する。
これはhttp://nika01.hum.ibaraki.ac.jp/~nikaido/chubun002.htmlに解説があります。
ユニコードはJISコードなどと同じく文字コードの一種で、日・中(繁体字・簡体字)・韓・ヨーロッパなどの言語の混在文書が作成できます。
5). ユニコードタグを使ってHTML文書を作成する。
この方法を少し詳しく次段で解説しようと思います。
ユニコードタグのすすめ
ユニコードタグを利用する場合は、元のHTML文書は通常のS−JISやEUCコードで作成して構いません。
たとえば、斉孫子を指す「孫臏」を出す場合を考えます。
HTML文書のテキストで、1).の方法なら「孫ピン」と打つところですが、代わりに「孫臏」(10進タグ)または「孫臏」(16進タグ)と打ってみます。(註:英数記号部分は必ず半角文字で)
ブラウザで確認すると、あ〜ら不思議。孫臏と出ているのです。
たとえばATOKでこのタグを打つ場合。
「孫臏」の「臏」を出すためには、ATOK文字パレットで当該文字を検索すると、ユニコードの「81cf」という16進4桁のコード番号が見つかりますから、「孫臏」と打つと、16進タグの出来上がりです。
どの文字であっても、「&#x」と「;」の間に文字パレットで検索した4桁のコード番号をはさむとタグの完成です。
またこのタグを打つために「今昔文字鏡」のようなソフトを利用する方法もあります。
詳しくはhttp://www.mojikyo.orgを見ましょう。
このソフトで漢字を選択し、「右クリック」→「Unicodeタグ(10進)でクリップボードにコピー」(16進でも可)を選ぶと、タグがコピーできますので、これをHTML文書にペーストすると出来上がりです。
ユニコードタグを使う方法にもデメリットはあります。
1.ユニコードが表示できない環境では文字化けする。(Windows3.1以前とか)
2.ブラウザで表示された漢字をそのままコピー&ペーストで利用できない。
3.「孫ピン」「孫[月賓]」などとするより、作成者の手間がかかる(GIF外字ほどではないが)。
メリットは次のとおり。
1.約2万字が利用でき、多言語混在が可能。
2.「孫ピン」「孫[月賓]」などより表示が綺麗。
3.GIF外字を利用するよりファイルが軽くなる。作成者の手間も少ない。
なにやらデメリットとメリットが同数あるみたいに見えますが、WEB上で多漢字を利用するのに完璧な方法はありません。
ひとつ試してみてはいかがでしょうか?
このユニコードタグで表記される単語のほんの一例を下に並べてみました。
HTML表示 | 日本語慣用読み | タグ表記(10進) | タグ表記(16進) | 語句の分類 |
| | | | |
袁盎 | えんおう | 袁盎 | 袁盎 | 人名 |
兗州 | えんしゅう | 兗州 | 兗州 | 地名 |
応瑒 | おうとう | 応瑒 | 応瑒 | 人名 |
蒯通 | かいとう | 蒯通 | 蒯通 | 人名 |
桓魋 | かんたい | 桓魋 | 桓魋 | 人名 |
鄴 | ぎょう | 鄴 | 鄴 | 地名 |
羿 | げい | 羿 | 羿 | 人名 |
嵆康 | けいこう | 嵆康 | 嵆康 | 人名 |
邢州 | けいしゅう | 邢州 | 邢州 | 地名 |
滎陽 | けいよう | 滎陽 | 滎陽 | 地名 |
阮瑀 | げんう | 阮瑀 | 阮瑀 | 人名 |
高熲 | こうけい | 高熲 | 高熲 | 人名 |
呉王濞 | ごおうひ | 呉王濞 | 呉王濞 | 人名 |
蔡琰 | さいえん | 蔡琰 | 蔡琰 | 人名 |
蔡邕 | さいよう | 蔡邕 | 蔡邕 | 人名 |
郅支単于 | しっしぜんう | 郅支単于 | 郅支単于 | 人名 |
譙 | しょう | 譙 | 譙 | 地名 |
蒋琬 | しょうえん | 蒋琬 | 蒋琬 | 人名 |
召公奭 | しょうこうせき | 召公奭 | 召公奭 | 人名 |
鍾繇 | しょうよう | 鍾繇 | 鍾繇 | 人名 |
女媧 | じょか | 女媧 | 女媧 | 人名 |
顓頊 | せんぎょく | 顓頊 | 顓頊 | 人名 |
孫臏 | そんぴん | 孫臏 | 孫臏 | 人名 |
涿郡 | たくぐん | 涿郡 | 涿郡 | 地名 |
郗鑒 | ちかん | 郗鑒 | 郗鑒 | 人名 |
張郃 | ちょうこう | 張郃 | 張郃 | 人名 |
褚遂良 | ちょすいりょう | 褚遂良 | 褚遂良 | 人名 |
氐 | てい | 氐 | 氐 | 民族名 |
帝嚳 | ていこく | 帝嚳 | 帝嚳 | 人名 |
樊噲 | はんかい | 樊噲 | 樊噲 | 人名 |
費禕 | ひい | 費禕 | 費禕 | 人名 |
淝水 | ひすい | 淝水 | 淝水 | 地名 |
閩 | びん | 閩 | 閩 | 地名 |
褒姒 | ほうじ | 褒姒 | 褒姒 | 人名 |
龐統 | ほうとう | 龐統 | 龐統 | 人名 |
墨翟 | ぼくてき | 墨翟 | 墨翟 | 人名 |
澠池 | めんち | 澠池 | 澠池 | 地名 |
庾亮 | ゆりょう | 庾亮 | 庾亮 | 人名 |
李悝 | りかい | 李悝 | 李悝 | 人名 |
劉歆 | りゅうきん | 劉歆 | 劉歆 | 人名 |
劉昫 | りゅうく | 劉昫 | 劉昫 | 人名 |
劉琨 | りゅうこん | 劉琨 | 劉琨 | 人名 |
臨淄 | りんし | 臨淄 | 臨淄 | 地名 |
酈食其 | れきいき | 酈食其 | 酈食其 | 人名 |
コラムページのトップへもどる
ホームへもどる