枕流亭・本館

ユニコードタグのすすめ


  註:このコラムは、環境によっては甚だしく文字化けすることがあります。m(_ _)m
コラムページのトップへもどる
「枕流亭」ホームへもどる

WEBで扱う漢字の問題

  WEB上で中国を扱う上で、必ずぶつかる問題に「漢字」があります。
  コンピューターの日本語文字コードに定義されている漢字の数に限りがあるからです。

  たとえば「褒姒」の「姒」、「兗州」の「兗」、「澠池」の「澠」を挙げてみましょう。
  これらの漢字をHTMLで表記するにはどうしたらよいのでしょうか?

  1). 「褒ジ」「エン州」「メン池」などの表記で我慢する。
  2). 「褒[女以]」「[亠+兌]州」「[水+黽]池」のような表記をする。

のような方法がまずあります。
  これらの方法にもメリットがあります。文字化けする心配がまずない上に、作成者の手間も少なくてすみます。

  3). GIF画像の外字を作成してHTML文書に貼りつける。
  これはhttp://www2.snowman.ne.jp/~hiroto/ie4/index.htmlに外字の作成法が解説されていますし、
  http://www.mojikyo.orgのような既成の画像を利用する方法もあります。

  4). HTML文書を最初からユニコードテキストとして作成する。
  これはhttp://nika01.hum.ibaraki.ac.jp/~nikaido/chubun002.htmlに解説があります。
  ユニコードはJISコードなどと同じく文字コードの一種で、日・中(繁体字・簡体字)・韓・ヨーロッパなどの言語の混在文書が作成できます。

  5). ユニコードタグを使ってHTML文書を作成する。
  この方法を少し詳しく次段で解説しようと思います。


ユニコードタグのすすめ

  ユニコードタグを利用する場合は、元のHTML文書は通常のS−JISやEUCコードで作成して構いません。
  たとえば、斉孫子を指す「孫臏」を出す場合を考えます。
  HTML文書のテキストで、1).の方法なら「孫ピン」と打つところですが、代わりに「孫臏」(10進タグ)または「孫臏」(16進タグ)と打ってみます。(註:英数記号部分は必ず半角文字で)
  ブラウザで確認すると、あ〜ら不思議。孫臏と出ているのです。

  たとえばATOKでこのタグを打つ場合。
  「孫臏」の「臏」を出すためには、ATOK文字パレットで当該文字を検索すると、ユニコードの「81cf」という16進4桁のコード番号が見つかりますから、「孫臏」と打つと、16進タグの出来上がりです。
  どの文字であっても、「&#x」と「;」の間に文字パレットで検索した4桁のコード番号をはさむとタグの完成です。

  またこのタグを打つために「今昔文字鏡」のようなソフトを利用する方法もあります。
  詳しくはhttp://www.mojikyo.orgを見ましょう。
  このソフトで漢字を選択し、「右クリック」→「Unicodeタグ(10進)でクリップボードにコピー」(16進でも可)を選ぶと、タグがコピーできますので、これをHTML文書にペーストすると出来上がりです。

  ユニコードタグを使う方法にもデメリットはあります。
  1.ユニコードが表示できない環境では文字化けする。(Windows3.1以前とか)
  2.ブラウザで表示された漢字をそのままコピー&ペーストで利用できない。
  3.「孫ピン」「孫[月賓]」などとするより、作成者の手間がかかる(GIF外字ほどではないが)。

  メリットは次のとおり。
  1.約2万字が利用でき、多言語混在が可能。
  2.「孫ピン」「孫[月賓]」などより表示が綺麗。
  3.GIF外字を利用するよりファイルが軽くなる。作成者の手間も少ない。

  なにやらデメリットとメリットが同数あるみたいに見えますが、WEB上で多漢字を利用するのに完璧な方法はありません。
  ひとつ試してみてはいかがでしょうか?

  このユニコードタグで表記される単語のほんの一例を下に並べてみました。
HTML表示日本語慣用読みタグ表記(10進)タグ表記(16進)語句の分類
袁盎えんおう袁盎袁盎人名
兗州えんしゅう兗州兗州地名
応瑒おうとう応瑒応瑒人名
蒯通かいとう蒯通蒯通人名
桓魋かんたい桓魋桓魋人名
ぎょう鄴鄴地名
羿げい羿羿人名
嵆康けいこう嵆康嵆康人名
邢州けいしゅう邢州邢州地名
滎陽けいよう滎陽滎陽地名
阮瑀げんう阮瑀阮瑀人名
高熲こうけい高熲高熲人名
呉王濞ごおうひ呉王濞呉王濞人名
蔡琰さいえん蔡琰蔡琰人名
蔡邕さいよう蔡邕蔡邕人名
郅支単于しっしぜんう郅支単于郅支単于人名
しょう譙譙地名
蒋琬しょうえん蒋琬蒋琬人名
召公奭しょうこうせき召公奭召公奭人名
鍾繇しょうよう鍾繇鍾繇人名
女媧じょか女媧女媧人名
顓頊せんぎょく顓頊顓頊人名
孫臏そんぴん孫臏孫臏人名
涿郡たくぐん涿郡涿郡地名
郗鑒ちかん郗鑒郗鑒人名
張郃ちょうこう張郃張郃人名
褚遂良ちょすいりょう褚遂良褚遂良人名
てい氐氐民族名
帝嚳ていこく帝嚳帝嚳人名
樊噲はんかい樊噲樊噲人名
費禕ひい費禕費禕人名
淝水ひすい淝水淝水地名
びん閩閩地名
褒姒ほうじ褒姒褒姒人名
龐統ほうとう龐統龐統人名
墨翟ぼくてき墨翟墨翟人名
澠池めんち澠池澠池地名
庾亮ゆりょう庾亮庾亮人名
李悝りかい李悝李悝人名
劉歆りゅうきん劉歆劉歆人名
劉昫りゅうく劉昫劉昫人名
劉琨りゅうこん劉琨劉琨人名
臨淄りんし臨淄臨淄地名
酈食其れきいき酈食其酈食其人名


コラムページのトップへもどる
ホームへもどる