多国語について

――世界中は同じ言葉を使って、同じように話していた。
東の方から移動してきた人々は、シンアルの地に平野を見つけ、そこに住み着いた。
彼らは、「れんがを作り、それをよく焼こう」と話し合った。石の代わりにれんがを、しっくいの代わりにアスファルトを用いた。
彼らは、「さあ、天まで届く塔のある町を建て、有名になろう。そして、全地に散らされることのないようにしよう」と言った。
主は降って来て、人の子らが建てた、塔のあるこの町を見て、
言われた。「彼らは一つの民で、皆一つの言葉を話しているから、このようなことをし始めたのだ。これでは、彼らが何を企てても、妨げることはできない。
我々は降って行って、直ちに彼らの言葉を混乱させ、互いの言葉が聞き分けられぬようにしてしまおう。」
主は彼らをそこから全地に散らされたので、彼らはこの町の建設をやめた。
こういうわけで、この町の名はバベルと呼ばれた。主がそこで全地の言葉を混乱(バラル)させ、また、主がそこから彼らを全地に散らされたからである。

――聖書「創世記11章1節-9節」(新共同訳)より抜粋

世界にはたくさんの言語を使っているところがあるわけで……。
コミュニケーション取るにも共通した言語がないとダメなのよねぇ、
Web制作関連で、英語、中国語、韓国語、ポルトガル語タイ語のページを作っているのですが、フォント周りがヘタレなのは仕様って事なんでしょう。

日本語でも第一水準漢字、第二水準漢字が一般的なのですが、もちろん他にも第三水準漢字や第四水準漢字があるわけです。
第三、第四の漢字コードまでサポートしているフォントはかなり少ないです。

Webで文字を取り扱うのならばUnicodeが一番安定していると思うのですが、英語圏で生まれたUnicodeは英語方面には強く感じなどの表意文字はかなり弱いのですよ。
その中でも、CJK Extension B (漢字拡張B)というのは、 Unicode の CJK Unified Ideographs Extension B の略で、さらに略して CJK Ext B とか、単に Ext B と書くこともある。 CJK とは中国語・日本語・韓国語のこと、 Unified Ideographs とは、それらの言語で部分的には共通して用いられるイデオグラフ(表意文字)、 要するに「漢字」の事です。

そもそも、Unicodeとはあまねく言語を一つのコード体系にしようという野望があったわけですが、当初のユニコードは U+0000 から U+FFFF までの16進4桁(2進16桁=16ビット=2バイト)、65536コードポイントを使っていましたが、6万程度のコード番号では世界の古今東西の文字記号を収録しきれ無いことが判明したわけです。
狭いコード表の陣地争いに、政治的な意図なども織り込まれ、複雑怪奇な形態を取ったわけです。
この場合の政治的な意図というのは、Unicodeに入れば言語として認められると言ったことや、「世界中の多言語環境でサポートされるべき基本の文字」として国際的に認識されるといったところでしょう。
Unicode 3.0 以降、U+10000以上にも文字が割り当てられてます。0x10000ごとの区切りをプレインといいます。
00000〜0FFFF の区間は基本多言語プレイン(BMP
10000〜1FFFF の区間は補足多言語プレイン(SMP)*1
20000〜2FFFF の区間は補足漢字プレイン(SIP*2

Ext Bに対応したフォントとして有名なのがSimsunというフォントです。
一応無料なので、インストールしておくと良いかも?
抱歉,您访问的页面没有找到


とまあ、解らない人が見ると何の呪文だか解らない話しをしてみるテスト

*1:比較的少ない文字数であるが、 実用上重要度が高いと考えられる文字の追補

*2:ほぼ全て漢字の領域、但し日本語でよく使われるもについては既に、BMP,SMPに入っており、第三、第四水準漢字などでも1%程度しか収録されていない