Unicodeの漢字部分は中国や韓国で使われている漢字と合わせて配置したため、JIS X 0213 とまったく異なる表になっており、換算はできません。対応表を見るしかなくなっています。(しかも記号については複数の対応が考えられて混乱しています)
Unicode 自体もさまざまな事情のため複雑なのですが、ここでは JIS X 0213 との文字セットの違いを認識してください。
以下はUnicodeの表のごく一部です。緑色部分が JIS X 0208 にある文字。水色部分が JIS X 0213:2004 で追加された文字。白い色の部分は中国や韓国の由来でJISにない文字です。
Unicodeのうち日本で使用する漢字はJISを元にUnicodeに登録しているためJISにある文字はすべて登録されています。
また、Unicode(正確にはISO/IEC 10646)を翻訳してJISとして定めた JIS X 0221 もあります。このような規格を国際一致規格といいます。JIS X 0221の規格名称は「国際符号化文字集合(UCS)」といいます。Unicode と JIS との関係もまたさまざまな事情を含んでいます。
UTF-16の順に並べた亜の近辺の一覧。UTF-8もUTF-16を元にしたエンコード方式なので順番になっています。しかし、面区点とそれを元にした 2022(ISO-2022-JP-2004)、SJIS(Shift_JIS-2004)、EUC(EUC-JIS-2004)は順番がばらばらです。空欄は中国や韓国の漢字のためJISに定められていない漢字です。
UTF-16 | UTF-8 | 面-区-点 | 2022 | SJIS | EUC | 文字 |
---|---|---|---|---|---|---|
4E91 | E4BA91 | 1-17-30 | 3-313E | 895D | B1BE | 云 |
4E92 | E4BA92 | 1-24-63 | 3-385F | 8CDD | B8DF | 互 |
4E93 | E4BA93 | 亓 | ||||
4E94 | E4BA94 | 1-24-62 | 3-385E | 8CDC | B8DE | 五 |
4E95 | E4BA95 | 1-16-70 | 3-3066 | 88E4 | B0E6 | 井 |
4E96 | E4BA96 | 亖 | ||||
4E97 | E4BA97 | 亗 | ||||
4E98 | E4BA98 | 1-47-43 | 3-4F4B | 986A | CFCB | 亘 |
4E99 | E4BA99 | 1-47-42 | 3-4F4A | 9869 | CFCA | 亙 |
4E9A | E4BA9A | 亚 | ||||
4E9B | E4BA9B | 1-26-19 | 3-3A33 | 8DB1 | BAB3 | 些 |
4E9C | E4BA9C | 1-16-01 | 3-3021 | 889F | B0A1 | 亜 |
4E9D | E4BA9D | 2-01-17 | 4-2131 | F050 | 8FA1B1 | 亝 |
4E9E | E4BA9E | 1-48-19 | 3-5033 | 98B1 | D0B3 | 亞 |
4E9F | E4BA9F | 1-48-20 | 3-5034 | 98B2 | D0B4 | 亟 |
漢字を中心に紹介しましたが、ハングル文字、タイ文字、アラビア文字、デーヴァナーガリ文字、モンゴル文字、タミル文字などたくさんの文字が登録されています。対応する文字の形(フォント)がコンピュータに登録されて入れば表示されます。
聖愛中学高等学校