JIS X 0213 の名称は「7ビット及び8ビットの2バイト情報交換用符号化拡張漢字集合」です。JIS X 0208に4354字を追加して、計1万1233字の文字を定めています。
文字セット は JIS X 0208 の区点の表を2面にして、面-区-点の3つの十進数で登録しています。2000年に制定され、2004年、2012年に改正されました。2004年の改訂が大きかったので、多くの場合区別のために 2004 の数字をつけます。
区点の表の一部です。水色の背景の部分が追加されています。
点 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | ... | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
区 | 2022 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 2A | 2B | 2C | 2D | 2E | 2F | ... |
1 | 21 | 、 | 。 | , | . | ・ | : | ; | ? | ! | ゛ | ゜ | ´ | ` | ¨ | ... | |
2 | 22 | ◆ | □ | ■ | △ | ▲ | ▽ | ▼ | ※ | 〒 | → | ← | ↑ | ↓ | 〓 | ' | ... |
3 | 23 | ▷ | ▶ | ◁ | ◀ | ↗ | ↘ | ↖ | ↙ | ⇄ | ⇨ | ⇦ | ⇧ | ⇩ | ⤴ | ⤵ | ... |
4 | 24 | ぁ | あ | ぃ | い | ぅ | う | ぇ | え | ぉ | お | か | が | き | ぎ | く | ... |
5 | 25 | ァ | ア | ィ | イ | ゥ | ウ | ェ | エ | ォ | オ | カ | ガ | キ | ギ | ク | ... |
6 | 26 | Α | Β | Γ | Δ | Ε | Ζ | Η | Θ | Ι | Κ | Λ | Μ | Ν | Ξ | Ο | ... |
7 | 27 | А | Б | В | Г | Д | Е | Ё | Ж | З | И | Й | К | Л | М | Н | ... |
8 | 28 | ─ | │ | ┌ | ┐ | ┘ | └ | ├ | ┬ | ┤ | ┴ | ┼ | ━ | ┃ | ┏ | ┓ | ... |
9 | 29 | € | ¡ | ¤ | ¦ | © | ª | « | | ® | ¯ | ² | ³ | · | ¸ | ... | |
10 | 2A | Ą | ˘ | Ł | Ľ | Ś | Š | Ş | Ť | Ź | Ž | Ż | ą | ˛ | ł | ľ | ... |
11 | 2B | ʔ | ɦ | ʘ | ǂ | ɓ | ɗ | ʄ | ɠ | Ɠ | œ | Œ | ɨ | ʉ | ɘ | ɵ | ... |
12 | 2C | ❶ | ❷ | ❸ | ❹ | ❺ | ❻ | ❼ | ❽ | ❾ | ❿ | ⓫ | ⓬ | ⓭ | ⓮ | ⓯ | ... |
13 | 2D | ① | ② | ③ | ④ | ⑤ | ⑥ | ⑦ | ⑧ | ⑨ | ⑩ | ⑪ | ⑫ | ⑬ | ⑭ | ⑮ | ... |
14 | 2E | 俱 | 𠀋 | 㐂 | 丨 | 丯 | 丰 | 亍 | 仡 | 份 | 仿 | 伃 | 伋 | 你 | 佈 | 佉 | ... |
15 | 2F | 咩 | 哆 | 哿 | 唎 | 唫 | 唵 | 啐 | 啞 | 喁 | 喆 | 喎 | 喝 | 喭 | 嗎 | 嘆 | ... |
16 | 30 | 亜 | 唖 | 娃 | 阿 | 哀 | 愛 | 挨 | 姶 | 逢 | 葵 | 茜 | 穐 | 悪 | 握 | 渥 | ... |
17 | 31 | 院 | 陰 | 隠 | 韻 | 吋 | 右 | 宇 | 烏 | 羽 | 迂 | 雨 | 卯 | 鵜 | 窺 | 丑 | ... |
18 | 32 | 押 | 旺 | 横 | 欧 | 殴 | 王 | 翁 | 襖 | 鴬 | 鴎 | 黄 | 岡 | 沖 | 荻 | 億 | ... |
... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... |
JIS X 0208 の空き領域に追加しました。でも足りなくて第2面を作りました。
これが第1面です。緑と黄色部分が JIS X 0208 からある文字。水色部分が JIS X 0213:2004 で追加された部分です。
第2面です。まだ空きがあります。
使用するときはこれにある計算を施して使います。この場合 面区点に登録された文字全体を文字セット、計算のきまりをエンコーディングといいます。
「あ」と「亜」の一覧に、第2面の「晛」も加えました。エンコーディングの名前は JIS X 0208 と区別するために、-2004 をつけて。ISO-2022-JP-2004、Shift_JIS-2004、EUC-JP-2004 とよばれます。
方式 | 操作 | 「あ」 | 「亜」 | 「晛」 | 第1面第2面の区別方法 |
---|---|---|---|---|---|
面区点 | そのまま | 1-4-2 | 1-16-1 | 2-14-1 | |
区点(16進数) | それぞれ2桁、計4桁に | 0402 | 1001 | 0E01 | 区点だけで計算 |
ISO-2022-JP-2004 | 0x2020を加える | 2422 | 3021 | 2E21 | 1B 24 28 51:で第1面、1B 24 28 50:で第2面、1B 28 42:でASCII |
Shift_JIS-2004 | 複雑なので省略 | 82A0 | 889F | F39F | 第1バイトがF0からFCまでの範囲は第2面 |
EUC-JP-2004 | 0xa0a0を加える | A4A2 | B0A1 | AEA1 | 8Fを前につけて第2面 |
2面まであるので、ISO-2022-JP-2004とEUC-JP-2004では2バイトでは区別できない場合が出てきます。
ISO-2022-JP-2004では、切り替え方式をとります。もともと1B 24 42
のあとは漢字、1B 28 42
のあとはASCIIというように切り替えていたので、この切り替えを3種にすれば、1面、2面、ASCIIの切り替えができます。
EUC-JP-2004では第2面を使うときだけ1文字限りの切り替えを入れます。1文字限りの切り替えは見方をかえれば第2面は3バイトということです。
Shift_JIS-2004ではShift_JISの拡張で全部の文字を2バイトで表すことができます。ただし、0208の時代から広く使われていた Shift_JIS はすでに独自の規格外の拡張をしていました。たとえばWindowsで使われている Windows-31J などです。この独自拡張はShift_JIS-2004の拡張と共存できないので、結局Windowsには採用されていません。Windowsは内部ではユニコードを使っていますので、JIS X 0213 の文字はほとんど全部取り扱うことができます。ワープロなどで保存するときはユニコードですから問題ありません。Shift_JISにして出力すると記録できない文字が出る可能性があります。注意が必要です。
亜の近辺と晛の近辺の一覧。2022(ISO-2022-JP)、SJIS(Shift_JIS)、EUC(EUC-JP)は面-区-点を元に変換しているので区点で隣り合う文字は他のエンコーディングでもほぼ隣り合います。それに対して、Unicode系の UTF-16 と UTF-8 では一般には隣り合いません。
2022欄の 3-は JIS X 0213 の第1面であることを表します。4- は第2面です。
面-区-点 | 2022 | SJIS | EUC | UTF-16 | UTF-8 | 文字 |
---|---|---|---|---|---|---|
1-16-1 | 3-3021 | 889F | B0A1 | 4E9C | E4BA9C | 亜 |
1-16-2 | 3-3022 | 88A0 | B0A2 | 5516 | E59496 | 唖 |
1-16-3 | 3-3023 | 88A1 | B0A3 | 5A03 | E5A883 | 娃 |
1-16-4 | 3-3024 | 88A2 | B0A4 | 963F | E998BF | 阿 |
1-16-5 | 3-3025 | 88A3 | B0A5 | 54C0 | E59380 | 哀 |
1-16-6 | 3-3026 | 88A4 | B0A6 | 611B | E6849B | 愛 |
1-16-7 | 3-3027 | 88A5 | B0A7 | 6328 | E68CA8 | 挨 |
1-16-8 | 3-3028 | 88A6 | B0A8 | 59F6 | E5A7B6 | 姶 |
1-16-9 | 3-3029 | 88A7 | B0A9 | 9022 | E980A2 | 逢 |
1-16-10 | 3-302A | 88A8 | B0AA | 8475 | E891B5 | 葵 |
1-16-11 | 3-302B | 88A9 | B0AB | 831C | E88C9C | 茜 |
1-16-12 | 3-302C | 88AA | B0AC | 7A50 | E7A990 | 穐 |
1-16-13 | 3-302D | 88AB | B0AD | 60AA | E682AA | 悪 |
1-16-14 | 3-302E | 88AC | B0AE | 63E1 | E68FA1 | 握 |
1-16-15 | 3-302F | 88AD | B0AF | 6E25 | E6B8A5 | 渥 |
2-14-1 | 4-2E21 | F39F | 8FAEA1 | 665B | E6999B | 晛 |
2-14-2 | 4-2E22 | F3A0 | 8FAEA2 | 6663 | E699A3 | 晣 |
2-14-3 | 4-2E23 | F3A1 | 8FAEA3 | 231F5 | F0A387B5 | 𣇵 |
2-14-4 | 4-2E24 | F3A2 | 8FAEA4 | 231B6 | F0A386B6 | 𣆶 |
2-14-5 | 4-2E25 | F3A3 | 8FAEA5 | 666A | E699AA | 晪 |
2-14-6 | 4-2E26 | F3A4 | 8FAEA6 | 666B | E699AB | 晫 |
2-14-7 | 4-2E27 | F3A5 | 8FAEA7 | 666C | E699AC | 晬 |
2-14-8 | 4-2E28 | F3A6 | 8FAEA8 | 666D | E699AD | 晭 |