数値に文字を対応させてコンピュータに文字を扱えるようにしました。この文字に対応させた数値を文字コードといいます。
例えば...
文字コード | 1 | 2 | 3 | 4 | 5 | .... |
---|---|---|---|---|---|---|
文字 | A | B | C | D | E | .... |
どの数値にどの文字を割り当てるかを取り決めておく必要がありますが、残念ながらいくつかのやり方があって完全には統一されていません。
また、文字がいくつあるかによって、何ビット必要になるかが決まります。
7ビットで 27=128 個の文字を表現できます。(英語のアルファベットは26文字しかないのでこれで十分でした)
A は 100 0001 または 41 , B は 100 0010 または 42 です。
m は 110 1101 または 6D です。
2進数上位 | 000 | 001 | 010 | 011 | 100 | 101 | 110 | 111 | |
---|---|---|---|---|---|---|---|---|---|
2進数下位 | 16進1桁目→ ↓16進2桁目 |
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
0000 | 0 | NUL | DLE | SP | 0 | @ | P | ` | p |
0001 | 1 | SOH | DC1 | ! | 1 | A | Q | a | q |
0010 | 2 | STX | DC2 | " | 2 | B | R | b | r |
0011 | 3 | ETX | DC3 | # | 3 | C | S | c | s |
0100 | 4 | EOT | DC4 | $ | 4 | D | T | d | t |
0101 | 5 | ENQ | NAK | % | 5 | E | U | e | u |
0110 | 6 | ACK | SYN | & | 6 | F | V | f | v |
0111 | 7 | BEL | ETB | ' | 7 | G | W | g | w |
1000 | 8 | BS | CAN | ( | 8 | H | X | h | x |
1001 | 9 | HT | EM | ) | 9 | I | Y | i | y |
1010 | A | LF | SUB | * | : | J | Z | j | z |
1011 | B | VT | ESC | + | ; | K | [ | k | { |
1100 | C | FF | FS | , | < | L | \ | l | | |
1101 | D | CR | GS | - | = | M | ] | m | } |
1110 | E | SO | RS | . | > | N | ^ | n | ~ |
1111 | F | SI | US | / | ? | O | _ | o | DEL |
例えば...
文字コード | 49 | 6E | 66 | 6F | 72 | 6D | 61 | 74 | 69 | 6F | 6E |
---|---|---|---|---|---|---|---|---|---|---|---|
文字 | I | n | f | o | r | m | a | t | i | o | n |
ほとんどの文字コードは16進数で表します。8ビットまでは16進2ケタで表すことができます。
フランス語ではこんな文字が必要です。
è é ê ë ï ç œ æ
ドイツ語ではこんな文字が必要です。
ä ö ü ß
スペイン語ではこんな文字が必要です。
ñ ¿ ¡
英語以外の言語の文字を加えるために8ビットにしました。8ビットで 28=256 個の文字を表現できます。
やはり、41がA, 6Dがmと読む。左半分はASCIIと同じ。
e8 は è
2進数上位 | 0000 | 0001 | 0010 | 0011 | 0100 | 0101 | 0110 | 0111 | 1000 | 1001 | 1010 | 1011 | 1100 | 1101 | 1110 | 1111 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2進数下位 | 16進1桁目→ ↓16進2桁目 |
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | a | b | c | d | e | f |
0000 | 0 | 0 | @ | P | ` | p | ° | À | Ð | à | ð | ||||||
0001 | 1 | ! | 1 | A | Q | a | q | ¡ | ± | Á | Ñ | á | ñ | ||||
0010 | 2 | " | 2 | B | R | b | r | ¢ | ² | Â | Ò | â | ò | ||||
0011 | 3 | # | 3 | C | S | c | s | £ | ³ | Ã | Ó | ã | ó | ||||
0100 | 4 | $ | 4 | D | T | d | t | ¤ | ´ | Ä | Ô | ä | ô | ||||
0101 | 5 | % | 5 | E | U | e | u | ¥ | µ | Å | Õ | å | õ | ||||
0110 | 6 | & | 6 | F | V | f | v | ¦ | ¶ | Æ | Ö | æ | ö | ||||
0111 | 7 | ' | 7 | G | W | g | w | § | · | Ç | × | ç | ÷ | ||||
1000 | 8 | ( | 8 | H | X | h | x | ¨ | ¸ | È | Ø | è | ø | ||||
1001 | 9 | ) | 9 | I | Y | i | y | © | ¹ | É | Ù | é | ù | ||||
1010 | a | * | : | J | Z | j | z | ª | º | Ê | Ú | ê | ú | ||||
1011 | b | + | ; | K | [ | k | { | « | » | Ë | Û | ë | û | ||||
1100 | c | , | < | L | \ | l | | | ¬ | ¼ | Ì | Ü | ì | ü | ||||
1101 | d | - | = | M | ] | m | } | | ½ | Í | Ý | í | ý | ||||
1110 | e | . | > | N | ^ | n | ~ | ® | ¾ | Î | Þ | î | þ | ||||
1111 | f | / | ? | O | _ | o | del | ¯ | ¿ | Ï | ß | ï | ÿ |
1バイトで済んでいた時代の文字コードでもいろいろ変遷があります。
文字コード | 説明 | ビット数 |
---|---|---|
ASCII ↓ | アメリカ合衆国の文字コード American Standard Code for Information Interchange |
7ビット |
ISO/IEC 646 ↓ | 国際標準化機構の文字コード ASCIIを元にした国際規格 | 7ビット |
ISO/IEC 8859 ↓ | 国際標準化機構の文字コード ASCIIを8ビットに拡張した | 8ビット |
JIS X 0201 ↓ | 日本の文字コード。ISO/IEC 646 を元に半角カナを追加 | 7ビット/8ビット |
8ビットでも不足で世界はユニコードで統一に向かいます。それでもASCII部分はほとんど共通ですからそこを眺めてください。
ここでは次のことを理解・把握してください。
ISO/IEC 646 に基づき ¥ と ¯ を変更し、半角カナを加えたものです。ここには8ビットコードを書きましたが、7ビットで切り替えて使うものも定義されています。e列f列の「未」は未定義の部分です。8列9列は7ビットでは0列1列の制御コードと重なるので空けています。
濁点、半濁点は別になっていますので「ガ」は「カ」「゛」と2バイトで表現されます。
この半角カナは現在では漢字を含む文字コードの全角カナを使うのが望ましいとされています。
1桁目→ ↓2桁目 |
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | a | b | c | d | e | f |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 0 | @ | P | ` | p | ー | タ | ミ | 未 | 未 | ||||||
1 | ! | 1 | A | Q | a | q | 。 | ア | チ | ム | 未 | 未 | ||||
2 | " | 2 | B | R | b | r | 「 | イ | ツ | メ | 未 | 未 | ||||
3 | # | 3 | C | S | c | s | 」 | ウ | テ | モ | 未 | 未 | ||||
4 | $ | 4 | D | T | d | t | 、 | エ | ト | ヤ | 未 | 未 | ||||
5 | % | 5 | E | U | e | u | ・ | オ | ナ | ユ | 未 | 未 | ||||
6 | & | 6 | F | V | f | v | ヲ | カ | ニ | ヨ | 未 | 未 | ||||
7 | ' | 7 | G | W | g | w | ァ | キ | ヌ | ラ | 未 | 未 | ||||
8 | ( | 8 | H | X | h | x | ィ | ク | ネ | リ | 未 | 未 | ||||
9 | ) | 9 | I | Y | i | y | ゥ | ケ | ノ | ル | 未 | 未 | ||||
a | * | : | J | Z | j | z | ェ | コ | ハ | レ | 未 | 未 | ||||
b | + | ; | K | [ | k | { | ォ | サ | ヒ | ロ | 未 | 未 | ||||
c | , | < | L | ¥ | l | | | ャ | シ | フ | ワ | 未 | 未 | ||||
d | - | = | M | ] | m | } | ュ | ス | ヘ | ン | 未 | 未 | ||||
e | . | > | N | ^ | n | ¯ | ョ | セ | ホ | ゙ | 未 | 未 | ||||
f | / | ? | O | _ | o | del | ッ | ソ | マ | ゚ | 未 | 未 |
国際標準化機構(こくさいひょうじゅんかきこう、International Organization for Standardization)、または略称 ISO(アイソ、アイエスオー、イソ)は、電気分野を除く工業分野の国際的な標準である国際規格を策定するための民間の非政府組織。本部はスイスのジュネーヴ。スイス民法による非営利法人。公用語はフランス語、英語、ロシア語。各国1機関が参加できる。(出典: フリー百科事典『ウィキペディア(Wikipedia)』)
英語:International Organization For Standardization
仏語:L'Organisation internationale de normalisation (OIN)
露語:Международная организация по стандартизации
国際標準化機構という名称を略称で表そうとしたとき、言語によって異なる略称になってしまう(英語ではIOS、フランス語ではOINなど)。そこでギリシア語のisos(均等、均質)にちなみ、言語や地域によらない短縮名としてISOが選ばれた。
国際電気標準会議(こくさいでんきひょうじゅんかいぎ、International Electrotechnical Commission、IEC)
電気工学、電子工学、および関連した技術を扱う国際的な標準化団体