1バイトコード

1バイトコードの歴史

どの数値にどの文字を割り当てるかを取り決めておく必要がありますがやり方は1つではありません。

1バイトで済んでいた時代の文字コードでもいろいろ変遷があります。

文字コード	説明	ビット数
ASCII ↓	アメリカ合衆国の文字コード	7ビット
ISO/IEC 646 ↓	国際標準化機構の文字コード ASCIIを元にした国際規格	7ビット
ISO/IEC 8859 ↓	国際標準化機構の文字コード ASCIIを8ビットに拡張した	8ビット
JIS X 0201 ↓	日本の文字コード。ISO/IEC 646 を元に半角カナを追加	7ビット/8ビット

8ビットでも不足で世界はユニコードで統一に向かいます。それでもASCII部分はほとんど共通ですからそこを眺めてください。

ASCIIコード ▲

American Standard Code for Information Interchange の頭文字から作った名前でアスキーと読みます。もともとテレタイプで使っていたものを流用した７ビットコードで、残りの１ビットはチェックのために使っていました。

0x00から0x7fまでの128のコードのうち、0x00から0x1fまでは制御コードで普通の文字ではありません。改行や紙送り、バックスペース（一文字削除）、ベルを鳴らす、拡張文字の開始など機器を制御する信号に割り当てられています。

一般の文字は0x20から0x7eまでの95文字で、記号、数字、英字(大文字と小文字)からなっています。0x7fは歴史的理由により削除の意味の制御コードでです。

この文字コードから JISX0201 や ISO-8859-1 などいろいろな文字コードが作られましたが、どれも ASCII と呼んでしまうほどよく知られています。

US-ASCIIコード表

41 が A, 6D が m と読みます。

1桁目→ ↓2桁目	0	1	2	3	4	5	6	7
0	NUL	DLE	SP	0	@	P	`	p
1	SOH	DC1	!	1	A	Q	a	q
2	STX	DC2	"	2	B	R	b	r
3	ETX	DC3	#	3	C	S	c	s
4	EOT	DC4	$	4	D	T	d	t
5	ENQ	NAK	%	5	E	U	e	u
6	ACK	SYN	&	6	F	V	f	v
7	BEL	ETB	'	7	G	W	g	w
8	BS	CAN	(	8	H	X	h	x
9	HT	EM	)	9	I	Y	i	y
A	LF	SUB	*	:	J	Z	j	z
B	VT	ESC	+	;	K	[	k	{
C	FF	FS	,	<	L	\	l	\|
D	CR	GS	-	=	M	]	m	}
E	SO	RS	.	>	N	^	n	~
F	SI	US	/	?	O	_	o	DEL

ISO/IEC 646 ▲

アメリカ合衆国の規格であるASCIIを元にISO(国際標準化機構)とIEC(国際電気標準会議)が策定した7ビットコードをいいます。JISが基づいているのはこちらなのですが、ASCIIの知名度が高くこちらは知られていません。

英語ではASCIIのアルファベットで全部の文字が表現できますが、フランス語のアクサンやセデーユのついた文字、ドイツ語のウムラウトのついた文字やエスツェット、さらに各国の通貨記号などこれだけでは不足です。そこで ISO/IEC 646 では、0x23, 0x24, 0x5b～0x5e, 0x67b～0x7e は各国それぞれに必要な文字と入れ替えることができると決められました。日本では0x5cを￥に、0x7fを¯に割り当ててJIS規格としました。

なお、この国際基準版はASCIIと完全一致するよう1991年に変更されました。

ISO/IEC 8859 ▲

ISOとIECが合同で定めた、8ビット文字コードです。8ビットにした分、いろいろな文字を追加することができます。ただし、0x80から0x9fの間も制御コードとして文字を配置していません。

結局8ビットにしても各国の文字をすべて入れるのには足りず、いくつかのパートに分けられました。混合して使用する言語の組み合わせを考えて決めており複数ののパートに登録されている文字もあります。

英語、ドイツ語、イタリア語など日本人がよく目にする文字はISO-8859-1かその改訂版のISO-8859-15を使うことで網羅されます。

ISO-8859-1 西欧諸語(Latin-1)
ISO-8859-2 東欧諸語(Latin-2)
ISO-8859-3 エスペラント語など(Latin-3)
ISO-8859-4 北欧諸語(Latin-4)(古い仕様)
ISO-8859-5 ロシア語(キリル文字)
ISO-8859-6 アラビア語(アラビア文字)
ISO-8859-7 ギリシャ語(ギリシア文字)
ISO-8859-8 ヘブライ語(ヘブライ文字)
ISO-8859-9 トルコ語など(Latin-5)
ISO-8859-10 北欧語など(ラテン4を再配列)(Latin-6)
ISO-8859-15(Latin-9) 西欧言語 ISO-8859-1(Latin-1)の後継
ISO-8859-16(Latin-10) 東欧言語 ISO-8859-2(Latin-2)の後継

ISO-8859-1

やはり、41がA, 6Dがmと読む。左半分はASCIIと同じ。

1桁目→ ↓2桁目	2	3	4	5	6	7	a	b	c	d	e	f
0		0	@	P	`	p		°	À	Ð	à	ð
1	!	1	A	Q	a	q	¡	±	Á	Ñ	á	ñ
2	"	2	B	R	b	r	¢	²	Â	Ò	â	ò
3	#	3	C	S	c	s	£	³	Ã	Ó	ã	ó
4	$	4	D	T	d	t	¤	´	Ä	Ô	ä	ô
5	%	5	E	U	e	u	¥	µ	Å	Õ	å	õ
6	&	6	F	V	f	v	¦	¶	Æ	Ö	æ	ö
7	'	7	G	W	g	w	§	·	Ç	×	ç	÷
8	(	8	H	X	h	x	¨	¸	È	Ø	è	ø
9	)	9	I	Y	i	y	©	¹	É	Ù	é	ù
a	*	:	J	Z	j	z	ª	º	Ê	Ú	ê	ú
b	+	;	K	[	k	{	«	»	Ë	Û	ë	û
c	,	<	L	\	l	\|	¬	¼	Ì	Ü	ì	ü
d	-	=	M	]	m	}		½	Í	Ý	í	ý
e	.	>	N	^	n	~	®	¾	Î	Þ	î	þ
f	/	?	O	_	o	del	¯	¿	Ï	ß	ï	ÿ

当然ながら１バイトで表現できない漢字をもつ中国、日本などの文字は規格になっていません。

しかし、１バイトで表現できる文字に限っても１バイトで全部を網羅できずにパートの切りかえの仕組みが必要になります。

この後、複数バイトを使い世界中の文字を切りかえ無しで表現するunicodeの策定が始まり、ISO/IEC 8859 の作業はここでとまっています。

ただ unicode を必要としない西洋のウェブページでは文字コードを指定する時には多くの場合 ASCII ではなく、ISO-8859-1かその改訂版のISO-8859-15を使っています。

ISO-8859-1とISO-8859-15の違い

大したことではない。一番大きいのはユーロの通貨記号です。

ISO-8859-1

ISO-8859-15

JIS X 0201 ▲

ISO/IEC 646 に基づき ¥ と ¯ を変更し、半角カナを加えたものです。ここには8ビットコードを書きましたが、7ビットで切り替えて使うものも定義されています。e列f列の「未」は未定義の部分です。8列9列は7ビットでは0列1列の制御コードと重なるので空けています。

濁点、半濁点は別になっていますので「ガ」は「カ」「゛」と２バイトで表現されます。

この半角カナは現在では漢字を含む文字コードの全角カナを使うのが望ましいとされています。

1桁目→ ↓2桁目	2	3	4	5	6	7	a	b	c	d	e	f
0		0	@	P	`	p		ｰ	ﾀ	ﾐ	未	未
1	!	1	A	Q	a	q	｡	ｱ	ﾁ	ﾑ	未	未
2	"	2	B	R	b	r	｢	ｲ	ﾂ	ﾒ	未	未
3	#	3	C	S	c	s	｣	ｳ	ﾃ	ﾓ	未	未
4	$	4	D	T	d	t	､	ｴ	ﾄ	ﾔ	未	未
5	%	5	E	U	e	u	･	ｵ	ﾅ	ﾕ	未	未
6	&	6	F	V	f	v	ｦ	ｶ	ﾆ	ﾖ	未	未
7	'	7	G	W	g	w	ｧ	ｷ	ﾇ	ﾗ	未	未
8	(	8	H	X	h	x	ｨ	ｸ	ﾈ	ﾘ	未	未
9	)	9	I	Y	i	y	ｩ	ｹ	ﾉ	ﾙ	未	未
a	*	:	J	Z	j	z	ｪ	ｺ	ﾊ	ﾚ	未	未
b	+	;	K	[	k	{	ｫ	ｻ	ﾋ	ﾛ	未	未
c	,	<	L	¥	l	\|	ｬ	ｼ	ﾌ	ﾜ	未	未
d	-	=	M	]	m	}	ｭ	ｽ	ﾍ	ﾝ	未	未
e	.	>	N	^	n	¯	ｮ	ｾ	ﾎ	ﾞ	未	未
f	/	?	O	_	o	del	ｯ	ｿ	ﾏ	ﾟ	未	未

1桁目→ ↓2桁目	0	1	2	3	4	5	6	7
0	NUL	DLE	SP	0	@	P	`	p
1	SOH	DC1	!	1	A	Q	a	q
2	STX	DC2	"	2	B	R	b	r
3	ETX	DC3	#	3	C	S	c	s
4	EOT	DC4	$	4	D	T	d	t
5	ENQ	NAK	%	5	E	U	e	u
6	ACK	SYN	&	6	F	V	f	v
7	BEL	ETB	'	7	G	W	g	w
8	BS	CAN	(	8	H	X	h	x
9	HT	EM	)	9	I	Y	i	y
A	LF	SUB	*	:	J	Z	j	z
B	VT	ESC	+	;	K	[	k	{
C	FF	FS	,	<	L	\	l	\|
D	CR	GS	-	=	M	]	m	}
E	SO	RS	.	>	N	^	n	~
F	SI	US	/	?	O	_	o	DEL

1桁目→ ↓2桁目	2	3	4	5	6	7	a	b	c	d	e	f
0		0	@	P	`	p		°	À	Ð	à	ð
1	!	1	A	Q	a	q	¡	±	Á	Ñ	á	ñ
2	"	2	B	R	b	r	¢	²	Â	Ò	â	ò
3	#	3	C	S	c	s	£	³	Ã	Ó	ã	ó
4	$	4	D	T	d	t	¤	´	Ä	Ô	ä	ô
5	%	5	E	U	e	u	¥	µ	Å	Õ	å	õ
6	&	6	F	V	f	v	¦	¶	Æ	Ö	æ	ö
7	'	7	G	W	g	w	§	·	Ç	×	ç	÷
8	(	8	H	X	h	x	¨	¸	È	Ø	è	ø
9	)	9	I	Y	i	y	©	¹	É	Ù	é	ù
a	*	:	J	Z	j	z	ª	º	Ê	Ú	ê	ú
b	+	;	K	[	k	{	«	»	Ë	Û	ë	û
c	,	<	L	\	l	\|	¬	¼	Ì	Ü	ì	ü
d	-	=	M	]	m	}		½	Í	Ý	í	ý
e	.	>	N	^	n	~	®	¾	Î	Þ	î	þ
f	/	?	O	_	o	del	¯	¿	Ï	ß	ï	ÿ

1桁目→ ↓2桁目	2	3	4	5	6	7	a	b	c	d	e	f
0		0	@	P	`	p		ｰ	ﾀ	ﾐ	未	未
1	!	1	A	Q	a	q	｡	ｱ	ﾁ	ﾑ	未	未
2	"	2	B	R	b	r	｢	ｲ	ﾂ	ﾒ	未	未
3	#	3	C	S	c	s	｣	ｳ	ﾃ	ﾓ	未	未
4	$	4	D	T	d	t	､	ｴ	ﾄ	ﾔ	未	未
5	%	5	E	U	e	u	･	ｵ	ﾅ	ﾕ	未	未
6	&	6	F	V	f	v	ｦ	ｶ	ﾆ	ﾖ	未	未
7	'	7	G	W	g	w	ｧ	ｷ	ﾇ	ﾗ	未	未
8	(	8	H	X	h	x	ｨ	ｸ	ﾈ	ﾘ	未	未
9	)	9	I	Y	i	y	ｩ	ｹ	ﾉ	ﾙ	未	未
a	*	:	J	Z	j	z	ｪ	ｺ	ﾊ	ﾚ	未	未
b	+	;	K	[	k	{	ｫ	ｻ	ﾋ	ﾛ	未	未
c	,	<	L	¥	l	\|	ｬ	ｼ	ﾌ	ﾜ	未	未
d	-	=	M	]	m	}	ｭ	ｽ	ﾍ	ﾝ	未	未
e	.	>	N	^	n	¯	ｮ	ｾ	ﾎ	ﾞ	未	未
f	/	?	O	_	o	del	ｯ	ｿ	ﾏ	ﾟ	未	未

1桁目→ ↓2桁目	0	1	2	3	4	5	6	7
0	NUL	DLE	SP	0	@	P	`	p
1	SOH	DC1	!	1	A	Q	a	q
2	STX	DC2	"	2	B	R	b	r
3	ETX	DC3	#	3	C	S	c	s
4	EOT	DC4	$	4	D	T	d	t
5	ENQ	NAK	%	5	E	U	e	u
6	ACK	SYN	&	6	F	V	f	v
7	BEL	ETB	'	7	G	W	g	w
8	BS	CAN	(	8	H	X	h	x
9	HT	EM	)	9	I	Y	i	y
A	LF	SUB	*	:	J	Z	j	z
B	VT	ESC	+	;	K	[	k	{
C	FF	FS	,	<	L	\	l	\|
D	CR	GS	-	=	M	]	m	}
E	SO	RS	.	>	N	^	n	~
F	SI	US	/	?	O	_	o	DEL

1桁目→ ↓2桁目	2	3	4	5	6	7	a	b	c	d	e	f
0		0	@	P	`	p		°	À	Ð	à	ð
1	!	1	A	Q	a	q	¡	±	Á	Ñ	á	ñ
2	"	2	B	R	b	r	¢	²	Â	Ò	â	ò
3	#	3	C	S	c	s	£	³	Ã	Ó	ã	ó
4	$	4	D	T	d	t	¤	´	Ä	Ô	ä	ô
5	%	5	E	U	e	u	¥	µ	Å	Õ	å	õ
6	&	6	F	V	f	v	¦	¶	Æ	Ö	æ	ö
7	'	7	G	W	g	w	§	·	Ç	×	ç	÷
8	(	8	H	X	h	x	¨	¸	È	Ø	è	ø
9	)	9	I	Y	i	y	©	¹	É	Ù	é	ù
a	*	:	J	Z	j	z	ª	º	Ê	Ú	ê	ú
b	+	;	K	[	k	{	«	»	Ë	Û	ë	û
c	,	<	L	\	l	\|	¬	¼	Ì	Ü	ì	ü
d	-	=	M	]	m	}		½	Í	Ý	í	ý
e	.	>	N	^	n	~	®	¾	Î	Þ	î	þ
f	/	?	O	_	o	del	¯	¿	Ï	ß	ï	ÿ

1桁目→ ↓2桁目	2	3	4	5	6	7	a	b	c	d	e	f
0		0	@	P	`	p		ｰ	ﾀ	ﾐ	未	未
1	!	1	A	Q	a	q	｡	ｱ	ﾁ	ﾑ	未	未
2	"	2	B	R	b	r	｢	ｲ	ﾂ	ﾒ	未	未
3	#	3	C	S	c	s	｣	ｳ	ﾃ	ﾓ	未	未
4	$	4	D	T	d	t	､	ｴ	ﾄ	ﾔ	未	未
5	%	5	E	U	e	u	･	ｵ	ﾅ	ﾕ	未	未
6	&	6	F	V	f	v	ｦ	ｶ	ﾆ	ﾖ	未	未
7	'	7	G	W	g	w	ｧ	ｷ	ﾇ	ﾗ	未	未
8	(	8	H	X	h	x	ｨ	ｸ	ﾈ	ﾘ	未	未
9	)	9	I	Y	i	y	ｩ	ｹ	ﾉ	ﾙ	未	未
a	*	:	J	Z	j	z	ｪ	ｺ	ﾊ	ﾚ	未	未
b	+	;	K	[	k	{	ｫ	ｻ	ﾋ	ﾛ	未	未
c	,	<	L	¥	l	\|	ｬ	ｼ	ﾌ	ﾜ	未	未
d	-	=	M	]	m	}	ｭ	ｽ	ﾍ	ﾝ	未	未
e	.	>	N	^	n	¯	ｮ	ｾ	ﾎ	ﾞ	未	未
f	/	?	O	_	o	del	ｯ	ｿ	ﾏ	ﾟ	未	未

1桁目→ ↓2桁目	0	1	2	3	4	5	6	7
0	NUL	DLE	SP	0	@	P	`	p
1	SOH	DC1	!	1	A	Q	a	q
2	STX	DC2	"	2	B	R	b	r
3	ETX	DC3	#	3	C	S	c	s
4	EOT	DC4	$	4	D	T	d	t
5	ENQ	NAK	%	5	E	U	e	u
6	ACK	SYN	&	6	F	V	f	v
7	BEL	ETB	'	7	G	W	g	w
8	BS	CAN	(	8	H	X	h	x
9	HT	EM	)	9	I	Y	i	y
A	LF	SUB	*	:	J	Z	j	z
B	VT	ESC	+	;	K	[	k	{
C	FF	FS	,	<	L	\	l	\|
D	CR	GS	-	=	M	]	m	}
E	SO	RS	.	>	N	^	n	~
F	SI	US	/	?	O	_	o	DEL

1桁目→ ↓2桁目	2	3	4	5	6	7	a	b	c	d	e	f
0		0	@	P	`	p		°	À	Ð	à	ð
1	!	1	A	Q	a	q	¡	±	Á	Ñ	á	ñ
2	"	2	B	R	b	r	¢	²	Â	Ò	â	ò
3	#	3	C	S	c	s	£	³	Ã	Ó	ã	ó
4	$	4	D	T	d	t	¤	´	Ä	Ô	ä	ô
5	%	5	E	U	e	u	¥	µ	Å	Õ	å	õ
6	&	6	F	V	f	v	¦	¶	Æ	Ö	æ	ö
7	'	7	G	W	g	w	§	·	Ç	×	ç	÷
8	(	8	H	X	h	x	¨	¸	È	Ø	è	ø
9	)	9	I	Y	i	y	©	¹	É	Ù	é	ù
a	*	:	J	Z	j	z	ª	º	Ê	Ú	ê	ú
b	+	;	K	[	k	{	«	»	Ë	Û	ë	û
c	,	<	L	\	l	\|	¬	¼	Ì	Ü	ì	ü
d	-	=	M	]	m	}		½	Í	Ý	í	ý
e	.	>	N	^	n	~	®	¾	Î	Þ	î	þ
f	/	?	O	_	o	del	¯	¿	Ï	ß	ï	ÿ

1桁目→ ↓2桁目	2	3	4	5	6	7	a	b	c	d	e	f
0		0	@	P	`	p		ｰ	ﾀ	ﾐ	未	未
1	!	1	A	Q	a	q	｡	ｱ	ﾁ	ﾑ	未	未
2	"	2	B	R	b	r	｢	ｲ	ﾂ	ﾒ	未	未
3	#	3	C	S	c	s	｣	ｳ	ﾃ	ﾓ	未	未
4	$	4	D	T	d	t	､	ｴ	ﾄ	ﾔ	未	未
5	%	5	E	U	e	u	･	ｵ	ﾅ	ﾕ	未	未
6	&	6	F	V	f	v	ｦ	ｶ	ﾆ	ﾖ	未	未
7	'	7	G	W	g	w	ｧ	ｷ	ﾇ	ﾗ	未	未
8	(	8	H	X	h	x	ｨ	ｸ	ﾈ	ﾘ	未	未
9	)	9	I	Y	i	y	ｩ	ｹ	ﾉ	ﾙ	未	未
a	*	:	J	Z	j	z	ｪ	ｺ	ﾊ	ﾚ	未	未
b	+	;	K	[	k	{	ｫ	ｻ	ﾋ	ﾛ	未	未
c	,	<	L	¥	l	\|	ｬ	ｼ	ﾌ	ﾜ	未	未
d	-	=	M	]	m	}	ｭ	ｽ	ﾍ	ﾝ	未	未
e	.	>	N	^	n	¯	ｮ	ｾ	ﾎ	ﾞ	未	未
f	/	?	O	_	o	del	ｯ	ｿ	ﾏ	ﾟ	未	未