文字コードを調べる

Linux上でエディタに gedit を使い、簡単な内容のテキストファイルを保存し、文字コードを調べます。

今回は簡単のため日本語入力をオフにして行います。Linux上のエディタは UTF-8 という文字コードで保存しますが、この文字コードは英数字の 部分が ASCII と共通です。これで ASCII(正確にはISO-8859-1)の文字コードを確認します。

ファイル作成と保存

調べたい文字列を入力して「保存」をします。

たとえば

HOGE HUGA

これをユーザーホームに ctest01.txt (適当な名前でよい)という名前で保存します。

Hexエディタで調べる

[アプリケーション]-[プログラミング]-[HEXエディタ]を起動します。

GHexというタイトルのウィンドウが開いた

[ファイル]から[開く]と進み、先程保存したファイルを選択します

ファイルから開くを選ぶ

左側に16進数の文字コード、右側に元の文字が表示されます。

48 4F 47 45 20 48 55 47 41 0A | HOGE HUGA

途中にある 20 はスペース(空白)です。スペースも文字コードを持っています。

最後にある 0A は改行です。geditでは1行だけのファイルでも必ず最後に改行を入れてしまいます。

Windows環境で作ったファイルの改行は 0D0A 、Mac環境で作ったファイルの改行は 0D になります。

GHexが使えないときは、hd (HexDump) が使えます。