ホーム > ウェブ関連の用語 > 文字コードってなんでしょうか?

文字コードってなんでしょうか?

東京都 KTさん

コンピューターは文字の情報を最終的に二進数に置き換えます。その置き換える際の変換表が文字コードです。よく使われる文字コードにShift_JIS、EUC、Unicode(UTF-8)が挙げられます。Windowsの方ですと、 Shift_JISしか使わない方いるかもしれません。

いくつか文字コードが存在していますが、基になったものがあります。
ASCII(アスキー)という文字コードです。American Standard Information Interchangeの略称です。Information Interchangeから分かるように、異なるコンピューター間でも文書が交換できるために生まれた規格でした。

アルファベット、数字、タブ、改行、スペース、記号などを全で数字で表すことができます。例えば、「A」ですと「41」という16進数で表せます。ASCIIは最終的には7桁の2進数で表すことができます。127通りの文字を表わすことができます。

こういった変換表を「標準規格」にして、情報の交換ができるようにしましょう~というのが文字コードの本質です。文字コードの理解はASCIIを理解することに尽きます。

ASCIIの欠点は、127通りなので、アルファベットと数字と記号しか扱えません。そこで、8ビットに拡張して扱える文字数を増やしたのがJISX0201です。

さらに、16ビット(2バイト)を使って漢字を表わすことができたのがJISコードです。
その後、マイクロソフト社がJISコードを改良したShift_JISコードを開発しました。これが現在でも使われています。

言語ごとに文字コードがばらばらに存在しています。いま、文字コードを統一して、どんな言語でも共通の文字コードに統一しようという考え方があります。これが、Unicodeです。UTF-8形式がよく使われています。今後は、UTF-8が主流になるでしょう。

FlashMXでUTF-8が標準の文字コードになったのも、この傾向を先取りしていました。
EUCは、ユニックス系のOSでよく使われています。

2006年03月27日

ホーム > ウェブ関連の用語 > 文字コードってなんでしょうか?

ウェブ関連の用語トラックバック(0)


このエントリーのトラックバックURL

http://www.webdesignworkshop.net/mt/mt-tb.cgi/27


このエントリーへのトラックバック

このエントリーにはトラックバックはありません。