文字コード

昔の文字コード
ASCII (American Standard Code for Information Interchange)
 * 7bitコード
 * アメリカ用

ISO/IEC 646
 * 7bitコード
 * ASCIIの特定文字を各国用にチューニング => 複数の国の文字を混在することは不可能になった
 * これの日本語版がJIS X 0201

ISO/IEC 2022
 * 8bitコード
 * エスケープシーケンスで文字集合を切り替え => 複数の国の文字を混在できる

ISO/IEC 8859
 * 8bit 1byteコード
 * ISO/IEC 2022に則って、ヨーロッパ内のまとまった地域を一つの文字集合で扱う. これによりエスケープシーケンスによる切り替えが少なくなる.
 * よく使われるのはISO-8859-1.これは Latin-1 とも呼ばれる.

Unicode

 * ISO/IEC 10646 : 4bytes => UCS-4
 * Unicode      : 2bytes => UCS-2