プログラマのための文字コード技術入門

プログラマのための文字コード技術入門 (WEB+DB PRESS plus) (WEB+DB PRESS plusシリーズ)

プログラマのための文字コード技術入門 (WEB+DB PRESS plus) (WEB+DB PRESS plusシリーズ)

■第1章 文字とコンピュータ
1.1 コンピュータで文字を扱う基本
1.2 文字を符号化するということ
1.3 文字集合と符号化文字集合
1.4 制御文字 ----文字ではない文字
1.5 文字コードはなぜ複雑になるのか
1.6 まとめ
■第2章 文字コードの変遷
2.1 最もシンプルな文字コード ----ASCII、ISO/IEC 646
2.2 文字コードの構造と拡張方法を定める ----ISO/IEC 2022
2.3 2バイト符号化文字集合の実用化 ----JIS X 0208、各種符号化方式
2.4 1バイト符号化文字集合の広がり ----ISO/IEC 8859、Latin-1
2.5 国際符号化文字集合の模索と成立 ----Unicode、ISO/IEC 10646
2.6 まとめ
■第3章 代表的な符号化文字集合
3.1 ASCIIとISO/IEC 646 ----最も基本的な1バイト文字集合
3.2 JIS X 0201 ----ラテン文字と片仮名の1バイト文字集合
3.3 JIS X 0208 ----日本の最も基本的な2バイト文字集合
3.4 JIS X 0212 ----補助漢字
3.5 JIS X 0213 ----漢字第3・第4水準への拡張
3.6 ISO/IEC 8859シリーズ ----欧米で広く使われる1バイト符号化文字集合
3.7 UnicodeとISO/IEC 10646 ----国際符号化文字集合
■第4章 代表的な文字符号化方式
4.1 JIS X 0201の符号化方式
4.2 JIS X 0208の符号化方式
4.3 Unicodeの符号化方式
■第5章 文字コードの変換と判別
5.1 コード変換とは
5.2 変換の実際 ----変換における考え方
5.3 文字コードの自動判別
5.4 まとめ
■第6章 インターネットと文字コード
6.1 電子メールと文字コード
6.2 Webと文字コード
6.3 まとめ
■第7章 プログラミング言語と文字コード
7.1 Java ----内部処理をUnicodeで行う
7.2 Ruby 1.8 ----シンプルな日本語化
7.3 Ruby 1.9 ----CSI方式で多様な文字コードを処理
7.4 まとめ
■第8章 はまりやすい落とし穴とその対処
8.1 トラブル調査の必須工具 ----16進ダンプツール
8.2 文字化け
8.3 改行コード
8.4 「全角・半角」問題
8.5 円記号問題
8.6 波ダッシュ問題
8.7 まとめ
■Appendix
A.1 ISO/IEC 2022のもう少しだけ詳しい説明
A.2 JIS X 0213の符号化方式
A.3 諸外国・地域の文字コード概説
A.4 Unicodeの諸問題
A.5 EmacsとSKKによるJIS2004の活用 ----本書執筆の舞台裏
A.6 規格の入手・閲覧方法ならびに参考文献

まぁ、文字コードなんて別に気にしなくてもコードは書けるよね。

 と思ってたけど、実はそんなことはない。



 文字コード技術の基本的なことは、まぁ、知っておいたほうが便利くらいだろうけど。


 第七章以降の記述は、まんま日常のコーディング時に使える知識。


 というか「知らないとやらかす」系。


 ここだけでも読む価値あり。