プログラマのための文字コード技術入門
プログラマのための文字コード技術入門 (WEB+DB PRESS plus) (WEB+DB PRESS plusシリーズ)
- 作者: 矢野啓介
- 出版社/メーカー: 技術評論社
- 発売日: 2010/02/18
- メディア: 単行本(ソフトカバー)
- 購入: 34人 クリック: 578回
- この商品を含むブログ (129件) を見る
■第1章 文字とコンピュータ 1.1 コンピュータで文字を扱う基本 1.2 文字を符号化するということ 1.3 文字集合と符号化文字集合 1.4 制御文字 ----文字ではない文字 1.5 文字コードはなぜ複雑になるのか 1.6 まとめ ■第2章 文字コードの変遷 2.1 最もシンプルな文字コード ----ASCII、ISO/IEC 646 2.2 文字コードの構造と拡張方法を定める ----ISO/IEC 2022 2.3 2バイト符号化文字集合の実用化 ----JIS X 0208、各種符号化方式 2.4 1バイト符号化文字集合の広がり ----ISO/IEC 8859、Latin-1 2.5 国際符号化文字集合の模索と成立 ----Unicode、ISO/IEC 10646 2.6 まとめ ■第3章 代表的な符号化文字集合 3.1 ASCIIとISO/IEC 646 ----最も基本的な1バイト文字集合 3.2 JIS X 0201 ----ラテン文字と片仮名の1バイト文字集合 3.3 JIS X 0208 ----日本の最も基本的な2バイト文字集合 3.4 JIS X 0212 ----補助漢字 3.5 JIS X 0213 ----漢字第3・第4水準への拡張 3.6 ISO/IEC 8859シリーズ ----欧米で広く使われる1バイト符号化文字集合 3.7 UnicodeとISO/IEC 10646 ----国際符号化文字集合 ■第4章 代表的な文字符号化方式 4.1 JIS X 0201の符号化方式 4.2 JIS X 0208の符号化方式 4.3 Unicodeの符号化方式 ■第5章 文字コードの変換と判別 5.1 コード変換とは 5.2 変換の実際 ----変換における考え方 5.3 文字コードの自動判別 5.4 まとめ ■第6章 インターネットと文字コード 6.1 電子メールと文字コード 6.2 Webと文字コード 6.3 まとめ ■第7章 プログラミング言語と文字コード 7.1 Java ----内部処理をUnicodeで行う 7.2 Ruby 1.8 ----シンプルな日本語化 7.3 Ruby 1.9 ----CSI方式で多様な文字コードを処理 7.4 まとめ ■第8章 はまりやすい落とし穴とその対処 8.1 トラブル調査の必須工具 ----16進ダンプツール 8.2 文字化け 8.3 改行コード 8.4 「全角・半角」問題 8.5 円記号問題 8.6 波ダッシュ問題 8.7 まとめ ■Appendix A.1 ISO/IEC 2022のもう少しだけ詳しい説明 A.2 JIS X 0213の符号化方式 A.3 諸外国・地域の文字コード概説 A.4 Unicodeの諸問題 A.5 EmacsとSKKによるJIS2004の活用 ----本書執筆の舞台裏 A.6 規格の入手・閲覧方法ならびに参考文献
まぁ、文字コードなんて別に気にしなくてもコードは書けるよね。
と思ってたけど、実はそんなことはない。
文字コード技術の基本的なことは、まぁ、知っておいたほうが便利くらいだろうけど。
第七章以降の記述は、まんま日常のコーディング時に使える知識。
というか「知らないとやらかす」系。
ここだけでも読む価値あり。