日本語エンコーディング各種まとめその3
今度はデコードにおいてどの文字種をサポートしているかという表。まとめ切れてない。
文字種 | Shift_JIS | ISO-2022 -JP | x-euc-jp -linux | EUC-JP | eucJP -Open | windows -31j | x-windows -iso2022jp | CP50220 |
NEC特殊記号 | 未定義 | 未定義 | 未定義 | 未定義 | ○ | ○ | ○ | ○ 一部未定義 |
NEC選定文字 | 未定義 | 未定義 | 未定義 | 未定義 | 集約 | 集約 | ○ | 未定義 |
IBM拡張文字 | 未定義 | ------ | ------ | ------ | ------ | ○ | ------ | ------ |
JISX0212 | 未定義 | 未定義 | 未定義 | ○ | ○ | 未定義 | 未定義 | ○ |
外字 | 未定義 | 未定義 | 未定義 | 未定義 | 未定義 | ○ 1880文字 | 未定義 | ○ 940文字 |
未定義文字 | ? | ? | ? | ? | ? | ? | ? | ? |
- NEC特殊記号というのはNEC特殊文字のうち、NEC選定IBM拡張文字を除いたもの
- NEC選定文字はNEC選定IBM拡張文字のこと
- 未定義文字とは、未定義の文字に仮に割り当てる文字
- 「------」になっているのはコード仕様上使えないもの
- CP50220のNEC特殊文字で、JISX0208と重複しているものは未定義となっている
疲れたぁ。