日本語エンコーディング各種まとめその3

今度はデコードにおいてどの文字種をサポートしているかという表。まとめ切れてない。


文字種
 
Shift_JISISO-2022
-JP
x-euc-jp
-linux
EUC-JPeucJP
-Open
windows
-31j
x-windows
-iso2022jp
CP50220
NEC特殊記号未定義未定義未定義未定義
一部未定義
NEC選定文字未定義未定義未定義未定義集約集約未定義
IBM拡張文字未定義------------------------------------
JISX0212未定義未定義未定義未定義未定義
外字未定義未定義未定義未定義未定義
1880文字
未定義
940文字
未定義文字?????

  • NEC特殊記号というのはNEC特殊文字のうち、NEC選定IBM拡張文字を除いたもの
  • NEC選定文字はNEC選定IBM拡張文字のこと
  • 未定義文字とは、未定義の文字に仮に割り当てる文字
  • 「------」になっているのはコード仕様上使えないもの
  • CP50220のNEC特殊文字で、JISX0208と重複しているものは未定義となっている

疲れたぁ。