Arcen's Blog

アクセスカウンタ

zoom RSS Unicode 6.0.0

<<   作成日時 : 2011/03/24 11:05   >>

ブログ気持玉 0 / トラックバック 0 / コメント 0

文字コードのUnicodeがバージョンアップしていた
http://unicode.org/versions/Unicode6.0.0/

携帯絵文字が追加。IVSのようなシステムに影響ある追加はなかったか確認が必要。
日本語環境ではShift_JISの呪縛からは逃れられないので、注意点も書いておく。

マッピング関連は http://www.unicode.org/Public/MAPPINGS/ で公開されている。
但し、幾つかの対応には問題が多く、文字化けが発生する。そのため、ライブラリごとに対応が異なっている。
JIS X 0208にある領域はできるだけFULLWIDTHに変換する。
ASCII領域とその他がマッピングされるとプログラムソース的にも問題が多いので避ける。
JIS X 0201とASCIIでの違いも注意が必要。
Shift_JIS変換先推奨
0x8150  ̄U+203E OVERLINE ‾U+FFE3 FULLWIDTH MACRON  ̄
0x815C ―U+2014 EM DASH —U+2015 HORIZONTAL BAR ―
0x8160 〜U+301C WAVE DASH 〜 U+FF5E FULLWIDTH TILDE ~
0x8161 ‖U+2016 DOUBLE VERTICAL LINE ‖ U+2225 PARALLEL TO ∥
0x817C −U+2212 MINUS SIGN − U+FF0D FULLWIDTH HYPHEN-MINUS -
0x8191 ¢U+00A2 CENT SIGN ¢ U+FFE0 FULLWIDTH CENT SIGN ¢
0x8192 £U+00A3 POUND SIGN £ U+FFE1 FULLWIDTH POUND SIGN £
0x81CA ¬U+00AC NOT SIGN ¬ U+FFE2 FULLWIDTH NOT SIGN ¬
0x815F \U+005C REVERSE SOLIDUS \ U+FF3C FULLWIDTH REVERSE SOLIDUS \
0x818F ¥U+00A5 YEN SIGN ¥ U+FFE5 FULLWIDTH YEN SIGN ¥
0x5C \U+A5 YEN SIGN ¥ U+5C REVERSE SOLIDUS \
0x7E ~U+203E OVERLINE ‾ U+7E TILDE ~

注:変換先はCP932JIS X 0201での対応による。

マイクロソフトの内部変換でも良いが、マルチプラットフォームで開発をする際には、IBM ICUがある。

月別リンク

ブログ気持玉

クリックして気持ちを伝えよう!
ログインしてクリックすれば、自分のブログへのリンクが付きます。
→ログインへ

トラックバック(0件)

タイトル (本文) ブログ名/日時

トラックバック用URL help


自分のブログにトラックバック記事作成(会員用) help

タイトル
本 文

コメント(0件)

内 容 ニックネーム/日時

コメントする help

ニックネーム
本 文
Unicode 6.0.0 Arcen's Blog/BIGLOBEウェブリブログ
文字サイズ:       閉じる