Unicodeのお話とか

すごーく面倒な文字コードのお話.
昨日のopen-coinsのミーティングのTLで話していただいたんだけど,
「あぁ,こんな問題があるんだな」ってのがよくわかった.

僕が一番気になったのは異体字セレクタのお話.

異体字セレクタ - Wikipedia
http://ja.wikipedia.org/wiki/%E7%95%B0%E4%BD%93%E5%AD%97%E3%82%BB%E3%83%AC%E3%82%AF%E3%82%BF

サロゲートペアはなんとなく(と言っても説明しろと言われるアヤシイが...)わかってたけど,
さらにややこしくするものがあったとは.こんなの文字列比較したらおしまいだな...

うーん,C++とかでココらへんやるならどうすればいいんだろ?
Boostでも使えばうまくカバーしてくれるのだろうか...

Posted at : 2011-12-02 12:53:51 / Category : none

Comments

まだコメントはありません / No comment.

Send comment


Name


Mail-address (empty is OK. If you want to notify update, please fill mail-address.)


Bot check code (240507 と入力してください / Please input 240507.)