すごーく面倒な文字コードのお話.
昨日のopen-coinsのミーティングのTLで話していただいたんだけど,
「あぁ,こんな問題があるんだな」ってのがよくわかった.
僕が一番気になったのは異体字セレクタのお話.
異体字セレクタ - Wikipedia
http://ja.wikipedia.org/wiki/%E7%95%B0%E4%BD%93%E5%AD%97%E3%82%BB%E3%83%AC%E3%82%AF%E3%82%BF
サロゲートペアはなんとなく(と言っても説明しろと言われるアヤシイが...)わかってたけど,
さらにややこしくするものがあったとは.こんなの文字列比較したらおしまいだな...
うーん,C++とかでココらへんやるならどうすればいいんだろ?
Boostでも使えばうまくカバーしてくれるのだろうか...