HTML_Emojiを読んでみた。

昨日の続きで今日はHTML_Emojiを読んでみました。
処理は単純でUTF-8に変換したものをpreg_replace_callback使って絵文字っぽい私的領域を抜き出して連想配列のマップで置き換えるだけ!
また、ソース読んだだけでも分かりますが、作者のベンチマークによると他の変換スクリプトよりも桁違いに高速らしいです。
現在はバイナリ間の変換+PC用出力のみですが、アルゴリズム的には容易に文字数値参照にも対応できそうです。(対応してくれるかは別として)
ただ、マップ連想配列PHPコードを直接設定ファイルに書いているため絵文字対応が非常に分かりにくいです。Text_Pictogram_Mobileのようなすっきりした形から、実行時に自動生成してキャッシュするようになるといいと思いました。