- 493 名前:デフォルトの名無しさん mailto:sage [04/03/14 03:09]
- >>485 の言うとおり regex は随分変更を受けると思うが。
標準関数じゃないが、よく使われるので重大だ。 あと、1文字のバイト数が固定じゃなくなるので、 strchr は strstr で代用できるとしても、 strrchr は使えなくなってしまう。 他にも strpbrk や strtok も改変が必要。 isleadbyte も改変が必要で、 後続バイト数を返すようにする必要がある。 あとは、標準関数だけじゃなく、 独自のライブラリの関数も軒並みアウトだろうな。 まぁ、想定する文字コードが違うんだから、 1文字1文字処理していくタイプの処理が使いまわせないのは 当然っちゃー当然だけど、 Shift-JIS か EUC かって程度なら isleadbyte 使ってりゃ何とかなることを考えると UTF-8 は随分面倒だ。 UTF-8 だと日本語は3バイト以上だし、どうやっても誤魔化せないな。
|

|