- 57 名前:デフォルトの名無しさん mailto:sage [05/02/26 02:04:17 ]
- >>51
wchar_tはUnicodeが入るとは限らないんだけど、そのままUTF-16やUTF-32 を突っ込んでる実装が多いから良しと仮定しましょう。 wchar_tにUTF-32が並んでいても、そこから文字(grapheme)単位に処理 するにはステートマシンで区切りを探さないといけない。 www.unicode.org/reports/tr29/ こういったことを理解しての発言には見えない。 加えて、ICUもそうだけどUTF-16が処理対象の場合はサロゲート込みで処 理されるからサロゲートの有無で手間は全く変わらない。
|

|