- 317 名前:デフォルトの名無しさん mailto:sage [2009/07/23(木) 21:50:32 ]
- > 現状、Mechanize経由で使ったりする分には、
> コンテンツ取得後にレスポンスボディをNKFでUTF-8に変換して差し替えて それよりはCP932に差し替えた方がいいのでは > >>289 > 文字コード変換はJavaとかPerlとかがまあ道を切り開いてはくれてるけど > Javaの文字コード周りの大変さとか、 > Perlが4から5へ上がったときに配布サイズが膨れ上がった原因の大半が > 文字コード変換テーブルのせいだった、とか考えると > Rubyでやるべきかどうか、ってのは悩ましいな。 彼らは大変だったのでしょうねぇ、先人の苦労には頭が下がります。。 まぁ、彼らが残したShift_JIS変換テーブルみたいなゴミに苦労もしてたりするんですけど。 > 特にRubyはCSIで頑張るつもりなわけで、より大変な道だし。 まぁ、CSIだと変換表を用意しないって技もあったりするんですよ。 > 今の iconv の CP932 は WINDOWS-31J と全く同じだから 実装依存です。 > あと、Ubuntu にインストールされている iconv は非公式パッチが入ったものだ Ubuntu は glibc iconvで、libiconvとは別物ですね。 glibc iconvには森山さんのパッチが取り込まれています。 > CP932→UTF-8自体は、記号の意味上はともかく文字の見掛けの形だけは大丈夫だったはず > 逆は不可だが 意味的にも大丈夫ですよ、問題が出るのはShift_JISと混ぜた時の話。
|

|