- 262 名前:デフォルトの名無しさん mailto:sage [2009/07/23(木) 02:57:50 ]
- NokogiriがWindows-31Jエンコーディングをサポートしていない気がする。
正確にはNokogiriが使っているlibxml2が呼んでいるiconvかもしれないけど。 >irb -Ks -rrubygems -rnokogiri #Shift_JISの範囲外の文字を含んだWindows-31J(=CP932)エンコーディングの文字列 irb(main):001:0> s="<html><HEAD><TITLE>11@11@</TITLE></HEAD><body></body></html>" => "<html><HEAD><TITLE>11@11@</TITLE></HEAD><body></body></html>" #エンコーディング指定なしでHTMLパース。当然失敗。 irb(main):002:0> Nokogiri::HTML.parse(s) encoding error : output conversion failed due to conv error, bytes 0x82 0x50 0xC 2 0x87 I/O error : encoder error => #Windows-31JエンコーディングでHTMLパース。失敗。 irb(main):003:0> Nokogiri::HTML.parse(s,nil,'Windows-31J') encoding error : output conversion failed due to conv error, bytes 0x82 0x50 0xC 2 0x87 I/O error : encoder error =>
|

|