- 136 名前:デフォルトの名無しさん mailto:sage [2008/03/01(土) 09:54:38 .net]
- >>131
UTF-8では表せるけどEUC-JPでは表せない文字というのが山ほどあって はしごだかはそのひとつ。完全には変換できないです。 読み書きしているファイルが実は HTML や XML だとしたら xmlcharrefreplace エラーハンドラが便利かも。 >>> import codecs >>> ifp = codecs.open("input.txt", "r", encoding="utf-8") >>> ofp = codecs.open("output.txt", "w", encoding="euc-jp", errors="xmlcharrefreplace") >>> ofp.write(ifp.read()) >>> ifp.close() >>> ofp.close()
|
|