- 468 名前:デフォルトの名無しさん mailto:sage [2007/12/24(月) 17:16:31 ]
- Vとか機種依存文字がページに含まれてると
UnicodeDecodeError: 'shift_jis' codec can't decode bytes in position 176-177: illegal multibyte sequence となって上手くいきません。 import urllib uconn = urllib.urlopen('pc11.2ch.net/tech/dat/1196426978.dat') for e in uconn.readlines(): e = unicode(e, 'sjis') elem = e.rstrip(u'\r\n').split(u'<>') print ''.join(elem) 一度ローカルに保存してテキストエディタなどでutf-8に変換する以外で この問題を回避する方法はあるでしょうか?
|

|