Pythonのお勉強 Part22
at TECH
468:デフォルトの名無しさん
07/12/24 17:16:31
Vとか機種依存文字がページに含まれてると
UnicodeDecodeError: 'shift_jis' codec can't decode bytes in position 176-177: illegal multibyte sequence
となって上手くいきません。
import urllib
uconn = urllib.urlopen('URLリンク(pc11.2ch.net)')
for e in uconn.readlines():
e = unicode(e, 'sjis')
elem = e.rstrip(u'\r\n').split(u'<>')
print ''.join(elem)
一度ローカルに保存してテキストエディタなどでutf-8に変換する以外で
この問題を回避する方法はあるでしょうか?
次ページ続きを表示1を表示最新レス表示スレッドの検索類似スレ一覧話題のニュースおまかせリスト▼オプションを表示暇つぶし2ch
5501日前に更新/217 KB
担当:undef