Pythonのお勉強 Part22 at TECH
[2ch|▼Menu]
468:デフォルトの名無しさん
07/12/24 17:16:31
Vとか機種依存文字がページに含まれてると
UnicodeDecodeError: 'shift_jis' codec can't decode bytes in position 176-177: illegal multibyte sequence
となって上手くいきません。

import urllib
uconn = urllib.urlopen('URLリンク(pc11.2ch.net)')

for e in uconn.readlines():
    e = unicode(e, 'sjis')
    elem = e.rstrip(u'\r\n').split(u'<>')
    print ''.join(elem)

一度ローカルに保存してテキストエディタなどでutf-8に変換する以外で
この問題を回避する方法はあるでしょうか?


次ページ
続きを表示
1を表示
最新レス表示
スレッドの検索
類似スレ一覧
話題のニュース
おまかせリスト
▼オプションを表示
暇つぶし2ch

5501日前に更新/217 KB
担当:undef