くだすれPython(超初心者用) その4
at TECH
[
2ch
|
▼Menu
]
■コピペモード
□
スレを通常表示
□
オプションモード
□このスレッドのURL
■項目テキスト
600:594 09/08/20 19:51:48 ヒントありがとうございます。 色々試してみましたが、文字コード回りは今一つ良く分かりませんね。 みなさんのヒントとウェブ情報を参考にとりあえず次のようにしてみました。 html = urllib.urlopen(url).read() html_coding = chardet.detect(html)['encoding'].lower() soup = BeautifulSoup(unicode(html, html_coding, 'replace').encode('utf-8')) text = soup...... print text.encode('euc-jp', 'replace') 単純にprintの時に text.encode('euc-jp', 'replace')とかだと、何故か全体がわけわからないコードになりました。 2.5.4でやってるんですが、3.xになるとこの辺もっとスッキリするんでしょうか。 601:デフォルトの名無しさん 09/08/20 22:08:07 「Python 3.1.1」リリース http://pc11.2ch.net/test/read.cgi/pcnews/1250773470/ 602:デフォルトの名無しさん 09/08/21 07:36:16 >>600 html = urllib.urlopen(url).read() soup = BeautifulSoup(html) text = soup...... print text.encode('euc-jp', 'replace')
次ページ
最新レス表示
スレッドの検索
類似スレ一覧
話題のニュース
おまかせリスト
▼オプションを表示
レスジャンプ
mixiチェック!
Twitterに投稿
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch
5400日前に更新/160 KB
担当:undef