Pythonのお勉強 Part30
at TECH
890:デフォルトの名無しさん
08/12/30 07:57:41
BeautifulSoup Release 3.1.0 (2008/12/27)
2.4/3.0 のハイブリッド版。新しい機能の追加等はなし。3つの後方非互換が在り。
1. str()や__str__の振舞が変わる。-> バイト文字を得るにはencode()/unicode文字を得るには decode() を使う。
2. SGMLParserベースからHTMLParserベースに変更。(sgmllibが標準からなくなるため)
此れにより、壊れた HTML文書 を扱えなくなる。
将来のバージョンでは、速度と壊れたHTML文書の扱いのトレードオフで、パーサを選択できるようにする予定。
3. (Python3で) 属性中のエンティティの扱いで、パース時にunicode文字に変換されることがある。
例: <a href="URLリンク(crummy.com?sacré&bleu)"> -> Python 3 では é が "\xe9" に。
次ページ続きを表示1を表示最新レス表示スレッドの検索類似スレ一覧話題のニュースおまかせリスト▼オプションを表示暇つぶし2ch
5176日前に更新/206 KB
担当:undef