- 20 名前:デフォルトの名無しさん mailto:sage [2015/09/08(火) 01:36:04.31 ID:WpGjOpsu.net]
- CSSセレクタでは、#はidを、> は子要素を表すので、
#news_body > p で、 <div class="maintext" id="news_body">タグの子要素の<p>タグを表す text_content()メソッドは、 そのタグ以下にある、すべてのテキストを取得するから、 root.cssselect('#news_body > p').text_content() <id="news_body">タグの子要素の<p>タグの、テキストを取得する このソースコードは、そのサイトを書いた時点では、 正しく動作していたが、その後、 URL(テレ朝)のHTMLの内容が変わったのだろう IEの開発者ツール(F12を押す)などで、 使われているタグを確かめながら、デバッグするべし。 それとHTML, CSSの基礎も勉強した方がよい
|

|