- 730 名前:デフォルトの名無しさん [2011/11/07(月) 21:14:56.26 ]
- >>279に似たような質問があるのですが、
PHP5.3.8にてDOMDocumentにてHTMLファイルを取得し、<body>内のテキストだけを抽出したいです。 タグ部は正規表現で除去出来ますが、問題になるのは<script>でJavaScriptの中身が表示される、<!--などのコメントが表示される事です。 で、<script>とコメントを含む部分を先に除去したいと思います。 /<script[^>]*?>.*?</script>/si とかやってみたのですが良く分かりません。 アドバイスまたは似たような事を書かれているサイトなどを教えて頂けないでしょうか?
|

|