[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 2chのread.cgiへ]
Update time : 08/23 17:51 / Filesize : 236 KB / Number-of Response : 901
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

Proxomitron フィルター作成スレッド Part14



1 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/01/17(火) 20:41:21.52 ID:5bYaTkqS0]
Proxomitron等に関するWiki
abc.s65.xrea.com/prox/wiki/

Proxomitron専用Uploader
www42.tok2.com/home/proxo/

Thinking Archive(仮)
vird2002.s8.xrea.com/

【前スレ】
Proxomitron フィルター作成スレッド Part13
anago.2ch.net/test/read.cgi/software/1287997298/

---- 関連スレ ----
Proxomitron Part 30
toro.2ch.net/test/read.cgi/win/1218905098/

■■■■Proxomitron入門スレッド■■■■6
kohada.2ch.net/test/read.cgi/pcqa/1201242934/

ニコニコ動画専用オミトロンソフト板 Part28
anago.2ch.net/test/read.cgi/software/1299494256/

202 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/04/30(月) 22:32:33.85 ID:bg8UOweB0]
<form id="tsf">
<input class="lst lst-tbb" value="GLib-CRITICAL **: g_variant_new_string: assertion `string != NULL' failed" title="検索" size="41" type="text" autocomplete="off" id="lst-ib" name="q" maxlength="2048"/>
</form>
を対象にテストするとしっかりマッチするんだけど?

1,NEST必要?formってネストしていいんだっけ?
2,</form>が\#に収められてない。
3,再現できない。リミットは?

203 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/01(火) 02:00:33.13 ID:7y6xromR0]
俺もlimitが臭いと思うね

>>202
formはネストできないことになってるし、違反しているサイトもまずないが
単に対になるタグを探す方法としても$NESTはほぼ最速かつ簡潔な書き方ができるので、よく使われる

204 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/01(火) 18:40:37.74 ID:woOVog2W0]
広告ブロックで
文字列指定でブロックできるフィルタってないですか?

例えばlistにplusone.jsとかga.jsと書いておけばブロックしてくれる感じです

205 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/01(火) 18:49:45.88 ID:T0PbaHHp0]
自分で作れ
その方が手っ取り早い

206 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/01(火) 18:51:13.98 ID:7y6xromR0]
ファイル名を指定したいなら、AdListにデフォで
# Specific pathname components (after the first "/")
こんなのがあると思うが

スクリプト内の文字列にマッチしたいならKill JavaScript Bannersあたりを改造すればいいが
ページフィルタで1文字進むごとにリストを引くのは非常に遅いので注意だ

207 名前:204 mailto:sage [2012/05/01(火) 23:32:55.13 ID:woOVog2W0]
ありがとうございます
参考になります

208 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/02(水) 01:28:46.75 ID:tF0DF1WA0]
*[_"'.{$\s+-/]ad(s|)(^l)[_0-9\s.;{+-]*

これに

.adsl.ppp.infoweb.ne.jp

がマッチしてしまうのはなぜでしょうか・・・

209 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/02(水) 01:55:21.09 ID:l6k0wK4U0]
[\s]
\とsにmatch

210 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/02(水) 02:12:42.10 ID:8MJ/wjy40]
sとSにマッチ

〜(^adsl)(ad|ads)〜 みたいに書いた方が分かりやすいかもね。



211 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/02(水) 03:19:24.52 ID:AJhEZ54B0]
(s|) の部分、最初にsの方が選ばれるけど後続パターンが失敗するから、結局空マッチの方が選ばれて
つまり ad だけが消費されて、その後ろは l じゃないから否定をすり抜けちゃうわけだ

否定マッチの位置を手前にずらす必要がある
ad(^sl)(s|) とかあるいは>>210みたいに

212 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/02(水) 21:19:45.99 ID:tF0DF1WA0]
解説ありがとうございました

213 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/02(水) 23:19:54.02 ID:ueIL9J5/0]
みんな広告除去ってどんなフィルタ使ってるの?
AD Killerに同梱のリストはほぼ使い物にならないものなのかなぁ
あれだけあるとどれが不要なのかわからん

214 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/03(木) 02:31:47.86 ID:xUwbtT0y0]
「除去」といっても対象によって手段がいくつかある。
・リクエスト遮断。\kを使う。
・IP詐称。.hostsを使う。
・不可視化。CSSを使う。
.hostsはProxomitronと関係ない。CSSはProxomitronと連携可能。

215 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/03(木) 07:19:32.85 ID:M9xxiUTp0]
完全に手製
誤爆上等だけど何が誤爆してるのかすぐわかるから問題ない

216 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/03(木) 07:35:58.05 ID:vo+Hf28d0]
自分にとって便利なように凝れば凝るほど他人にオススメできる物じゃなくなるよな

217 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/03(木) 07:44:10.11 ID:o02FgzNI0]
対象の仕様変更に弱くなるからな

218 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/03(木) 07:54:22.85 ID:a89Co9XpP]
ブラウザで管理、編集ができたら最強なのに

219 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/03(木) 08:03:59.56 ID:1rW0C1pU0]
ブラウザ側からはいじれないし覗けないってのが理想だろう

220 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/04(金) 10:40:16.60 ID:51Bbm1jC0]
お手製が一番便利だけど、最近じゃJavascriptので記述してdocument.writeとか
もろもろで追加する感じのが多いからな。
全て殺すならいいんだけど、一部だけ殺したい場合とかもあるし、
殺さないといけない部分が一部で残りは動作必要な記述だったりとかもあるし。

.scriptタグの中を調べるように記述すると、googleとかみたいにやたらscriptタグの中身が多いサイトだと、
フリーズしたかのようにCPU使用率が暫く跳ね上がって読み込みが時間かかるようになるんだけど、
軽く書ける方法あるんだろうか。
今はホワイトリストで除外してるんだけど。



221 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/04(金) 18:27:25.12 ID:6ACCgJxL0]
殺す殺さないの判定が、メソッドの引数でできるなら、メソッド自体を書き換えるスクリプトを挿入するフィルタ。
グローバルで定義するなら、1文書に1回の適用で済む。
ただし、IE9はグローバルでdocumentが定数だから、エラーになるかも試練、確認してないけど。
ローカルスコープでは問題ないらしいから、全ての "function\(\) \{" の直後に挿入するのも考えられるけど、それだとメリットはない。

222 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/06(日) 22:20:21.65 ID:xwa9QuFi0]
proxomitronのリストで管理してるからそれだと無理そうかな。
そっちの方が軽さとか考えるといいけど、汎用性も持たせると難しそうだ。

223 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/07(月) 23:02:49.71 ID:/dsrFxpt0]
[Patterns]
Name = "Google | Ajax killer test-20110528"
Active = TRUE
URL = "(^$KEYCHK(^C))www.google.co(.jp|m)/(search\? $TYPE(htm)|extern_js/f/ $TYPE(js)(^$OHDR(Referer: *\&tbm=(isch|mbl)*)))"
Limit = 300
Match = "$TYPE(js)$STOP()\k|"
"(/extern_js/f/[^.]+.js)\#$SET(#=?prox-$DTM(tc))|"
"(<a [^>]++ class=$AV(gbmt|gbzt *) [^>]++)\# onclick=$AV(*)"
"|"
"(^$URL(*\&tbo=1*))$SET(#=<script>document.location="\u&tbo=1";</script>)$STOP()|"
"(^$URL(*\&prmdo=1*))$SET(#=<script>document.location="\u&prmdo=1";</script>)$STOP()|"
"$NEST(<a [^>]++ id=$AV(showmodes|tbpi),</a>)"
Replace = "\@"


こいつが検索結果2ページ目以降では動かなくて困っています
対応版をどなたか作成して頂けないでしょうか?

224 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/09(水) 15:31:34.70 ID:c6WYdMmp0]
あるサイトでadblockが入ってると警告が出て
無効にしてから出直して来いと出るサイトがあるのですが(言うとおり無効にしても見れないっていう・・・)
そういうのを回避できるフィルタお願いします

225 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/09(水) 15:42:21.25 ID:UzgW2PsZ0]
どのサイト?URLぐらい晒しなさいよ
こういうのならある
ttp://shinshu.fm/MHz/14.30/archives/0000264243.html

226 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/09(水) 16:26:05.13 ID:QdDznKqh0]
そういうサイトってあちこちにあるもんなのか?
今まで1回しか見たこと無いからわざわざソース見るのも面倒なんで
そこだけ別のブラウザで見たが

227 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/09(水) 16:30:58.26 ID:c6WYdMmp0]
サイト名はiLix.inで
urlはttp://urlink.at/*****という形のとこです
いわゆるリンクプロテクションサイトです

226のお言うとおり今まではIEで凌いでたんですが
広告やらポップアップがひどくてかなりイライラさせられるんで・・・

228 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/09(水) 16:48:19.80 ID:c6WYdMmp0]
ついクセでurl部分隠してしまった、ごめん
ttp://urlink.at/1fdKN

229 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/09(水) 18:48:51.14 ID:WRRWgwW30]
多分adsense2.jsを読み込んだか弾いたかで判断してるだけと思う
ソースしか見てないから試してないけど
Match = "<script\stype=$AV(text/javascript)>\s+var\ adblock\s+=\s+true\s+;\s+</script>"
Replace = "<script type="text/javascript">var adblock = false;</script>"
これじゃだめかな

230 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/09(水) 19:44:52.96 ID:c6WYdMmp0]
>>229
ありがとう
でも変化なしです



231 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/09(水) 19:49:57.47 ID:WRRWgwW30]
>>230
そうかー。だったら://188.143.233.13/adz/adsense2.jsを許可してもだめ?

232 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/09(水) 20:07:30.17 ID:5ZUqoOwD0]
めんどくさいからその割り込み画面作ってるscriptを潰したほうが早い
document.write(gui);を消せば十分か、試してないけど

233 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/09(水) 21:30:09.86 ID:c6WYdMmp0]
>>231
許可というのはbypassListへ188.143.233.13/adz/adsense2.jsを追加しろということですか?
もしそうなら試しましたが変化なしでした
>>232
フィルタ作成についての知識は皆無で
もう少し具体的に教えてもらえないですか
すいません・・・

234 名前:223 mailto:sage [2012/05/10(木) 20:53:48.44 ID:ma9Z8AHt0]
>>232のアドバイス通りに書くとこんな感じでいいのか?

[Patterns]
Name = "urlink.at"
Active = TRUE
URL = "urlink.at/"
Bounds = "<script type="text/javascript">*</script>"
Limit = 3000
Match = "*document.write\(gui\);*"

235 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/10(木) 23:30:07.63 ID:TvrmaVbF0]
>>234
ありがとう
割り込み画面回避できました

236 名前:223 mailto:sage [2012/05/11(金) 02:25:48.55 ID:PKmVbqP80]
うまく動いて何より

237 名前:名無しさん@お腹いっぱい。 [2012/05/12(土) 19:17:42.14 ID:Q1Ijauz00]
置換後文字列の文字数って限界があるの?
置換後文字列を3500バイトぐらいのフィルタ作ったら末尾数バイトが消えるんだけど

238 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/12(土) 21:37:47.93 ID:Jz7lzIvB0]
俺エスパーじゃないからなぁ

239 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/12(土) 23:46:40.39 ID:RHCDG1jx0]
>>237
自分で遭遇したり確認したことはないけど、wikiによれば限界はあるようです。

240 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/17(木) 11:00:14.22 ID:2aNj0yiL0]
blog.livedoor.jp/kinisoku/archives/3393452.html
みたいなyoutube動画が大量に埋め込んであるページを貧弱なPCで踏んじゃっても
大丈夫なフィルターはないでしょうか?chrome使いです。



241 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/17(木) 12:38:45.87 ID:NemCjse60]
>>240
サムネイル付けてyoutube該当動画へのリンクにしてしまえば?

URL = "(^[^.]+.youtube.com/)"
Limit = 640
Match = "$NEST(<object,*\s(src|value)=$AV(www.youtube.com/v/([^?&]+)\1*)*,</object>)"
Replace = "<a href="www.youtube.com/watch?v=\1" target="_blank">"
"<img src="i2.ytimg.com/vi/\1/default.jpg" style="border:1px solid #333;"></a>"

242 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/17(木) 13:05:30.79 ID:8T2MBFdm0]
>>241
これはいい
横からだけどいただいた

243 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/17(木) 15:22:41.37 ID:2aNj0yiL0]
>>241
ありがとうございます。非常に快適ですw

244 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/18(金) 20:37:53.68 ID:o31yPinv0]
tr.twipple.jp/gazou/

これのソースを見ても画像タイトル名がソースに記述されていないのですが
画像タイトルでフィルタリングするにはどうすればいいのでしょうか?

具体的にはハングル語が含まれる画像が不快なので消して非表示にしたいのですが

245 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/19(土) 00:44:14.37 ID:RyTqjblK0]
復帰

246 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/19(土) 07:50:15.05 ID:OL7hxvO60]
タイトルってimg要素のalt属性のこと?

247 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/19(土) 13:45:54.29 ID:4xkOzFND0]
firefoxだが、ページのソースを見ると確かに無いのに画像付近を範囲選択して「選択した部分のソースを見る」で
見てみるとIMGタグもalt属性もしっかりある。javascriptで動的に追加されてるのかな?

248 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/19(土) 14:16:28.38 ID:R/H/IIt60]
>>244
とりあえず、どこにタイトルなどのデータが記述されているかは
ログウィンドウでアクセスしているURLを見ていれば分かると思う。

249 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/19(土) 18:21:06.10 ID:yJfT3aaE0]
httpのアクセス傍受してりゃどっかのファイルに記述されてる
あとはそこに手を加えるだけ

250 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/19(土) 23:54:18.11 ID:HA/Z9+7l0]
ログを見てもどこにも記述されていないのですが・・・



251 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/20(日) 00:03:07.23 ID:OL7hxvO60]
tr.twipple.jp/gazou/js/gazou_script2.js

252 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/20(日) 00:37:23.99 ID:/6CJP9T10]
/data/url_ranking/image/recent.js
そろそろ解答

253 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/20(日) 01:17:06.27 ID:WbpFKQow0]
[Patterns]
Name = "No Korean"
Active = TRUE
URL = "tr.twipple.jp/data/url_ranking/image/recent.js"
Bounds = "{"thumbnailUrl*},"
Limit = 1000
Match = "*([%e1][%84-%85][%80-%9f]|[%e1][%85-%86][%a0-%a2]|[%e1][%86-%87][%a8-%b9])*"

これで上手くいきました。

今度はこれを応用してメインページ側(twipple.jp/)にも適用しようと調査しているのですが、
画像自体は
s1-04.twitpicproxy.com/photos/thumb/数字.jpg?key=数字
に格納されているようなのですが本文を格納していると思われる.jsが存在していないようです

これはまた別の手法で文章表示させているのでしょうか?

254 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/21(月) 11:44:48.88 ID:MmOazDBH0]
htmlの中で、上の方のJava Scriptの定義やらなんやらをバッサリ消して、
途中の部分だけ抜き出し、そこから先をまたバッサリ削る。と言う場合、
ウェブページフィルタ は、どのような構造の物になりますでしょうか?
単一フィルターでは無理で、それぞれに分けないといけませんか?

255 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/22(火) 01:24:16.44 ID:Gy02adZy0]
はちまは前は見てたけど
もう見てないな

256 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/22(火) 01:25:04.91 ID:Gy02adZy0]
誤爆

257 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/22(火) 03:11:32.44 ID:59XO9Iu7P]
>>254
特定の部分だけを残して他を消す程度ならフィルタ1つでいけるんじゃないかな
どんなフィルタかは元のhtml次第だから具体例があった方がいい

258 名前:254 mailto:sage [2012/05/22(火) 17:19:22.93 ID:FU/yoAxd0]
>>257
ニュースサイトのニュースの部分です

ここ↓の、
mainichi.jp/sponichi/news/20120522spn00m050005000c.html

<div class="NewsBody clr">
から、
</div> <!-- NewsBody:END -->
以外の部分をバッサリと削りたいです。
<html>や、<head>は、後付けでも構いません。

よろしくお願いします。

259 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/22(火) 18:28:48.15 ID:PTP7qZGu0]
$NEST(<script,</script>)
とか指定して必要ないやつを片っ端から消していけばいい

260 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/22(火) 20:48:35.71 ID:9JiTwaGJ0]
>>258
何も考えずに作ればこれだな

Limit = 60000
Match = "(<body [^>]+>)\0*(<div class="NewsBody clr">)\1|(</div> <!-- NewsBody:END -->)\0*(</body> </html>)\1"
Replace = "\0 \1"




261 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/22(火) 20:51:33.57 ID:pi20hzK60]
頭から普通にマッチして、ケツは\kで切るのが基本

>>259
その$NESTはまずいね
</script> は普通スクリプトの中には現れないが
<script は document.write("<script〜") とかされることがよくあるので相方が見つからなくなる

262 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/22(火) 21:30:45.79 ID:3f+pRW8P0]
昔のIEは、文字列で '<script ...' 食わせるとエラ〜吐いたから、'<scr' + 'ipt ...' とかしてた筈だが、今は平気なのか?
JavaSは読み込んだその時点で実行だから、document.writeに渡した時点で、閉じタグを書き出さない限りコードは終わらないと思うが。

263 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/22(火) 22:09:06.08 ID:3f+pRW8P0]
近くのサイトのソース見たら、'<script ...<\/script>' だった、なるほど。
>>262 はスルーしてくれ。

264 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/23(水) 01:28:03.35 ID:qSfUOUmg0]
ちっとわかりにくい書き方だったね
"</scr" + "ipt>" みたいなのは、閉じタグの方にだけ行われることが多いっつーことね
なぜかというと、生の閉じタグが現れたらそこでスクリプトが終わっちゃうから
一方、開始タグには目だった害はないので、たいてい直書き

265 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/23(水) 01:48:29.93 ID:oT/GvnuB0]
ちなみに>>261のパターンってどんなの?
いまいちテストで引っかかるパターンが作れない

266 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/23(水) 02:19:38.60 ID:49S/pk/F0]
$NEST() はクオートの中は開始タグ・終了タグとして検査しないはずだから
document.write("<scirpt>");
document.write("</script>");
document.write("<scr"+"ipt>");
document.write("<"+"/script>");
とかは全部無視されると思われ。

267 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/23(水) 10:23:38.65 ID:M9UoTRzz0]
ほんとだ、>>266全部大丈夫だった。

268 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/23(水) 12:22:08.14 ID:8mb6e0we0]
>>266
おお、その挙動は知らなかった
しかしこういうケースでハマった経験が何度かあるのも事実なんだよね

多分、クォートを解釈する部分がいつもうまく動くとは限らないんじゃないかな
<script>/* I'm a comment */ document.write('<script></scr'+'ipt');</script>
こんな風にコメントの中にクォートの始まりのように見えるものがある場合とか

269 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/23(水) 12:49:51.28 ID:49S/pk/F0]
>>268
じゃあ$NEST()使わずにフィルタ書いてればいいと思うよ。

270 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/23(水) 15:34:33.10 ID:WDLgiZY50]
\"にも対応してるんだっけ?\\"があったらどうなるんだっけ、もう使ってないから忘れた。



271 名前:254 mailto:sage [2012/05/24(木) 00:30:05.47 ID:6trnY91n0]
>>260
ありがとうございました。
うまくいきました。

>>259 さんのは、そのままではだめだと言う事のようですが、
他の方々の御意見はちょっと難しくてわかりませんでした。

272 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/24(木) 14:20:27.20 ID:7R7vMDy40]
>>241
netamesi.blog.fc2.com/blog-entry-330.html
このページにも対応できないでしょうか?

273 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/24(木) 14:43:43.24 ID:IO55djKT0]
Match = "$NEST(<object,*\s(src|value)=$AV(www.youtube.com/v/([^?&]+)\1*)*,</object>)"
"|<iframe\s[^>]++src=$AV(www.youtube.com/(embed|v)/([^?&]+)\1*)[^>]+>*</iframe>"

274 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/25(金) 16:17:48.83 ID:ryq2sdn50]
ネットのチラシを集めたサイトがあって、このうちよく行く店だけを表示させたくてこういうフィルタを作ったんですが。

Name = "chirashi de setsuyaku"
Active = TRUE
URL = "$TYPE(htm)chirashi.valueinfosearch.net/area/kanagawa/fujisawa/"
Limit = 1024
Match = "((<tr><td class=$AV(name)*</tr>(<tr><td class=$AV(comment)>*</tr>)+{1,3}) && *("
"・・・ ここに消したい店の名前をUTF8エンコードして入れる ・・・"
")*)"
Replace = "\n"

name属性の tdタグに店名、それに続いて comment属性の tdタグにはチラシの詳細などが 1〜3行あって一まとまりに
なってるんですが、一まとまりにしている単位が変(構造化されてない)だからCSS改変ではやりづらい。
ちなみに店舗の順番は固定ではなく、チラシが更新された店舗が上に来るフロート式です。
(続く)


275 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/25(金) 16:19:04.82 ID:ryq2sdn50]
たとえば「相鉄ローゼン」のうち、湘南台店・みろく寺店 以外を消そうと考えて  ローゼン(^湘|み)  と書き、

Match = "((<tr><td class=$AV(name)*</tr>(<tr><td class=$AV(comment)>*</tr>)+{1,3}) && *("
"%e3%83%ad%e3%83%bc%e3%82%bc%e3%83%b3(^%e6%b9%98|%e3%81%bf)"
")*)"

これは意図通りに上手くいきました。

(続く)


276 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/25(金) 16:21:43.89 ID:ryq2sdn50]
気を良くして次に店名か住所に「辻堂」が含まれるものを消そうとして
Match = "((<tr><td class=$AV(name)*</tr>(<tr><td class=$AV(comment)>*</tr>)+{1,3}) && *("
"%e8%be%bb%e5%a0%82"
")*)"
と書いたんだけど、こんな単純なものが何故かマッチしない・・・

また「ダイソー」が7店舗あるんですけど、このうち支店名が「藤」以外で始まる店を消そうとして  ダイソー (^藤)  と書き、
Match = "((<tr><td class=$AV(name)*</tr>(<tr><td class=$AV(comment)>*</tr>)+{1,3}) && *("
"%e3%83%80%e3%82%a4%e3%82%bd%e3%83%bc (^%e8%97%a4)"
")*)"

これも何故かマッチせず、すべてのダイソーの店が消えてしまいます。

ここ2日ほど見直してるんだけど、何が駄目なのか分からない・・・
分かる人いましたらお助け下さい。


277 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/25(金) 17:34:55.87 ID:wVjDuUXV0]
なんか一生懸命だからエスパーしておく

例えば「消したい店の名前」にマッチさせたい場合
× %E6%B6%88%E3%81%97%E3%81%9F%E3%81%84%E5%BA%97
○ [%E6][%B6][%88][%E3][%81][%97][%E3][%81][%9F][%E3][%81][%84][%E5][%BA][%97]

多分相鉄ローゼンの場合はhrefの中身かなんかにマッチしただけかと

278 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/25(金) 17:41:45.91 ID:znBG7Bc60]
>>274-276

ページのソース見ると
店名 → UTF-8 で記述されてる。
住所 → UTF-8 で記述されてる。
地図へのリンク(href="〜") → UTF-8 の店名を URL エンコード(%xx 形式)して記述されてる。

%e8%be%bb%e5%a0%82 と書くと、URL エンコードされた部分にマッチするけど、UTF-8 にはマッチしない。

店名に「辻堂」が入ってるものは、地図へのリンクに URL エンコードされた %e8%be%bb%e5%a0%82 が
入っているからマッチして消せてる。

UTF-8 にマッチさせたいなら [%e8][%be][%bb][%e5][%a0][%82] と書けば、店名や住所の「辻堂」にマッチする。

ダイソーも地図へのリンクにマッチしてるんだけど、URL エンコードだとスペースは + に変換されるので
" (^%e8%97%a4)" だとマッチしない。除外指定がマッチしないから全部消えるという結果ね。

%e3%83%80%e3%82%a4%e3%82%bd%e3%83%bc(^\+%e8%97%a4)
として地図へのリンク(=URL エンコードされた店名)にマッチさせるか、

[%e3][%83][%80][%e3][%82][%a4][%e3][%82][%bd][%e3][%83][%bc] (^[%e8][%97][%a4])
として店名にマッチさせればいい。

279 名前:274 mailto:sage [2012/05/26(土) 14:16:17.57 ID:UAoqUU+i0]
>>277-278
単純なミスか勘違いだろうなと思ってはいたんですけど、やっぱりでしたね。恥ずかしい・・・

角カッコで括るのは以前書いたことがあるし、知ってたはずなのに失念してました。

長々と書いて済みませんでした。ありがとうございました。


280 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/29(火) 22:03:45.65 ID:ZFyWa3Bi0]
ページ内の埋め込み動画の実態をリンク化するのってできます?



281 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/30(水) 04:33:16.48 ID:QvzbCydD0]
できるかもしれないしできないかもしれない

282 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/06/01(金) 10:59:26.24 ID:eLpduaOY0]
AdListでは、https:で始まるイメージ、
※例えばヤフーメールログイン時の広告(https://s.yimg.jp/)
は、消せないのでしょうか?

283 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/06/03(日) 18:18:30.64 ID:j6oB+A/90]
>>282
Proxomitronはデフォのままだとhttpsにはノータッチだよ


そしてどなたかGoogle | cleanup search resultsの更新をお願いします・・・

284 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/06/03(日) 18:53:00.59 ID:ehbNwIBh0]
ADriveの認証ページをすっ飛ばすフィルタお願いします

285 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/06/04(月) 00:38:06.15 ID:zEqlcNRv0]
>>282
広告があるページ(その例ならヤフーメールのログイン画面)がhttpなら
フィルタ内でhttp(s|)://$LST(AdList)*とかになってれば消せる
広告があるページがSSLならそのページ自体がバイパスされてる

286 名前:282 mailto:sage [2012/06/05(火) 00:41:02.61 ID:cbXf4CL+0]
>>285
ありがとう
非常にくっきり、スッキリ理解できました

287 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/06/06(水) 17:59:47.19 ID:nlics7TB0]
Banner Blaster の最新版って、これ↓なんでしょうか?
誤爆が多いのですが、使わない方が無難?

[Patterns]
Name = "Banner Blaster (2003/05/24)"
Active = TRUE
Multi = TRUE
URL = "^www.nintendo.co.jp|www.amazon.com|www.amazon.co.jp|*.digikey.com"
Bounds = "<a\s[^>]++href=*</a>|<input*>|<ilayer*</ilayer>|<iframe*</iframe>|<object*</object>"
Limit = 900
Match = "(<(ilayer|iframe|object)*|\1<i(mg|mage|nput)*src=$AV(*)*>\3)"
"&(*(href|src)=$AV($LST(AdKeys)*)|"
"**<i(mg|mage|nput)\s(*>&&"
"(*width=[#460-480]&*height=[#55-60]*)))"
"&(*alt=$AV(\2)|$SET(2=Ad))"
Replace = "\1<font size=1 style="text-decoration:none; color=#AAAAAA;">"
"[ad]</font>\3"

288 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/06/06(水) 18:40:18.44 ID:w65hhA/J0]
そりゃ誤爆するだろうな
俺はproxomitron使い始めてかなり早い段階でそのフィルタオフにしたと思う
で、hrefでAdList引くだけの簡単なフィルタを書いた (なぜかそういうものはプリセットにはなかった)

289 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/06/06(水) 20:21:48.95 ID:faD+Ecpm0]
そのフィルタ晒せ

290 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/06/06(水) 22:39:54.75 ID:/Su+t21Q0]
URL-KillerのリストにURLぶち込めばバナーも消えるし、間違えてクリックしても遮断するしで
Banner Blasterを使おうと思わなかった



291 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/06/10(日) 01:34:51.64 ID:lSUpJWoR0]
質問です
FireFoxのAdblock Plusを使ってみたのですが
広告除去 & アフィカットがかなりの網羅率で驚きました

しかし、メインはAdblockを入れられないブラウザなので
Proxomitronを使って同等のことをしたいと考えています
Adblock Plus用リストをそのままProxomitronに使うことはできないのでしょうか?
よろしくお願いします。

292 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/06/10(日) 04:58:21.62 ID:VXNTPm8y0]
無理
限界がある

293 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/06/10(日) 08:50:19.53 ID:MhgHFvsM0]
そのままは無理だな

294 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/06/10(日) 09:22:48.78 ID:R+hWXe5i0]
Proxomitronには通信切断されるバグがあるけどいいの?
広告カットする代わりに一部の画像が表示されない等の不具合が出るよ。

295 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/06/10(日) 11:02:57.71 ID:+e0dAz6G0]
別に何とも
どうしても画像出ないと困る状況になったらバイパスすれば良いし、
そんな状況になった覚えも無い

296 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/06/10(日) 13:06:06.49 ID:i7OCtYWm0]
バグでなく巻き添えカットじゃないのか。

297 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/06/10(日) 14:35:28.67 ID:R+hWXe5i0]
>>295
バイパスしてるかどうかに関係なく出るよ。今まで使ってて気にならないなら大丈夫か。

298 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/06/10(日) 14:39:34.78 ID:USQjRlIU0]
例えばどこで?どのような条件で?

299 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/06/10(日) 14:41:10.73 ID:USQjRlIU0]
adblock plus のフィルタを使いたければ、自分で変換すればいいだろ
エディタやScript使え

300 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/06/10(日) 14:47:55.02 ID:R+hWXe5i0]
>>298
wikiに載ってるけど偶発的に起きるバグみたいで条件とかない。
たまにしか出ないときもあれば頻繁に起きることもあるが、まったく出ないというときはない。

今まで使ってて気付かなかった人は単に本当に気付いてなかっただけで、バグは出ていたはず。



301 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/06/10(日) 14:50:52.45 ID:USQjRlIU0]
消されても気づかない画像なら、消されても問題ないだろ

302 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/06/10(日) 14:59:54.66 ID:La3och1/0]
>>300
wikiのどこに載ってるかわからんが、再現性がないんなら根拠なくProxomitronのせいだとは言えないだろ
画像が表示されないなら他の要素が表示されなくてもおかしくないし、ほんとにバグなの?






[ 続きを読む ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<236KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef