[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 2chのread.cgiへ]
Update time : 04/05 08:18 / Filesize : 385 KB / Number-of Response : 980
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

Proxomitron フィルター作成スレッド Part6



1 名前:ミスターオミトロン [2006/11/13(月) 17:00:32 ID:oCAoIukD0]
このスレは作成依頼されたフィルタを有志により作るスレッドPart4です

アップローダー
wind.prohosting.com/proxmine/cgi-bin/uploader/
proxo.hp.infoseek.co.jp/cgi-bin/sn_uploader/upload.html
Proxomitron等に関するWiki
abc.s65.xrea.com/prox/wiki/
Thinking Archive(仮)
vird2002.s8.xrea.com/
CastleCops Proxomitron Filters
www.castlecops.com/f65-Proxomitron_Filters.html

>>2-10にいろいろと

369 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/02/18(日) 02:15:11 ID:yl8Igbxg0]
>>368
あ、すみません自己解決しました。

370 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/02/18(日) 04:32:39 ID:9V28jqDL0]
一度質問したんだから、解決したなら解決済みのフィルター書くのが礼儀。
運がよければアドバイスも貰えるかもしれないし。

371 名前:369 mailto:sage [2007/02/18(日) 14:13:40 ID:yl8Igbxg0]
>>370
omitronのバージョン違いでした。

372 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/02/18(日) 16:47:08 ID:Ad13aOLe0]
ttp://web.archive.org/web/20050203201413/www.hirax.net/scraps/tabi/index.html

↑のように Internet archive で日本語ページを見ると文字化けするのは、
ヘッダに charset=UTF-8 と書いてあるからだと思ったので
次のようなフィルターを書いた。でも化け直らず。

[HTTP headers]
In = FALSE
Out = TRUE
Key = "web.archive.org charset (Out)"
URL = "*web.archive.org"
Match = "charset=UTF-8"
Replace = "charset=Shift_JIS"

そもそもの着眼点が間違ってるかもだけど
とりあえずフィルタの書き方は合ってる……?

373 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/02/18(日) 17:19:00 ID:xJ9Dcg+D0]
>>372
確かに素のIEで見ると文字化けしてるんで調べてみたら
In = TRUE
Out = FALSE
Key = "Content-Type: charset deleter (2006.09.09) (in)"
URL = "web.archive.org/"
Match = "text/html; charset=*"
Replace = "text/html"
これが効いてたよ

374 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/02/19(月) 01:22:09 ID:7BUQV5gZ0]
>>372
>とりあえずフィルタの書き方は合ってる……?
残念ながら…

375 名前:名無しさん@お腹いっぱい。 [2007/02/19(月) 01:22:32 ID:s3bBYpWe0]

       /::^'´::::::::::::i、::::::::::::::::::::::::::::\
     ‐'7::::::::::::::::::::::::ハ:ハ::|ヽ:::;、::::::::::::丶
     /::::::::::::::/!i::/|/  ! ヾ リハ:|;!、:::::::l
    /´7::::::::::〃|!/_,,、   ''"゛_^`''`‐ly:::ト   
      /|;ィ:::::N,、‐'゛_,,.\   ´''""'ヽ  !;K
        ! |ハト〈  ,r''"゛  ,       リイ)|    死ねばいいと思うよ
          `y't     ヽ'         //
         ! ぃ、     、;:==ヲ   〃     
         `'' へ、   ` ‐ '゜   .イ
              `i;、     / l         
                〉 ` ‐ ´   l`ヽ
            / !        レ' ヽ_


376 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/02/19(月) 03:51:43 ID:JCVsqpGD0]
>373
それ、自分が書いたやつですな。

>372
それだと書き換えている意味がないわな。化けて当然。
Shift_JISだろうとUTF-8だろうと、
文書の中身とヘッダの文字コードが一致していなければ化ける。
web.archive.org の管理者が適当にUTF-8を指定しているのが原因なので、
web.archive.org の管理者が改善してくれればいいのだが。

377 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/02/19(月) 04:57:29 ID:3/veHM8c0]
おまえが書いたから何なんだ



378 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/02/19(月) 05:20:58 ID:Z4fMRv340]
自己主張したい年頃なのさ。

379 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/02/19(月) 06:10:58 ID:ZEWRH1fl0]
答えてくれてるのに何故叩く?
文句言うなら、何のレスも返さない372のほうだろ。

380 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/02/19(月) 15:09:53 ID:Jr1TlpmL0]
YouTubeのタイトル文字化けを直すフィルタってありませんか?

381 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/02/20(火) 11:00:51 ID:QUSe3g/S0]
叩きたいお年頃なのさ。

382 名前:372 mailto:sage [2007/02/21(水) 02:57:48 ID:QShqnMMI0]
チェック怠ってて済みません。

>>373
わざわざ調べてくれてありがとう……! 感無量です。バッチリです。

>>374
……出直してきますっ。

>>376
そもそもの間違いは、フィルタ名に Content-Type: が入ってなかったことでした。鬱死。
以下のフィルタで特定の日本語ページの Internet Archive は文字化けしなくなりましたが、
ドイツ語ページとかだと当然のように化けます。役立たず。

[HTTP headers]
In = TRUE
Out = FALSE
Key = "Content-Type: web.archive.org charset (in)"
URL = "web.archive.org/"
Match = "text/html; charset=UTF-8"
Replace = "text/html; charset=Shift_JIS"

383 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/02/21(水) 23:44:53 ID:n3eFdYWu0]
質問なんだけど、Yahooの広告を消す場合、Yahooの広告だけを消すフィルターを入れるのと、リストがたのフィルターで登録しておくのではどちらが処理的にかるいのでしょうか?

384 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/02/22(木) 01:04:13 ID:1euCCJ0E0]
自 分 で 調 べ ろ

385 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/02/22(木) 01:19:28 ID:eNeppJ8q0]
どうなんだろう。
1GHz超えなら$LSTであらゆるmatchぶち込んでも全然気にならないけど。
場合わけしてみると
1. URLマッチングでyahoo.co.jpだけでTXT内では$URL(tv.yahoo.co.jp)とは書かないであらゆる*.yahoo.co.jpにmatchさせる。
2. URLマッチングでyahoo.co.jpだけにして$LSTのTXT内で$URL(tv.yahoo.co.jp)
として分岐させる。
3.$LST使わないでtv.yahoo.co.jp、weather.yahoo.co.jp各々フィルタ作成。
俺はわからない・・w

386 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/02/22(木) 01:59:37 ID:zkphvezb0]
Google Image: Image Change (070124)
また駄目になりました。
お願いします。

387 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/02/22(木) 02:03:49 ID:XwojGfDn0]
[Patterns]
Name = "Google Image: Image Change (070115)"
Active = TRUE
URL = "images.google.co(m|.jp)/"
Limit = 128
Match = "<a href="\+e\+b.m\+"><img"
Replace = ""+(b.a=b.c='')+""
"<a target=\\"_blank\\" href=\\""+decodeURIComponent(e.match(/[?&]imgrefurl=([^&]+)/)[1])+"\\">ref</a> / "
"<a target=\\"_blank\\" href=\\""+(b.b.indexOf("://")<0?"":"")+b.b+"\\">img</a>"
"<br><img ondblclick=\\""
" this.src = '';"
" this.style.display = 'none'"
"\\" onclick = \\""
" if (this.a) {"
" this.src = this.a;"
" this.a = 0"
"} else {"
" this.a = this.src;"
" this.src = '"+(b.b.indexOf("://")<0?"":"")+b.b+"'"
"}\\"$STOP()"



388 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/02/22(木) 02:06:09 ID:N4Nfl5NR0]
googleイメージがまた戻ってるw
ふるいの消しちゃったよ・・・

389 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/02/22(木) 02:08:21 ID:N4Nfl5NR0]
ってログ読んでるうちに書き込みが!
ばっちり動いたよ。GJ!

390 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/02/22(木) 02:25:52 ID:zkphvezb0]
>>387
ありがとう。でもうちの環境だと駄目みたいです。
それでこれに戻したらいけました。
[Patterns]
Name = "google image (061103) +js+"
Active = TRUE
URL = "images.google.co(.jp|m)/"
Limit = 1024
Match = "var\ e=\"/imgres\?imgurl=\"\+\0\+\"\&imgrefurl=\"\+\1\+[^;]+;c\+=[^;]+;[^;]+;[^;]+;$STOP()"
"$SET(9=var e=unescape(\1.match(/^[^&]+/));var proxvar=\0;"
"c+="<a href="+e+" target=_blank>imgref</a> / <a target=_blank href="+unescape(proxvar)+">img</a><br>"
"<img ondblclick='this.src="+'"";this.style.display="none"'"
"+"' onclick='if(this.a){this.src=this.a;this.a=0}else{this.a=this.src;this.src="+'"http://'+unescape(proxvar)+'"}'"
"+"' src=/images?q=tbn:"+b.d+proxvar+">";)"
"|"
"<a href=/imgres\?imgurl=[^&]+\&imgrefurl=([^&]+)\0[^>]+> <img[^>]++(src=/images\?q\=tbn:[^:]+:([^ >]+)\2)\1*</a>"
"$SET(9=<a href="$UESC(\0)" target="_blank">imgref</a> / <a href="\2" target="_blank">img</a><br>"
"<img ondblclick="this.src='';this.style.display='none'" onclick="if(this.a){this.src=this.a;this.a=0}else{this.a=this.src;this.src='\2'}"\1</a>)"
Replace = "\9"



391 名前:名無しさん@お腹いっぱい。 [2007/02/22(木) 18:51:13 ID:n67R39dJ0]
このソフトで、www.google.com/analytics/への記録を残さないために、
該当するスクリプトを読み込まないようにとかって可能ですか?

392 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/02/22(木) 21:40:12 ID:doWBmrzQ0]
[HTTP headers]
In = FALSE
Out = FALSE
Key = "URL: 2ch redirector (oo.2ch2.net) (in)"
Match = "$RESP(302*)[^.]+.(2ch.net|bbspink.com)/test/read.cgi/"
Replace = "$JUMP(oo.2ch2.net/?q=\u)"

In = FALSE
Out = FALSE
Key = "URL: 2ch redirector (p2.2ch.net) (in)"
Match = "$RESP(302*)http://([^.]+.(2ch.net|bbspink.com))\1/test/read.cgi/\2/([^/]+)\3(/\4|)"
Replace = "$JUMP(p2.2ch.net/p2/read.php?host=\1&bbs=\2&key=\3&ls=\4)"

In = FALSE
Out = FALSE
Key = "URL: 2ch redirector (p2.chbox.jp) (in)"
Match = "$RESP(302*)[^.]+.(2ch.net|bbspink.com)/test/read.cgi/"
Replace = "$JUMP(p2.chbox.jp/read.php?url=\u)"

In = FALSE
Out = FALSE
Key = "URL: 2ch redirector (snapshot.publog.net) (in)"
Match = "$RESP(302*)[^.]+.(2ch.net|bbspink.com)/test/read.cgi/"
Replace = "$JUMP(snapshot.publog.net/dat.php?url=\u)"


↑が効かないみたいですので、修正お願いします。

393 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/02/22(木) 22:43:54 ID:doWBmrzQ0]
すいません。見れました。↑は無視してくださいゥ。

394 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/02/23(金) 18:52:01 ID:AiikQHrw0]
www.youtube.com/watch?v=c3-b0dnGscg
はバイパスしたいけど、
www.youtube.com/watch?v=c3-b0dnGscg&session=
はバイパスしたくないってのが書けないので助けてください

*youtube.com/watch\?v=([A-Za-z0-9_-]&[^\&])+

これで&が入ってるものを除外できるかと思ったんだけど
書き方が悪いのかそもそもを理解してないのかも分からんのです
何かと除外のところで躓いてあきらめてる

395 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/02/23(金) 20:32:36 ID:En/mF5T00]
www.youtube.com/watch?v=(^*[&])
だと簡単すぎるかな

396 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/02/23(金) 20:42:26 ID:k6yS9SQt0]
[^/]++youtube.com/watch\?=[^&]+(^?)

とすれば「URLは?を含むことがない」という条件を与えられる
(^?)は「もう何も続きませんよ」という印
もしかしたら[^\&]としないと動かないかもしれないけど、それは自分で検証してくれ

397 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/02/23(金) 21:57:27 ID:1mJJ69aB0]
*youtube.com/watch\?v=[^&]+(^?)



398 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/02/23(金) 21:58:27 ID:1mJJ69aB0]
1時間パソコンほったらかしにしてるあいだにかぶったorz

399 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/02/23(金) 22:06:10 ID:AiikQHrw0]
あんがと!!!
なんとかできた!
これで夕立がまた使えそうです

400 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/02/25(日) 00:51:04 ID:SRmz9w6X0]
>>391
ADListに www.google-analytics.com/urchin.js を追加。

401 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/02/25(日) 01:24:02 ID:7eejlz4U0]
>>354
"2ch thread list Tabler [HOME]-R subback [070216]"
何故かまた効かなくなりました。
ページソースを見ても問題ないような気がするのですが・・・
お手数ですが、再び改訂版をお願いいたします。

402 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/02/25(日) 18:04:00 ID:K9lZt87Q0]
>>401
俺の環境ではちゃんと動いてるんだが

403 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/02/25(日) 22:53:43 ID:FZ67Frsr0]
390のフィルター、一昨日はいけたけどまたダメになってるね…
なんなんだGoogle image

404 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/02/25(日) 23:33:03 ID:ddW5q+L40]
387は問題なく使えてる

405 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/02/26(月) 00:16:46 ID:EbqblFqF0]
>>404
それが>>390と同じでうちだと>>387は動かないんだよ
なんだろうね

406 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/02/26(月) 00:30:43 ID:Fn52+iDi0]
なにか他のフィルタが干渉してるのでは?
例えばAdd Link

407 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/02(金) 12:05:17 ID:dihVs1M00]
静かですね



408 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/02(金) 17:04:14 ID:eAbtRiGR0]
うちも >>405と同じでだめです。
4.4 4.5j フィルター全部はずしてもどっちもダメ
わがんね

409 名前:名無しさん@お腹いっぱい。 [2007/03/02(金) 18:51:02 ID:KOh5VbwA0]
スクリプトタグ無いの
urchinTracker();
って部分だけフィルターで消したいのですが、
タグ内の一部分だけ消す方法が良くわかりません。

どなたか教えてくれませんか?

410 名前:名無しさん@お腹いっぱい。 [2007/03/02(金) 20:18:25 ID:fhmIoiDy0]
>>387とか>>390って何?
Googleイメージで検索して出た画像クリックするとホームページじゃなしに
元のサイズで画像を表示するってフィルタ↓使ってたんだけど、使えなくなった
これの新しいのってあります?>>387>>390は違うみたいでした

Name = "Google: Replace natural sized img [2006.04.20]"
Active = TRUE
URL = "images.google.co(m|.jp)/im(ag|gr)es\? $TYPE(htm)"
Limit = 512
Match = "(<a\s[^>]++href=)\#$AV((/imgres\?imgurl=[^&]+(^*\&frame=small)?+)\0)(^(^[ >]))"
"$SET(#="\0&frame=small")|"
"<a\s[^>]++href=$AV((http(://|s://)?+)\0)[^>]+>"
" <img\s[^>]++src=$AV(/images\?q=tbn:[^:]+:$TST(\0))[^>]+> </a>"
"$SET(#=<img style="margin: 5px; border-style: none" src="\0">)$STOP()"
Replace = "\@\r\n"

411 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/02(金) 20:33:19 ID:HkvjeHx70]
ようつべの認証が必要なページをスルーする方法ない?

412 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/02(金) 20:34:32 ID:HkvjeHx70]
ちなみに直接flvにリダイレクトすればflv動画保存はできた。
でも動画タイトルとか説明とか載ってるページが見たい

413 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/02(金) 20:42:55 ID:YSlvBEF80]
>>410
387を使ってるけどクリックすると元画像サイズになるよ
>>409
文面通りの意味だと
Limit 1024 (適当)
Match <script\s\0urchinTracker\(\);\1</script>
Replace <script \0\1</script>
こういう事?
もっと深い意味があるのかな

414 名前:名無しさん@お腹いっぱい。 [2007/03/02(金) 20:45:52 ID:fhmIoiDy0]
>>413
ありがとう
マジですか、俺>>387>>390ともに試したけど全然だめでした
もしかして、Javaとかオンじゃないとだめなのかなあ
>>410のはJavaなしでもいけたんだけど、う〜ん

もう一度試してきます

415 名前:名無しさん@お腹いっぱい。 [2007/03/02(金) 20:53:36 ID:fhmIoiDy0]
だめだ、出来ないorz
Firefox使ってるんだけど、もしかしてIE限定かな?

416 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/02(金) 20:55:22 ID:YSlvBEF80]
>>414
ほんとだ
Script Offだと効かないね
387効かないって人が多かったのはそのせいだったのか

417 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/02(金) 20:56:49 ID:YSlvBEF80]
ちなみに私はIEエンジンのタブブラウザですね



418 名前:名無しさん@お腹いっぱい。 [2007/03/02(金) 21:00:20 ID:fhmIoiDy0]
>>416
そうなんだ
Firefox2.0.0.2でJavaオフ = 普通にホームページに飛ばされる
Firefox2.0.0.2でJavaオン = サムネイル画像すら表示されず、なすすべなし(泣)

誰かFirefox用の>>410のフィルタ作ってくださいm(_ _)m

419 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/02(金) 21:14:30 ID:RWK0oXTa0]
FxならgreasemonkeyいれてGreased Lightbox使った方が便利だと思う
GoogleImage以外でも使えるし。


420 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/02(金) 21:46:35 ID:WUebI47X0]
このスレはOperaユーザが多いからそのせいもあるんじゃない?

421 名前:名無しさん@お腹いっぱい。 [2007/03/02(金) 22:51:58 ID:fhmIoiDy0]
>>419
Greasemonkeyは入れてるけど、Greased Lightboxってのは初耳です。
さっそく探してきます、ありがとう

422 名前:409 [2007/03/02(金) 23:04:03 ID:KOh5VbwA0]
>>413
どうもです。
狙いはその通りで、試してみましたが、
ロード時に読み込まれるので、後ろの</script>が読み込まれる前に
urchinTracker()を呼び出そうとするみたいで、

とりあえず、後ろの</script>を削って
Match <script\s\0urchinTracker\(\);\1

でやってみたら動いてるようです。

こんな感じでいいんでしょうか?

423 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/03(土) 00:09:34 ID:kMgiw1TB0]
>>422
ん、テストページが無いので良くわからない。
入れ子でおかしくなるかもなので
Match
$NEST(<script\s[^>]\0+>,\1urchinTracker\(\);\2,</script>)
Replace
<script \0>\1\2</script>
のほうが安全かな。

424 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/03(土) 06:33:14 ID:KNGGVaeK0]
>>422
>>413を使えばブラウザにurchinTracker();が削除されHTMLたソースが渡されるから
urchinTracker();が動くなんてことはありえないよ。

425 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/03(土) 06:34:55 ID:KNGGVaeK0]
↑フィルターが正しく動いてればの話ね。 limitが足りなかったとかそういう原因かも知れない。

426 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/03(土) 06:53:45 ID:UgcnQ/NE0]
ttp://dat.2chan.net/l/futaba.htm
上の掲示板への特定のIPからの書き込みを返信の場合はそれのみ
投稿の場合は広告、画像から子ツリーまですべて
痕跡も残さず消せるフィルターを作ってもらえないでしょうか
おねがいします

427 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/03(土) 07:07:54 ID:KNGGVaeK0]
ふたばのオミトロンスレ見れよ



428 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/03(土) 07:13:16 ID:UgcnQ/NE0]
気づきませんでした
いってきます

429 名前:409 [2007/03/03(土) 09:31:45 ID:fwIzo8pg0]
>>423
>>424
どうもです。
いろいろ勘違いがあったみたいです。
とりあえず以下のようにしました。

まれに
urchinTracker();
に引数が入ってるのがあるのでMatchに*を入れてみました。
後はBounds指定ってこれだと意味ないんでしょうか?

[Patterns]
Name = "Kill urchinTracker"
Active = TRUE
URL = "$TYPE(htm)"
Bounds = "<script($INEST(<script,</script)</script>|*)"
Limit = 1024
Match = "<script\s\0urchinTracker\(*\);\1</script>"
Replace = "<script \0\1</script>"

430 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/03(土) 11:08:29 ID:KNGGVaeK0]
inestの使い道が違う。 この場合はnest。

$NEST(<script,\1urchinTracker\(\);\2,</script>)

これで十分だからboundsはいりません。

431 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/03(土) 19:14:24 ID:7WHuJ2Be0]
>>420
Operaなら確かGreasemonkeyいれないで直にGreased Lightbox使えた気がする。


432 名前:409 [2007/03/03(土) 19:43:56 ID:fwIzo8pg0]
>>430
ありがとうございます。NESTの件、了解しました。

また別件というか別パターンが出てきました。
<a href="/index.html" onclick="javascript:urchinTracker('/sample/2007/misc/');">
みたいな感じでタグのイベント属性で追加されるパターンがあるみたいです。

なんかこのパターンを考えるとキリが無いのですが、
このパターンも消すとするとフィルターは別途書く必要があるので負荷が高くなるので、
ダミーのスクリプトを入れるフイルターを作った方が良いかと思うようになりました。

<head>タグの直後あたりにスクリプトブロック込みでダミーのurchinTracker()ファンクションを入れる
事で対応しようかと思い、以下の感じで作りましたが、なんか手抜きというか情けないような内容です。
アドバイスいただけますでしようか。

[Patterns]
Name = "New HTML filter"
Active = TRUE
URL = "$TYPE(htm)"
Limit = 256
Match = "<head>"
Replace = "<head>"
"<script type="text/javascript">function urchinTracker(){};</script>"

433 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/03(土) 20:41:14 ID:kMgiw1TB0]
ひとつのフィルタに纏める事できるよ
match欄
matchpattern1 $SET(9=replacepattern1)|
matchpattern2 $SET(9=replacepattern2)
replace欄
\9
みたいな感じ

434 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/03(土) 20:59:36 ID:kMgiw1TB0]
具体的に書くと
例えばこんな感じ。
これだとurchinTrackerの記述のあるscriptタグ全部消しちゃうけど。
Match
$NEST(<a\s[^>]++href=$AV(*urchinTracker*),</a>) $SET(9=)|
$NEST(<script\s[^>]+>,*urchinTracker*,</script>) $SET(9=)
Replace
\9
>>432なんだけど
空の関数の後に実際のソースに実態があれば効かないんじゃない?
テストしてないからわからないけど

435 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/03(土) 21:01:30 ID:NAXtb9SN0]
>>432
その方法なら1ページにつき一度のマッチングで済むので$STOPコマンドが使えますよ。

436 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/03(土) 21:24:52 ID:jp1tAzDC0]
<script\s[^>]+>

437 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/03(土) 21:26:50 ID:jp1tAzDC0]
早漏した

<script\s[^>]+>って<script>にマッチしたっけか
こっちで確認した限りではしないようだが



438 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/03(土) 21:36:53 ID:pF+sHsLa0]
あぁ
<script>だけの場合? それは想定外でした。

439 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/04(日) 00:06:25 ID:tBx8TrfH0]
↓これじゃだめなの?

400 :名無しさん@お腹いっぱい。:2007/02/25(日) 00:51:04 ID:SRmz9w6X0
>>391
ADListに www.google-analytics.com/urchin.js を追加。

440 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/04(日) 00:19:46 ID:73lxeMGz0]
これがONになっているとアマゾンで検索したときに画像が出ません。
どうしてですか?

Name = "Banner Blaster (limit text)"
Active = TRUE
Multi = TRUE
Bounds = "<a\s[^>]++href=*</a>|<input*>|<ilayer*</ilayer>|<iframe*</iframe>|<object*</object>"
Limit = 900
Match = "(<(ilayer|iframe|object)*|\1<i(mg|mage|nput)*src=$AV(*)*>\3)"
"&(*(href|src)=$AV($LST(AdKeys)*)|"
"**<i(mg|mage|nput)\s(*>&&"
"(*width=[#460-480]&*height=[#55-60]*)|"
"(*width=[#88]&*height=[#31]*)))"
"&(*alt=$AV((?+{18})\2*|\2)|$SET(2=Ad))"

441 名前:409 [2007/03/04(日) 01:13:16 ID:9b7LgS8o0]
>>434
本物の関数は常に別ファイルで読み込まれるので、AdlistでBlockしてます。

>>435
どうもです。
HEADなんで$STOPは効果的ですね。

>>439
それだけだと、関数の呼び出しが残っているので、
Javascriptエラーが毎回でるので。

結果はこんな感じでにしました。
[Patterns]
Name = "Kill urchinTracker"
Active = TRUE
URL = "$TYPE(htm)"
Limit = 256
Match = "<head*>$STOP()"
Replace = "<head>"
"<script type="text/javascript">function urchinTracker(){};</script>"

このフィルターは他人の所に足跡を残したくないのではなくて、
自分が管理してるサイトの分析に自身のアクセス記録を入れない為なので、
実際にはURLには実サイト名が入ってます。

Googgle Anlytics側にもフィルターがあるのですが、
出先で内容を確認したりする時のまでフォローしきれないので。

442 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/04(日) 07:26:16 ID:2pUUjDDU0]
OperaでUAがMozilla含まれてないからこれでUA変更してるんだけど
バージョン変わるたびに修正するの面倒だから変更するときに
変更元のUAのバージョンつけられないかな?

今こんな感じの設定
key:User-Agent: Opera 9 (out)
URL:
Match:Opera
Replace:Mozilla/5.0 (compatible; MSIE 6.0; Windows NT 5.1; U; ja) Opera/9.10

443 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/04(日) 13:29:48 ID:hlyDBHQO0]
[HTTP headers]
In = FALSE
Out = TRUE
Key = "User-Agent: Opera (out)"
Match = "Opera/\0(\s|(^?))"
Replace = "Mozilla/5.0 (compatible; MSIE 6.0; Windows NT 5.1; U; ja) Opera/\0"

444 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/04(日) 13:41:01 ID:2pUUjDDU0]
>>443
ありがとうございます〜

445 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/05(月) 23:25:27 ID:4aRF74xu0]
www.jtw.zaq.ne.jp/animesong/
↑のサイトの歌詞を表示してるページで
コピペや右クリックができるフィルタ希望です


446 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/05(月) 23:36:20 ID:E9YpSH1g0]
華麗にスルー

447 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/05(月) 23:41:29 ID:2RxO/zSP0]
www.jtw.zaq.ne.jp/animesong/y.js への接続を遮断するだけ



448 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/05(月) 23:42:34 ID:gh6EZIJM0]
>>445
from
<BODY BGCOLOR="#CCFF99" onselectstart="return false" oncontextmenu="return false">
to
<BODY BGCOLOR="#CCFF99" onselectstart="return true" oncontextmenu="return true">

449 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/06(火) 12:11:59 ID:iB1jvKZy0]
任意のタグ群から任意の要素群を除去するフィルタを書いてみた。
とりあえずはbodyとimgからoncontextmenu, onselectstaart, oncopyを除去できる感じに。
ひどいスパデティ状態だけど要は<body >みたいなスペースが入らないようにしたかったので。

[Patterns]
Name = "oncontextmenu deleter"
Active = TRUE
Limit = 256
Match = "$NEST(<(body(^(^\s))|img(^(^\s)))\#,((\s|)on(contextmenu|selectstart|copy)=$AV(*)|((\s|)[^=\s]+(=$AV(*)|))\#)+,>)"
Replace = "<\@>"

450 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/06(火) 12:13:41 ID:iB1jvKZy0]
書き忘れてたけどサンプル
before : <body onselectstart="return false" oncontextmenu="return false" bgcolor="#ccff99">
after : <body bgcolor="#ccff99">

451 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/06(火) 14:43:34 ID:9zhYO6rw0]
Firefox のように、ブラウザ側で
コンテキストメニューを強制的に使用可能にする手もある。フィルタ不要だし。

452 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/06(火) 19:03:44 ID:mTAaejSY0]
>>449
要望者ではないがGJ

453 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/06(火) 20:12:47 ID:5wFR0ABi0]
>>449
恐ろしく細かなところなんだが
JISコードのページで「alt="連携"」と言う文字が含まれてたりするとダメだよね?

2バイト目が「"」とかの文字だと$AV系は誤爆するから

454 名前:think ◆MM0nnAOCiQ mailto:sage [2007/03/06(火) 20:57:29 ID:74I35w2I0]
>>449-450
そのフィルタは <body bgcolor="#ccff99"> にもマッチしてしまう問題を持っていますね。
((\s|)[^=\s]+(=$AV(*)|))\# を (([^>]++)\#\son(contextmenu|selectstart|copy)=$AV(*))+{1,*} に変更してはどうでしょうか?

[Patterns]
Name = "oncontextmenu deleter type2 [2007/03/06]"
Active = TRUE
URL = "$TYPE(htm)"
Limit = 256
Match = "<(body|img)\#(^(^\s))"
"(([^>]++)\#\son(contextmenu|selectstart|copy)=$AV(*))+{1,*}"
Replace = "<\@"

455 名前:名無しさん@お腹いっぱい。 [2007/03/06(火) 22:42:58 ID:+rFDbjSB0]
Proxymoitronのフィルターなんですけど 以下のレスを参考にしたんですが、
もう少しキレイにするならどうしたらいいでしょう。


>【デボジット】Google AdSense初心者スレ 8PIN目
>pc9.2ch.net/test/read.cgi/affiliate/1171772889/370
>
>370 名前:クリックで救われる名無しさんがいる[] 投稿日:2007/03/05(月) 08:17:45 ID:5uG+lPlH0
>こんなの見つけたんだけど便利かな?
>ttp://isawseashell.blogspot.com/2007/02/adsense.html
>
>俺にはちょっとハードル高いんだけど、安心感が得られるならやろうかと思ってる。

[Patterns]
Name = "Adsense"
Active = TRUE
URL = "*.googlesyndication.com/$TYPE(htm)"
Limit = 1024
Match = "<a\s\0href="*123456789012"
Replace = "<a \0 href="about:blank"

これでやると、about:blank&nm=13 みたいに about:blnakの後ろにパラか残ってしまうんです。

実際のURLは
pagead2.googlesyndication.com/pagead/iclk?sa=l&ai=&num=1&adurl=http://hoge.hoge/&client=ca-pub-123456789012&nm=17
みたいに入ってきてるんですが、タグ全体がフレームの中なので見えなくて どうやったら調べたりしたらいいかわからず困ってます。

456 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/06(火) 23:18:09 ID:ToBVIAPe0]
マッチの部分をhref=$AV(*12345678912*)
にすりゃいいのでは。about:blnakはともかくProxymoitronってなんやねん。

457 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/07(水) 17:22:42 ID:/8mO2Jfl0]
$NEST(<a\s(*href=$AV(\1)*|)&(*title=$AV(\3)*|)&(^(*(href|title)*)\7|)[^>]+>,\0,</a>)
aタグのhrefとtitleの値を\1,\3に順不同で入れるのには成功したんですが、
それ以外のものを\7に入れる事ができません。
とりあえず(^(*(href|title)*)\7|)としてますが効きません。
助言お願いします。
ソース例
<a href="/aaa/bbb/ここは1に" title="これは3に" class="これは7に">ここは0に</a>



458 名前:449 mailto:sage [2007/03/07(水) 18:08:54 ID:JUv0ENxk0]
思ったよりも反響があったようでビックリ。

>453
なるほど、そういうケースもあり得るのでしたら汎用フィルタとした使うためには手を加える必要がありますね。
手っ取り早いのは$AV(*)を使う代わりに [^=]+=[^ ]+ とすることでしょうか。
これでもまだ誤爆例がありましたら教えてください。
#ところで今までずっと[^\s]としていたのですがこれは大きな誤りであると分かりましたorz

>454
確かに、例えば <body> で終わらない全てのbodyタグに(極端な例では<body >にも)マッチしますが、そこに何か問題があるとは思えません。
<body bgcolor="#ccff99"> を挙げれば、それ全体を\#に代入して<\@>で出力しているので一見してムダではありますが。
そこで試しにプロファイルで速度比較をしてみました。
私のver1とthinkさんのver2では、ver2がver1の1.5倍多くの時間が掛かるようです。
<img alt="hogehoge" src="hogehoge.jpeg"> を29986バイト分だけコピペしたサンプルでの計測です。
<img alt="hogehoge" src="hogehoge.jpeg" oncopy="hogehoge"> とした場合も速度比はほぼ同じでした。
もしマッチングさせたくないという場合にはver2を選択すると良いでしょう。

459 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/07(水) 18:16:46 ID:eYPYjnoZ0]
肝心の445が出てこない件

460 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/07(水) 18:23:04 ID:JUv0ENxk0]
>457
目的がよく分からなんのですが、\1と\2と\3と\0に属性値を入れるわけですね。
\1はhrefに対応しなければならないんですか?
たいていの場合は必ずしもそういう対応関係を成り立たせなければならないわけではないと思いますが。
例えば
(href|title|((^(href|title)[^=])+))\1=$AV(\2) \s (href|title|((^(href|title)[^=])+))\3=$AV(\4) \s (href|title|((^(href|title)[^=])+))\5=$AV(\6)
とでもすれば\1と\2や\3と\4はセットなので、何が入ろうともかまわないということになります。
これで問題があるかはフィルタで何をしたいかによります。

ちなみにアスタリスク"*"をそういうふうに使う場合は
aタグを$NEST()で独立させたほうが良いです。
$NEST($NEST(<a\s,*hogehoge*,>),\0,</a>)

もう一度フィルタの目的をよく考えてから作り直しては?

461 名前:449 mailto:sage [2007/03/07(水) 18:28:11 ID:JUv0ENxk0]
>458について日本語のミスがありましたorz
>私のver1とthinkさんのver2では、ver2がver1の1.5倍多くの時間が掛かるようです。
1.5倍の時間が掛かる、もしくは0.5倍多くの時間が掛かる、に訂正します。
例えばver1で2sec要する場合にver2はおよそ3sec要します。

462 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/07(水) 18:36:28 ID:/8mO2Jfl0]
>>460
目的はtitle欄にhref以下のurlその他をぶち込んでマウスを当てると見えるようにするためです。
ORで分岐すると順不同(hrefの前にtitleが来たり)のとき面倒なので&を使ってます。
ですから>>457の場合だとreplece欄でtitle="\1 \3"みたいに続けて記述します。

463 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/07(水) 18:46:47 ID:JUv0ENxk0]
>462
つまりtitle要素があれば中身をhrefで書き換え、title要素がない場合はtitle="href属性値"を追加するということ?
言い換えればtitle要素があれば除去し、title="href属性値"を追加する、とでもすればうまくいきそうですな。
やり方はいくつもあると思うけど私ならこうやります。
その場合は&を使うよりはスタックを使ったほうがよさそうです。

464 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/07(水) 18:57:41 ID:JUv0ENxk0]
チープな>449の焼き回しですが、一例として

マッチ欄
$NEST(<a(^(^\s)),(\s(title=$AV(*)|href=$AV(\0)|([^= ]+=$AV(*))\#))+,>)
置換テキスト
<a href="\0" title="\0" \@)


サンプル例
before : <a href="ljilfejalfejla" src="ljfiejlajflea" title="fea.fae">
after : <a href="ljilfejalfejla" title="ljilfejalfejla" src="ljfiejlajflea")

465 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/07(水) 19:06:34 ID:/8mO2Jfl0]
>>463
あらかじめtitleの無い場合は,titleにhrefを入れます。
titleのある場合は、既にあるtitle+hrefにします。
具体的には
<a href ="\1" title="\3 \1" \7>\0</a>
3は既にあるタイトルで空の場合もとりあえず入れときますw
記述してくださった$NESTの入れ子を試してみたところ7にその他のものが入ってくれました。
$NEST($NEST(<(a|area)\s,(*href=$AV(\1)*|)&(*title=$AV(\3)*|) \7,>),\0,</a>)
ただこれだと\7に既にあるhrefやtitleも入ってしまいますが
<a href ="\1" \7 title="\3 \1" >\0</a>
こうすれば大丈夫みたいです。
ありがとうございました。

466 名前:think ◆MM0nnAOCiQ mailto:sage [2007/03/07(水) 19:37:31 ID:O0RWiz+R0]
>>456
> そこに何か問題があるとは思えません。
"oncontextmenu deleter" でマッチすると、他のフィルタで <body> にマッチしなくなるという問題がありますが、"oncontextmenu deleter" を優先するなら些細な問題かもしれませんね。
アプローチの仕方が違うだけとも言えるので、好みの問題だと思います。

> 私のver1とthinkさんのver2では、ver2がver1の1.5倍多くの時間が掛かるようです。
検証お疲れ様です。
>454は読み取るバイト数が少ないので、速いと思っていましたが $NEST の方が速くなるんですね。
せっかくなので、速度重視で最適化してみました。(下記の状況で、+{1,*} が効かない理由は解りません)

[Patterns]
Name = "oncontextmenu deleter type3.1 [2007/03/07]"
Active = TRUE
URL = "$TYPE(htm)"
Limit = 256
Match = "$NEST(<(body|img)\#(^(^\s)),"
"\#\son(contextmenu|selectstart|copy)=$AV(*)"
"(\#\son(contextmenu|selectstart|copy)=$AV(*))+"
"\#,>)"
Replace = "<\@>"

ところで、>454で示したフィルタは "type2" であって、「最新のフィルタ」として掲示したわけではないですよ。(^^;
449氏の作成したフィルタを引き継いで改良したなんて、おこがましいことは言えません。
私の経験,ポリシーに則って作成した別のフィルタだと思っています。

467 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/07(水) 20:02:01 ID:JUv0ENxk0]
>466
一度マッチした部分にはほかのフィルタはマッチしないというのは不覚にも知りませんでした。
ちょっとしたテストをしてみましたが、確かにそのようです。
フィルタ同士でループしないようにとのことでしょう。
こうだと分かると何でもかんでもマッチングしてしまう>>449のフィルタは曲者ですね。
thinkさんの>466が正当な改良版だと思いますよ。
>456の段階では単にver違いという意味で書いたのですが。



468 名前:think ◆MM0nnAOCiQ mailto:sage [2007/03/07(水) 23:41:26 ID:O0RWiz+R0]
>>467
> 一度マッチした部分にはほかのフィルタはマッチしない
これは下記URLの「再帰的なマッチングを使う方法」を読むと、よく理解できると思います。

Tips and Tricks
ttp://www.pluto.dti.ne.jp/~tengu/proxomitron/help/Tips_And_Tricks.html

> >456の段階では単にver違いという意味で書いたのですが。
それは失礼しました。
ただ、ver違いというニュアンスだと後継版と受け取られがちなので、念のため釈明させていただきました。

469 名前:think ◆MM0nnAOCiQ mailto:sage [2007/03/07(水) 23:43:05 ID:O0RWiz+R0]
>>465
仰ることが正確に掴めていませんが...

> $NEST($NEST(<(a|area)\s,(*href=$AV(\1)*|)&(*title=$AV(\3)*|) \7,>),\0,</a>)
> <a href ="\1" \7 title="\3 \1" >\0</a>
どちらの表現でも、

<a id="test" title="string" href="URL">

のHTMLソースにマッチしないという問題が残っているようです。
>464の表現を使い回しするとこれに対応できますが、「全てのa要素にマッチしてしまう」という問題がまだ残ります。
HTML4.01仕様書によれば、

------------
ユーザエージェントは、CDATA型属性値の、冒頭あるいは末尾の空白文字を無視してよい。
(例えば「 myval 」を「myval」として解釈してよい。)
著者は、冒頭あるいは末尾に空白文字のある属性値を宣言することを避けるべきである。
www.asahi-net.or.jp/%7Esd5a-ucd/rec-html401j/types.html#type-cdata
------------

とあり、空白文字のみの属性値によるUAの動作を明示していません。(「してよい」は「しなくてもよい」とも受け取れる表現だからです。)
可能なら、「空の属性値」「空白のみの属性値」は避けるべきだと思います。






[ 続きを読む ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧](;´∀`)<385KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef