Proxomitron フィルタ ..
[2ch|▼Menu]
930:877
07/05/29 15:50:39 IJXIlbvO0
>>921
試作品が出来たので公開ます。 動作確認が不十分なので人柱版ということで。 効かないページがあればご報告下さい。
メンテのしやすさの面からリンクとinputを別々のフィルタにしました。

それとWEBフィルタでアフィ判定するのには限界があるので>>915さん紹介のフィルタを併用することをお勧めします。
WEBフィルタでの判定はサイト主がその気になれば簡単に回避されてしまいますので。

[Patterns]
Name = "Amazon Affiliate Kill - link [2007-05-29]"
Active = TRUE
URL = "$TYPE(htm)"
Limit = 2048
Match = "(<a\s[^>]++href=)\0$AV((http(s|)://([^/]++.|)amazon.(co.jp|jp|com)(:[0-9]+{1,5}|)[?/]"
"(((e|%65)(x|%78)(e|%65)(c|%63)/(o|%6f)(b|%62)(i|%69)(d|%64)(o|%6f)(s|%73)|(o|%6f))/"
"(A|%41)(S|%53)(I|%49)(N|%4e)/[0-9A-Z%]+{10,30}/|*(\?|%26|%3f|\&(amp(;|)|))(t|%74)"
"(a|%61)(g|%67)(\=|%3d)))\1([0-9a-z_%-]++{1,*}(-|%2d)(2|%32)(2|%32)"
"(^[a-z0-9]|%((3[0-9])|[46][1-9a-f]|[57][0-9a]))*)\2)"
Replace = "\0"\1AAK\2""

[Patterns]
Name = "Amazon Affiliate Kill - Form input [2007-05-29]"
Active = TRUE
URL = "$TYPE(htm)"
Limit = 512
Match = "<form\s[^>]++action=$AV(http(s|)://([^/]++.|)amazon.(co.jp|jp|com)(:[0-9]+{1,5}|)/*)$SET(amazonF=on)(^?)"
"|<input\s(([^>]++value=)\0$AV(\1-22)([^>]+)\2(^(^>))&&[^>]++name=$AV(tag)*)$TST(amazonF=on)"
"|</form(\s*|)(^(^>))$SET(amazonF=)(^?)"
Replace = "<input \0"AAK\1-22"\2"

931:名無しさん@お腹いっぱい。
07/05/30 01:27:58 Sa+Rv2gj0
とりあえずみんなフィルタまとめてWikiにあげてよ。

932:名無しさん@お腹いっぱい。
07/05/30 07:35:22 Hs0/ZwZ30
どんどんいろんなフィルターが追加されて何が必要かさっぱりわからん状況・・・
最近グーグルAD更新された?結果にスポンサーの枠がよくでるようになった

933:877
07/05/30 12:29:54 gxpyCAit0
おかしな挙動に遭遇したから報告。

[Patterns]
Name = "test ABC\0(^(^E))"
Active = TRUE
Limit = 256
Match = "ABC\0(^(^E))"
Replace = "ABC[\0]"

テスト用文字列: ABCDEF
結果: ABC[DEF]

結果は "ABC[D]" になるものと思っていたら何故か "F" までの文字列が代入されていた。
後ろに "E" があるかどうかの判定は出来ているが、代入時に "\0" が最長一致になっている模様。

>>929
think氏のサイトにありましたよ。>>1

934:名無しさん@お腹いっぱい。
07/05/30 19:51:08 yH+E72Rs0
>>933
それって、*(\0〜\9と同じ動作)は最後に使われると最長一致になるという既知の仕様じゃないかな。
URLリンク(abc.s65.xrea.com)

>>930
ポート番号は80番だけでいいんじゃないかな。
それと「amazon.co.jp:000080/」とか「amazon.co.jp:/」という表現もあるよ。
>>915みたいなヘッダフィルタだとポート番号は無視されるらしいけど。

ところで>>915が少し修正されてる。

935:877
07/05/30 23:22:27 gxpyCAit0
>>934
私がおかしいなと思った点は "(^(^E))" が後ろにあり、かつ "(^(^E))" にマッチしているにも
関わらず最長一致になることです。 ここに違和感を感じるのは自分だけかな。
ポート番号はマッチ判定する上で重要ではないので80に絞る必要は無いです。
httpsの場合は80じゃなく443になったりしますし。 今のところこの2つに絞っても問題無いですけど。

>「amazon.co.jp:000080/」とか「amazon.co.jp:/」
こういう書き方は他にも色々出来ますが対応させてたらキリが無いので・・・。

>ヘッダフィルタだとポート番号は無視される
これは無視されません。 お使いのブラウザがURLからポート番号(80)を消してるだけだと思います。

> >>915が少し修正されてる。
あれれ、>>930は修正前のフィルタを元に書いたものなのでこちらも修正が必要かも。

936:think ◆MM0nnAOCiQ
07/05/31 00:04:55 b8t/iUm00
>>933
詳しい原理は知りませんが、「アスタリスクの後に肯定先読みor否定先読みを置いても期待通りに動作しない」という印象を持っています。
ですので、

Match = "ABC\0(^(^E))"



Match = "ABC\([^E]+)0(^(^E))"

と書くことで、解決するのが妥当な線だと思います。
(解決法ではなく、原理を知りたいのだと思いますが、当座の打開策として書いておきます)

937:877
07/05/31 00:48:58 /3xElFsc0
>>936
ありがとうございます。 その方法は>>930の2つ目のフィルタで使いました。(Match欄の2行目)
3行目にも使うべきところがあったので後で修正しておきます。

原理は不明ですが動作的には下の2つは同じようです。

Match = "ABC\0(^(^E))"
Match = "ABC(\0&*E)"

>Match = "ABC\([^E]+)0(^(^E))"
これは Match = "ABC([^E]+)\0(^(^E))" ですねw

938:877
07/05/31 00:53:21 /3xElFsc0
>>930を更新しました。 >>915のフィルタの修正に対応、その他の微修正。

[Patterns]
Name = "Amazon Affiliate Kill - link [2007-05-31]"
Active = TRUE
URL = "$TYPE(htm)"
Limit = 2048
Match = "(<a\s[^>]++href=)\0$AV((http(s|)://([^/]++.|)amazon.(co.jp|jp|com)(:[0-9]+{1,5}|)[?/]"
"(((e|%65)(x|%78)(e|%65)(c|%63)/(o|%6f)(b|%62)(i|%69)(d|%64)(o|%6f)(s|%73)|(o|%6f))/"
"(A|%41)(S|%53)(I|%49)(N|%4e)/([^?]++/)++|*(\?|%26|%3f|\&(amp(;|)|))(t|%74)"
"(a|%61)(g|%67)(\=|%3d)))\1([0-9a-z_%-]++{1,*}(-|%2d)(2|%32)(2|%32)"
"(^[a-z0-9]|%((3[0-9])|[46][1-9a-f]|[57][0-9a]))*)\2)"
Replace = "\0"\1AAK\2""

[Patterns]
Name = "Amazon Affiliate Kill - Form input [2007-05-31]"
Active = TRUE
URL = "$TYPE(htm)"
Limit = 512
Match = "<form\s[^>]++action=$AV(http(s|)://([^/]++.|)amazon.(co.jp|jp|com)(:[0-9]+{1,5}|)/*)"
"$SET(amazonF=on)(^?)|<input\s(([^>]++value=)\0$AV(\1(-|%2d)(2|%32)(2|%32))"
"([^>]+)\2(^(^>))&&[^>]++name=$AV(*(t|%74)(a|%61)(g|%67))*)$TST(amazonF=on)"
"|</form(\s[^>]+|)(^(^>))$SET(amazonF=)(^?)"
Replace = "<input \0"AAK\1-22"\2"

939:877
07/05/31 01:02:10 /3xElFsc0
>>937に追記、これも同じ動作。

Match = "ABC(*E*)\0"

940:名無しさん@お腹いっぱい。
07/05/31 02:10:49 wK9IrGBg0
ブラクラ対策フィルタってもうないの?
よく張られてる奴は消えちゃってるんだけど

941:名無しさん@お腹いっぱい。
07/05/31 20:05:37 tsdvSsho0
誤爆が多く使い物にはならん
素直にキルURLファイルに登録したほうが安全

942:名無しさん@お腹いっぱい。
07/05/31 20:31:03 wK9IrGBg0
tableタグが5個以上あると消すみたいなフィルタ欲しい。
table大量に書いて処理落ちさせるブラクラ怖いよ

943:名無しさん@お腹いっぱい。
07/05/31 20:40:26 o3TfI2Z50
どなたか、目欄が空白の書き込みを削除するフィルターを作っていただけないでしょうか?
お願いします

944:名無しさん@お腹いっぱい。
07/05/31 21:21:44 gCj4V9Ad0
>942
table が入れ子で5つ以上ってこと?
単純に、1ページ中に table が5つ以上あったら消すってことになると
多くのサイトが消えてしまいそうだが……。
デフォルトのフィルタだったかに、多重階層の table をどうこうするフィルタがあったと思う。
"Kill Excessively Nested Tables" ってのが検索でかかったけど、これだったっけか?

945:名無しさん@お腹いっぱい。
07/05/31 22:51:02 Nw/2P6Ct0
>>943
とりあえずIEで確認。

Name = "test"
Active = TRUE
URL = "[0-9a-z]+.2ch.net/"
Limit = 100
Match = "<dt>[0-9]+ [%81][%46](^<a href=$AV(mailto:*)>)"
Replace = "<dt style="display: none;">"


946:名無しさん@お腹いっぱい。
07/05/31 23:43:34 9b4ITR+b0
>945
サンクス
書き忘れたんだけどfirefox+bbs2chreader新バージョン用でお願いしたいです

↓自分で変えてみたんだけどこれだとだめでした
Name = "test"
Active = TRUE
URL = "localhost:8823/"
Limit = 100
Match = "<dt>[0-9]+ [%81][%46](^<a href=$AV(mailto:*)>)"
Replace = "<dt style="display: none;">"

947:名無しさん@お腹いっぱい。
07/06/01 06:04:24 HnL7aYbc0
目欄が空白の書き込みとか専ブラ使おうぜ

948:名無しさん@お腹いっぱい。
07/06/01 06:12:00 eiRhC7fK0
スレ違いになっちゃうけど、専ブラだと空白の書き込みもあぼーんできるんですか?


949:名無しさん@お腹いっぱい。
07/06/01 06:40:03 HnL7aYbc0
そもそも専ブラ使わないで2ch見るほうがおかしいと思うけど。

>>944
デフォルトのフィルタじゃ見つからなかった。
よかったらそのフィルタのコードコピペして欲しい。

950:名無しさん@お腹いっぱい。
07/06/01 07:00:13 d7THi53f0
ある意味専ブラだと思うよ。
bbs2chreader+Foxage2chで専ブラの機能は果たしているだろう。

951:名無しさん@お腹いっぱい。
07/06/01 07:13:15 ZSm03RpP0
>949
どうやら toc 氏のブラクラ対策フィルタの中にあったもよう。
サイト閉鎖済だし、Internet Archive にも google のキャッシュにも見つからなかった。
誰かが保存していたら転載してもらうか、新規に書くしかなさそう。

952:名無しさん@お腹いっぱい。
07/06/01 08:20:46 tetpjSRU0
これ?

[Patterns]
Name = "Kill Excessively Nested Tables (2002/05/14)"
Active = TRUE
URL = "^$LST(SafeList)"
Bounds = "< (/|) table [^>]+>*< (/|) table [^>]+>*< (/|) table [^>]+>*< (/|) table [^>]+>*
< (/|) table [^>]+>*< (/|) table [^>]+>*< (/|) table [^>]+>*< (/|) table [^>]+>*< (/|) table [^>]+>*< (/|) table [^>]+>"
Limit = 2000
Match = "< table [^>]+>*< table [^>]+>*< table [^>]+>*< table [^>]+>*< table [^>]+>*"
"< table [^>]+>*< table [^>]+>*< table [^>]+>*< table [^>]+>*< table [^>]+>"
"$SET(#=<font size=1 color=red>[Excessively Nested Tables Found]</font>\k)"
Replace = "\@"



953:名無しさん@お腹いっぱい。
07/06/01 08:24:54 +TUjeUXE0
toc氏って Replace = "\@" が好きだよな
懐かしい

954:名無しさん@お腹いっぱい。
07/06/01 08:56:41 HnL7aYbc0
>>952
ありがとう

955:名無しさん@お腹いっぱい。
07/06/01 16:06:27 v9japScR0
Wikiのヘッダーなんだよ

956:think ◆MM0nnAOCiQ
07/06/01 16:50:16 99X490cV0
>>952
そのフィルタ正常に動作していますか?

<table>
<table><table><table><table><table><table><table><table><table><table>
</table></table></table></table></table></table></table></table></table></table>
</table>

をテストウインドウでテストしても、マッチしないのです。
また、<table> の入れ子をチェックしていないように見えます。

# <table> が入れ子で5つ以上存在するとき、<table> を削除した上で、以降の接続を切断するフィルタをWikiに投稿しておきました。

AntiBrowserCrasher - Proxomitron等に関するWiki
URLリンク(abc.s65.xrea.com)

957:名無しさん@お腹いっぱい。
07/06/01 17:56:19 ZSm03RpP0
変数で階層をカウントしないとだめかと思ったものの、こんなやり方があるんだね。

(^</table>)?)++
これは汎用的に使えそうなテクニックだね。

958:think ◆MM0nnAOCiQ
07/06/01 20:16:38 99X490cV0
mailtoストームを追記。

AntiBrowserCrasher - Proxomitron等に関するWiki
URLリンク(abc.s65.xrea.com)

しかし、最近はブラクラを見ませんね…。

959:think ◆MM0nnAOCiQ
07/06/01 20:41:53 99X490cV0
「FDD/CD-ROM アタック」を追加しました。

AntiBrowserCrasher - FDD/CD-ROM アタック
URLリンク(abc.s65.xrea.com)

「JavaScript でブラクラを出力する」はJavaScriptで書き換えれば回避出来そうです。

960:名無しさん@お腹いっぱい。
07/06/01 20:48:04 v9japScR0
>>959
URLリンク(jane.s28.xrea.com)

961:名無しさん@お腹いっぱい。
07/06/01 20:50:25 fLErzxDu0
>>958-959
Protocol src killerとLocal File Access Killerじゃダメなの?
URLリンク(www.pluto.dti.ne.jp)

962:think ◆MM0nnAOCiQ
07/06/01 21:47:03 99X490cV0
>>961
>958-959のブラクラは防げているので、良いと思います。
厳密には、「Local File Access Killer (2003/05/19)」で

<img title="file:///C:/test/test.html" src="./test.png">

にマッチしてしまう点が望ましくないですが…。

963:think ◆MM0nnAOCiQ
07/06/01 21:51:11 99X490cV0
「Local File Access Killer (2003/05/19)」で気になったのですが、conconクラッシャーの検出で

 <img src="c:/con/contact.html">

にマッチするのは、意図通りなのでしょうか?
ファイル名(フォルダ名)が「con」と「contact」なので、conconクラッシャーにならない気がしています。

ブラウザクラッシャー - Wikipedia
Wikipedia項目リンク
CONCON問題
URLリンク(web.archive.org)
FAT、HPFS、NTFS ファイル システムについて
URLリンク(support.microsoft.com)


「Protocol src killer (2003/05/18)」の

 $AV((...|URLリンク([^)(/|)("|>|\s))*)

も何のための表現かわかりませんでした。

964:名無しさん@お腹いっぱい。
07/06/01 22:06:27 VIdUoGC90
think暇だな。
一体何時間張り付いてるんだよ。

965:名無しさん@お腹いっぱい。
07/06/01 22:14:13 fLErzxDu0
>>963
conという名前のディレクトリは作れないんじゃない?

966:名無しさん@お腹いっぱい。
07/06/01 22:27:15 +OqPkeGU0
Vectorでダウンロードする意志があったら直ちにirvineに追加するように出来ませんか?

たとえばこの画面で
URLリンク(www.vector.co.jp)
ダウンロード・お支払いボタンを押したらirvineに登録させるようなやつです


967:966
07/06/01 22:48:15 +OqPkeGU0
htmlの解析は出来るんでしょうか???


ソフト紹介ページ(最初のページ)
URLリンク(www.vector.co.jp)

ダウンロード・お支払いのページ
URLリンク(www.vector.co.jp)
このページの中身で、
<a class="button" href="/download/file/ で始まる部分を検索して
/download/file/winnt/business/fh428922.htmlをゲット

先頭にURLリンク(www.vector.co.jp)を追加した先の内容から
「しばらく待ってもダウンロードが始まらない場合は」で始まる部分の後のアドレスが
ダウンしたいファイルのアドレスです・・・


968:think ◆MM0nnAOCiQ
07/06/01 23:07:19 99X490cV0
>>965
htmlにパスを書き込めれば、conconバグが誘発されるので、ディレクトリを作る必要はないと思います。

969:名無しさん@お腹いっぱい。
07/06/01 23:10:00 dovQaK750
conconクラッシャー対策って必要なのか?
NT系OSだと無効だが

970:名無しさん@お腹いっぱい。
07/06/01 23:56:46 ptD10WOa0
物理的ブラクラなんて年単位で遭遇してない気がするけど、今さら対策必要?

971:名無しさん@お腹いっぱい。
07/06/02 00:24:23 wfZMZyWs0
googleの検索結果の表示に、日本語とローマ字があった場合
ローマ字のみにクリアタイプが効いてしまって読みづらいんですが
何とかなるフィルタありませんか?

972:think ◆MM0nnAOCiQ
07/06/02 00:42:21 +H6u/Vo80
>>969-970
対策のためというよりは、興味本位ですw
せっかく、Wikiにページが用意してあるので、空いている欄を埋めてみようと。

最近のブラウザなら特別な対策を取らなくても問題ないと私も思います。
# 「FDD/CD-ROM アタック」がIE7で有効だったことには驚きましたが…。

>>971
使用しているブラウザはIE7ですか?

IE7 メモ - ページ表示領域でアルファベット文字が滲むようになりました
URLリンク(vird2002.s8.xrea.com)

973:名無しさん@お腹いっぱい。
07/06/02 01:25:25 wfZMZyWs0
>>972
いえ、ずっとie6です
リンク先見せてもらいましたけどie6だと
その項目すらないんですね
いつ頃かは覚えてないんですけどある日を境に
ローマ字だけクリアタイプかかった状態になったんです


974:名無しさん@お腹いっぱい。
07/06/02 01:56:10 zNmEYUT90
昔、特定の文字コードのページだか、
ブラウザで英語圏の言語を最優先にしてると、
英字部分がTimes New Romanになったことがある。
関係ないか。

975:966
07/06/02 02:34:09 7UwZaQ1R0
おねがいします

976:名無しさん@お腹いっぱい。
07/06/02 04:56:25 JVcp/xGU0
リストに入ってるサーバーの場合セキュリティソフトとかで、
リファラを遮断するような設定でも強制的に
リファラを送るフィルタ見たいなのが欲しいんだけどそういうのないかな?

977:名無しさん@お腹いっぱい。
07/06/02 07:37:01 YgFS8Afj0
オミトロン→そのソフト→サーバ だとどうしようもないが、
そのソフト→オミトロン→サーバ だと、既にRefererが消えているのでどうしようもない

978:965
07/06/02 08:10:28 3lmXyOmh0
>>968
ごめんそういう意味じゃない。
> <img src="c:/con/contact.html"> にマッチする意図
こんなパスは存在しないし、パスを指定している時点でそのページを疑った方が良い。

>>969
ブラクラページは1種類だけじゃなくて数十種類も仕掛けてることが多い。
ニュース速報系の板でそういのをよく見かける。
conconは目印にし易いから、その時点で\kすれば、他の未知のブラクラも防げる可能性がある。

979:名無しさん@お腹いっぱい。
07/06/02 15:21:42 0qg3cgFC0
>>978
なるほど、すまんかった


最新レス表示
スレッドの検索
類似スレ一覧
話題のニュース
おまかせリスト
▼オプションを表示
暇つぶし2ch

4324日前に更新/385 KB
担当:undef