Proxomitron フィルター作成スレッド Part6 at SOFTWARE
[2ch|▼Menu]
602:名無しさん@お腹いっぱい。
07/03/22 16:25:24 uFlrt95P0
htaccessを無効にするフィルタ希望
ていうかURLリンク(karen.saiin.net)を表示させるフィルタ希望

603:名無しさん@お腹いっぱい。
07/03/22 16:37:01 IfmMON990
( ゜σ・・ ゜) ホジホジ

604:名無しさん@お腹いっぱい。
07/03/22 16:58:02 h6gQqGsT0
>>602
Content-Encoding: text/html; charset=csiso2022kr

605:名無しさん@お腹いっぱい。
07/03/22 17:12:43 IfmMON990
つ SJIS

606:名無しさん@お腹いっぱい。
07/03/22 20:49:05 i23UPNfh0
>602に行ってみたけど、
ヘッダで文字コードを詐称されると、フィルタがまったく効かなくなるね。
これは Proxomitron を無効化させるための手段になる。危険だな。

607:名無しさん@お腹いっぱい。
07/03/22 21:03:40 HF+LFNrU0
変なContent-Encodingは消したほうが良いみたいだな
gzip, chunk 以外知らんけど

608:名無しさん@お腹いっぱい。
07/03/22 21:10:10 CuyAqdZm0
>>599
それ教えて( ゚д゚) ホスィ・・・

609:名無しさん@お腹いっぱい。
07/03/22 21:43:52 h6gQqGsT0
>>602
[HTTP headers]
In = TRUE
Out = FALSE
Key = "Content-Encoding: Kill Content-Encoding (in)"
Match = "*"

[HTTP headers]
In = TRUE
Out = FALSE
Key = "Content-Type: Kill charset (in)"
Match = "text/html; charset="
Replace = "text/html;"

>>606-607
ですね。

610:名無しさん@お腹いっぱい。
07/03/22 22:24:29 LqIcExhd0
Match = "(^gzip|x-gzip)?"
とかにしとかなくていいの

611:名無しさん@お腹いっぱい。
07/03/22 22:57:21 h6gQqGsT0
>>610
URLリンク(www.youtube.com)
駄目だ、これ開いたら一面文字だらけになった。

612:名無しさん@お腹いっぱい。
07/03/23 00:57:41 zEKCeVAb0
文字コード詐称されてフィルターが効かないと言う状態なら
ブラウザも正しく認識出来ないのだからどっちにしろ危険は無いんじゃないのか?

613:名無しさん@お腹いっぱい。
07/03/23 16:29:48 3Pg7luNE0
オミトロン装備してるとどうも一部の頁が西ヨーロッパ言語になってしまうんだが、どうすればいい?

614:名無しさん@お腹いっぱい。
07/03/23 16:33:29 3Pg7luNE0
すまない。スレ違いだった。

615:名無しさん@お腹いっぱい。
07/03/23 21:25:45 +CQ+E6V20
>>609
駄目だった・・・

616:think ◆MM0nnAOCiQ
07/03/24 14:25:23 Vct6LEbc0
>>602,615
こちらの環境では、「>609の "Content-Type: Kill charset (in)" を取り入れて、JavaScriptを有効に」すれば、支障なく閲覧できています。
万が一問題があるようでしたら、以下のフィルタを取り込んでみてください。

[HTTP headers]
In = TRUE
Out = FALSE
Key = "Content-Type: Fix g-kaizou charset (in) [2007/03/24]"
URL = "karen.saiin.net/~g-kaizou/"
Match = "text/html; charset=(^shift_jis|euc-jp|iso-2022-jp|utf-(8|16))"
Replace = "text/html; charset=shift_jis"

617:think ◆MM0nnAOCiQ
07/03/24 14:38:04 Vct6LEbc0
>616の続き。

Content-Typeヘッダの不正が原因なわけですが、Firefox, Opera9 (IE6, IE7 は [日本語(自動選択)] にチェックONで正常に閲覧可) で閲覧不可では少なからず訪問者を逃がしてしまいます。管理人の運営方針にもよりますが、サイト側の問題と受け取れると思います。
当分は、Proxomitronで凌ぐとしても、サイト運営者に報告しておいた方がお互いの益になるのではないでしょうか。

該当Webサイトのトップページには

-------------
2007年3月18日
なぜか全ページが文字化け(原因不明)
-------------

とあるので、運営者は原因を把握していないと思われます。
おそらく、htaccess に

AddType "text/html; charset=csiso2022kr" .html .htm

の記述があるので、これを

AddType "text/html; charset=shift_jis" .html .htm

に変更すれば、問題は解消されるでしょう。
…ということを運営者に報告してあげてください。

文字化け対策としての.htaccess
URLリンク(www.shtml.jp)
@IT:Javaの文字化け対策FAQ(1)
URLリンク(www.atmarkit.co.jp)

618:think ◆MM0nnAOCiQ
07/03/24 15:26:50 Vct6LEbc0
問題提起されている件は、

Content-Encoding: text/html; charset=csiso2022kr

でProxomitronフィルタが無効になるという現象ですね。

# Content-Typeの方はフィルタの挙動とは無関係のようです。
# 何より、Content-Typeヘッダを意図的に不正にするとWebブラウザでの閲覧の支障が出るので、そういう設定にされる可能性は低いと思います。

で、この

Content-Encoding: text/html; charset=csiso2022kr

という記述は、正しい書式なのでしょうか?
よく解らないなりに、調べてみると以下の文献が見つかり、

-----------------
内容コーディングは、section 3.5 にて定義されている。使用例を見よ。

HTTP/1.1: ヘッダフィールド定義 - 14.11 Content-Encoding
URLリンク(www.practical-lamp.com)
-----------------
最初は、登録機構は以下のトークンを登録している。... gzip, conpress, deflate, identity

HTTP/1.1: プロトコルパラメータ - 3.5 内容コーディング
URLリンク(www.practical-lamp.com)
-----------------

とあるので、少なくとも>602のWebサイトの出力するContent-Encodingヘッダの書式は誤っているような気がします。


619:think ◆MM0nnAOCiQ
07/03/24 15:28:47 Vct6LEbc0
>618の説が正しいとすると、Content-Encodingヘッダも運営者側で修正する方が望ましいので、サイト運営者が .htaccess から

AddEncoding "text/html; charset=csiso2022kr" .html .htm

を削除するという配慮があると有り難いですね。(書式は少し自信がないです…。)


あえて、Proxomitron排除のために残すというサイトがあった場合は、以下のフィルタで回避できる…と思います。

[HTTP headers]
In = TRUE
Out = FALSE
Key = "Content-Encoding: Kill faulty value (in) [2007/03/24]"
Match = "(^gzip|compress|deflate|identity)"

620:名無しさん@お腹いっぱい。
07/03/25 00:39:47 U32bBhWY0
乙。 httpd.confも疑ったほうがいいですな。

>>619
Content-Encodingヘッダが無い時でもマッチしてしまうようだ。

621:名無しさん@お腹いっぱい。
07/03/25 00:44:01 ykWCl22f0
Match = "(^gzip|compress|deflate|identity)?+"

622:think ◆MM0nnAOCiQ
07/03/25 01:03:18 sQ09AHw80
>>620-621
レス有難う御座います。
>621を取り込ませていただきました。m(_ _)m

[HTTP headers]
In = TRUE
Out = FALSE
Key = "Content-Encoding: Kill faulty value (in) [2007/03/25]"
Match = "(^gzip|compress|deflate|identity)?"

> httpd.confも疑ったほうがいいですな。
>602は自宅サーバじゃないようなので、httpd.conf を編集する権限がないと思います。多分…。

623:名無しさん@お腹いっぱい。
07/03/25 01:43:58 U32bBhWY0
メンテの後文字化けしたんじゃなかったっけ? 運営側が何かやらかしたのでは。

624:think ◆MM0nnAOCiQ
07/03/25 02:57:05 sQ09AHw80
>>623
その可能性には思い至りませんでした。
ざっと調べてみたところ、同サービスの他のサイトでは同様の症状(Content-Type, Content-Encoding 含めて)が発生していないようです。

Google検索: site:saiin.net
URLリンク(www.google.co.jp)

一部のサイト(サーバ)だけ設定が誤っている可能性も否定出来ませんが…。

625:think ◆MM0nnAOCiQ
07/03/25 03:26:51 sQ09AHw80
何にしても両方チェックしておくに超したことはないですね。

その辺りも加味して、>602のサイトへ報告しておきました。

626:名無しさん@お腹いっぱい。
07/03/25 11:34:40 civrXBG40
ローカルに保存したhtmlをこれを通して閲覧する方法はありますか?
極力改変を加えずに保存し、閲覧時には無駄な広告やflashへのリンクを
殺して動作を軽くしたいです。

627:think ◆MM0nnAOCiQ
07/03/25 13:44:12 sQ09AHw80
>>626
URLコマンドの file// がありますが、ローカルファイルに対して常にProxomitronを通すには他のユーティリティを利用しないと無理だと思います。
URLリンク(www.pluto.dti.ne.jp)

他に、ローカルにWebサーバを立ち上げる方法があります。


628:626
07/03/25 15:25:33 Dk5Qg+wy0
>>627
そうですか・・
ありがとうございます。

629:think ◆MM0nnAOCiQ
07/03/25 22:23:31 sQ09AHw80
>602のサイト復旧。
結果的に、"Content-Type: text/html", Content-Encodingなし の状態に落ち着いたようです。
# 匿名で報告したので、具体的な対処法(原因)は判りませんでした。

何はともあれ、>602氏の問題は解決しました。

630:think ◆MM0nnAOCiQ
07/03/25 22:28:52 sQ09AHw80
失礼。
>629の件ですが、掲示板に復旧までの経緯が記載されていました。
.htaccess は無関係で、サーバの管理者に報告したのみ…ということです。

631:名無しさん@お腹いっぱい。
07/03/26 17:25:13 z4qaU8SK0
すべらない名無し(URLリンク(by774.blog73.fc2.com))にある、
Brainerのテキスト広告をカットしたいのですが、下記ではうまく仕事をしてくれません。
どなたかご教授願えせんでしょうか。

[Patterns]
Name = "[User] AD @ Brainer"
Active = TRUE
Limit = 1139
Match = "$NEST(<script[^>]+>,</script>)<script[^>]++ad.brainer.jp[^>]+></script>$NEST(<iframe[^>]+>,</iframe>)"
Replace = "<!-- AD @ Brainer - Blocked by Proxomitron -->"



>>626
FirefoxならAdblockが使える。

632:think ◆MM0nnAOCiQ
07/03/26 18:51:02 hy1J35Zo0
>>631
該当Webサイトのhtmlソースを拝見しました。
マッチさせたい箇所は以下の部分ですよね?

<script type="text/javascript"><!--
brainer_partner_id = "****";
...
brainer_channel = "****";
//--></script>
<script type="text/javascript" src="URLリンク(ad.brainer.jp)

## 引用元: URLリンク(by774.blog73.fc2.com)

iframe要素が見あたらないために、マッチしていないと思われます。
更に簡単に書くならば、<script type="text/javascript" src="URLリンク(ad.brainer.jp) だけにマッチさせても良いですね。
前述のscript要素の内容コードは、変数の初期化だけですので本元の処理部分をカットするだけでも広告を取り除けます。(script要素の順番に配慮しなくても良いのも利点)
細かいことをいえば、ad.brainer.jp はsrc属性値に限定した方がベターだと思います。

633:名無しさん@お腹いっぱい。
07/03/26 21:21:23 z4qaU8SK0
>>632
どうもありがとうがざいます。
火狐の「選択した部分のソースを表示する」を使ってしまい、確認を怠っていましたorz
今までのテストでおkなのに引っ掛からなかったフィルタも確認しなければ(´・ω・`)
前半の$NEST部分は仰るとおり必要ないのですが、
ソースを見たときに痕跡があると何故かヽ(`Д´)ノフォオオオ!となるので、
個人的にくっつけていたりいなかったり。

[Patterns]
Name = "[User] AD @ Brainer"
Active = TRUE
Limit = 640
Match = "$NEST(<script[^>]+>,</script>)<script[^>]++src="URLリンク(ad.brainer.jp)
Replace = "<!-- AD @ Brainer - Blocked by Proxomitron -->"



634:620
07/03/27 21:51:05 WBi+faku0
>>629-630
お疲れ様でした。 運営側のミスでしたか、こういうこともあるんですね。

>>626
ブラウザを起動してるときにProxomitronのメインウインドウに目的のhtmlファイルをD&Dすれば
フィルタリングされたページがブラウザに表示されます。 このときブラウザのアドレスバーに
表示されるURLをお気に入りに入れておくと便利かも知れません。

635:名無しさん@お腹いっぱい。
07/03/28 07:07:18 LqglA30l0
ローカルファイルに対してフィルタをかけたいんですが、うまくいきません。
具体体には、FirefoxのRSSリーダであるSageが作成するページに
フィルタリングをかけ、記事中に割り込んでくる広告を削除したいのですが。
URLリンク(file)でローカルファイルをWebページと同様にフィルタリングが
出来ると言うところまではわかったのですが(無論プレフィックスも設定しています)、
Webページフィルタの「URLのマッチ」の欄に、
URLリンク(file)
と入れてもマッチしていない様なのです。
フルパスだと
URLリンク(file)〜/chome/sage.html
と言う感じで、フルパスで書いても同じ現象でした。
ダミーとして簡単なHTMLファイルをC:直下において、URLリンク(file)
やってみたのですが、やはりフィルタリングされない模様です。
どこか記述や使い方など、間違っている部分があればご指摘願いたいのですが・・・。

636:名無しさん@お腹いっぱい。
07/03/28 09:25:12 zqd/h+Lp0
「URLのマッチ」欄では"http(s|)://"は含めないで下さい。

637:名無しさん@お腹いっぱい。
07/03/28 13:17:57 YK1sZGBa0
>>635
「URLのマッチ」の欄を消したらフィルタは期待通りに動く? 動かないなら論外。 動くのなら>>636の確認と、
Proxomitronの 「設定」 - 「アクセス」 - 「URLベースのProxomitronコマンドを無効にする」 のチェックが入っていれば外す。

あと、Firefoxで広告消すならAdblockもあるよ。 新しいコマンドが追加されてて面白そう。

【CSS】Mozilla広告ブロック【Adblock】
スレリンク(software板:584-585番)

638:名無しさん@お腹いっぱい。
07/03/28 22:54:30 YK1sZGBa0
>>634の方法だとファイルパスの中の ":" が何故か "%7C" に置換されてしまう。( %7C = "|" 、正しくは %3A。)
このためページが見つからずにエラーになるのでそれを修正するURL Control系のリスト用コード。

--------------------------------------------------------------------------------------------
# ProxomitronウインドウにhtmlファイルをD&Dした時のURLを修正。 "prefix.." は各自のprefixに書き換える。
http://prefix..file//([a-z]+{1,2})\0%7C/\1&$JUMP(http://prefix..file//\0:/\1)
--------------------------------------------------------------------------------------------

この現象はデフォルトの4.5June、4.5 338で確認。

639:名無しさん@お腹いっぱい。
07/03/29 01:40:52 oWBN6QKE0
>>636-637
試してみましたが、期待通りに動きませんでした・・・論外って事ですね。
フィルタ自体はテストも動くし、同一内容のhtmlをコピーして別サーバにアップして試したところ
問題なく動いたので、フィルタが間違っているわけでは無いと思うのですが・・・。

ログを見ているとローカルに対しては全くフィルタを適用しようとしていない様に見えます。
設定のチェックは外しているのですが。

諦めます・・・レスありがとうございました。

640:名無しさん@お腹いっぱい。
07/03/29 01:47:44 nwH5ZQHV0
Sageは使ったことないからよく知らないけど、
広告だったら何か規則性があるんでないの?
<div class="ad"> の中に入っているとか、
<a href="広告サイトのURL"> とか。
スタイルシートで消すことが可能かもしれない。

641:名無しさん@お腹いっぱい。
07/03/29 04:02:19 oWBN6QKE0
ありがとうございます。
おっしゃるとおりで、普段はIEとFirefoxを使い分けているので、どちらかのブラウザに
依存する方法で広告削除はしたくなかったのですが、今回はFirefoxに依存した
問題なのだから、FirefoxのCSSで消してしまえば良かったのですよね。
Proxomitronで消す事ばかりを考えてしまって、そこに考えが至りませんでした。

件の広告はCSSを用いて無事に削除出来ました。
フィルタがローカルに適用されないというのが未だに解決していないのが
気持ちの悪いところではあるのですが、ともあれレスをくれた皆さん、
ありがとうございました。

642:名無しさん@お腹いっぱい。
07/03/29 07:31:26 ve+QA7+t0
>>639
Ctrl+F5で強制リロードしてもダメ?

643:名無しさん@お腹いっぱい。
07/03/29 07:56:26 oWBN6QKE0
>>642
キャッシュを読まずにリロードって事ですよね?
ダメでした・・・。

644:名無しさん@お腹いっぱい。
07/03/29 09:22:28 ve+QA7+t0
検索表現で改行コードを"\n"にしている。

WebにASCIIモードでアップ → 改行コードが 0Ah となり、マッチ
ローカルでフィルタリング → 改行コード 0Dh 0Ah でマッチせず

とか。(苦しいか...)

645:名無しさん@お腹いっぱい。
07/03/29 12:00:10 Tylg9NKN0
>643
chrome://sage/content/feedsummary.html?uri=[URL]
URLがこういう感じの形式だからじゃないの?

646:名無しさん@お腹いっぱい。
07/03/30 02:27:46 N5oMoR0M0
>>644
検索条件に改行コードは含んでいないです。

>>645
ロケーションバーに表示されるsageのURLは、
file:///C:/Documents%20and%20Settings/UserName/(省略)/chrome/sage.html
です。省略部分は一般のプロファイルの場所です。

レスが頂けるのは大変嬉しく勉強にもなるのですが、
流石にスレ違いな気がしてきたので、スルーしていただいて結構です・・・。
すみません、ありがとうございます。

647:名無しさん@お腹いっぱい。
07/03/30 03:28:46 Fk+PoKNY0
FXがローカルのファイルを直接開いてるんじゃないの?
そうだとしたら対処不能

648:名無しさん@お腹いっぱい。
07/03/30 14:55:49 fRAcFZO30
URLリンク(www.bbsnews.jp)
ここのトップだけscriptタグを範囲にしてマッチさせようとしても広告消してくれないんですが上手い方法ってあるんでしょうか?
他のランキングは消せたので原因がよくわかりません

649:think ◆MM0nnAOCiQ
07/03/30 21:43:47 z1oSbQ+H0
>>648
特に問題は見あたりませんでした。
マッチしないフィルタを開示できるのであれば、アドバイスできるかもしれません。

650:名無しさん@お腹いっぱい。
07/03/31 13:04:14 qvhXZMuJ0
とりあえずのこの脆弱性対応
URLリンク(www.microsoft.com)

Name = "Cut Cursor"
Active = TRUE
Limit = 500
Match = "cursor (:|=) [^;}>]+"

超誤爆上等注意
まぁ、見ただけでアウトな脆弱性だから対応パッチが出るまでのしのぎレベルで
#私は昔から常用してるフィルタなんだけどねw

651:名無しさん@お腹いっぱい。
07/04/01 00:28:32 uRgnshK20
<font style="&#x63;ursor:url(mailto:kuso.ani)">feffeffe</font>

652:名無しさん@お腹いっぱい。
07/04/01 15:01:41 0jf8ZLJk0
TOK2広告、4月1日現在、Limit = 13640
確実に増え続けている。
Proxomitronを意識しているとしか思えないんだが。

653:名無しさん@お腹いっぱい。
07/04/01 15:05:11 NVBogZYX0
↑馬鹿

654:名無しさん@お腹いっぱい。
07/04/01 17:20:26 EDThOvVs0
やっつけ
Match = "(c|\c)(u|\u)(r|\r)(s|\s)(o|\o)(r|\r) (:|=) [^;}>]+"

655:名無しさん@お腹いっぱい。
07/04/01 17:23:40 EDThOvVs0
ぐは
これでどうだ
Match = "(c|\&#x63;)(u|\&#x75;)(r|\&#x72;)(s|\&#x73;)(o|\&#x6F;)(r|\&#x72;) (:|=) [^;}>]+"

656:名無しさん@お腹いっぱい。
07/04/01 17:29:21 EDThOvVs0
これ、10進とかにも対応とか考えると重くなるだけな気がするな
$UESCの検索側版って無いのかな?

657:名無しさん@お腹いっぱい。
07/04/01 19:16:38 CvldivIu0
CSS内の数値文字参照を本来の文字に戻してから、
他のフィルタで処理したほうが良いような

658:名無しさん@お腹いっぱい。
07/04/01 20:55:33 NqLKJzxg0
>>652
>>574 では駄目なのか


659:名無しさん@お腹いっぱい。
07/04/01 21:20:06 YuF/sEJL0
>>650
ユーザースタイルシートで
*{cursor:auto!important;}
とやったらどうかな

660:名無しさん@お腹いっぱい。
07/04/02 00:01:33 BXoP6IEA0
IE6じゃ!important使えなかった希ガス

661:名無しさん@お腹いっぱい。
07/04/02 00:48:07 UKQKuB2c0
>>660
え??????

662:名無しさん@お腹いっぱい。
07/04/02 13:43:50 poYN2CYf0
>>653>>658
うん、TOPではなくUNDERのほうだよ。
TOPは増えないから通常通りで大丈夫。

663:名無しさん@お腹いっぱい。
07/04/02 20:31:38 ezmG3rBo0
>>659
なるほど、その方法は良さそうだな
考えつけなかった

664:名無しさん@お腹いっぱい。
07/04/03 00:33:16 J5HArJ7i0
>>659,663
それ、ちゃんと機能する?
IE6では駄目だった。

>>650,655の10,16進大文字小文字対応…重いかな?
実体参照の区切り文字 ; が無くても有効だ!
Match = "(c|\&#(x63|x43|67|99)(;|))"
"(u|\&#(x75|x55|85|117)(;|))"
"(r|\&#(x72|x52|82|114)(;|))"
"(s|\&#(x73|x53|83|115)(;|))"
"(o|\&#(x6F|x4F|79|111)(;|))"
"(r|\&#(x72|x52|82|114)(;|)) (:|=)[^;}>"]+"

実体参照が有効なのはインラインでのスタイル定義(>>651)だけで
.cssファイルと<style>ブロック内では無効みたいだね。

665:名無しさん@お腹いっぱい。
07/04/03 01:34:59 NxFim7nS0
アニメーションカーソルはfaviconにも使えるそうだし拡張子偽装も出来るそうだから
弾くの難しいだろうね


666:名無しさん@お腹いっぱい。
07/04/03 01:58:18 +KrQYJGn0
IEを使わない。これで>665も解決できると思われ。
MIME-Type もろくに見ないようなブラウザを使うのが悪いと言わざるをえない。
favicon は、*.ico か image/x-icon を\kすればいいのかな。

667:名無しさん@お腹いっぱい。
07/04/03 02:49:31 6wNViq4u0
うは、数字前部複数の 0 、文字間に %00 があっても有効だった。
キリがない…orz もう、これで終わりにしますぅ。>>664でした。
Match = "(c|\&#(x[0]+{0,*}(63|43)|[0]+{0,*}(67|99)) (;|)) "
"(u|\&#(x[0]+{0,*}(75|55)|[0]+{0,*}(85|117)) (;|)) "
"(r|\&#(x[0]+{0,*}(72|52)|[0]+{0,*}(82|114)) (;|)) "
"(s|\&#(x[0]+{0,*}(73|53)|[0]+{0,*}(83|115)) (;|)) "
"(o|\&#(x[0]+{0,*}(6F|4F)|[0]+{0,*}(79|111)) (;|)) "
"(r|\&#(x[0]+{0,*}(72|52)|[0]+{0,*}(82|114)) (;|)) (:|=) [^;}>"]+"

668:名無しさん@お腹いっぱい。
07/04/03 02:50:32 O0ftgExI0
>>664
ちょいと&#x063;とかにすりゃもうすり抜けられちゃうし。
こういうのってそうやってゴチャゴチャ書いててもやっつけ解決にすらならんよ。

669:668
07/04/03 02:52:16 O0ftgExI0
入れ違いになってしまった。

670:名無しさん@お腹いっぱい。
07/04/03 02:55:49 O0ftgExI0
ちなみにキミの書いているのは(文字)実体参照ではなくて数値文字参照だ。

どうでもいいけど。

671:名無しさん@お腹いっぱい。
07/04/03 03:58:17 u5Y7aheh0
>>667補足です。
>・・・文字間に %00 があっても有効だった。

& # x 0 0 6 3 ; u r s o r :
 ↑半角スペースを %00 と読み替えて下さい。
当然ながら>>667ではマッチしませんから…中途半端でスマソでした。

>>669-670
了解です。

672:名無しさん@お腹いっぱい。
07/04/03 04:53:45 +KrQYJGn0
仮に理想的なフィルタができたとしても、
よほど処理が軽くない限りは使いたくないものだな。
そこまで悪意を持ったサイトなんてあるんだかというのが知りたい。
まあ、精神的ブラクラを集めたような物好きサイトがあるのも確かだが。

673:名無しさん@お腹いっぱい。
07/04/04 03:51:09 j6rLwbwp0
この手の物をおみとろんで全部弾くには相当な手間になると言う事か
>>672
半分は思考実験かと
今回だけでなく、今後にも役に立つ可能性が残るし

674:名無しさん@お腹いっぱい。
07/04/04 09:03:43 Ww/FJYxO0
プロファイル結果...
サンプルテキスト : 30000 バイト(このスレのhtmlソース)
成功マッチ数 : 1
(5回試行した平均値)
>>650 平均時間 : 0.37 (ミリ秒)
>>655 平均時間 : 0.72 (ミリ秒)
>>664 平均時間 : 0.73 (ミリ秒)
>>667 平均時間 : 0.73 (ミリ秒)

   ↓平均時間 : 0.73 (ミリ秒)
Match = "(c|\& # (x (0 )+{0,*}(6 3|4 3)|(0 )+{0,*}(6 7|9 9)) (;|)) "
"(u|\& # (x (0 )+{0,*}(7 5|5 5)|(0 )+{0,*}(8 5|1 1 7)) (;|)) "
"(r|\& # (x (0 )+{0,*}(7 2|5 2)|(0 )+{0,*}(8 2|1 1 4)) (;|)) "
"(s|\& # (x (0 )+{0,*}(7 3|5 3)|(0 )+{0,*}(8 3|1 1 5)) (;|)) "
"(o|\& # (x (0 )+{0,*}(6 F|4 F)|(0 )+{0,*}(7 9|1 1 1)) (;|)) "
"(r|\& # (x (0 )+{0,*}(7 2|5 2)|(0 )+{0,*}(8 2|1 1 4)) (;|)) (:|=) [^;}>"]+"

興味本位の改変なので、突っ込まんで下され。

>>672-673
同意。

675:名無しさん@お腹いっぱい。
07/04/04 09:19:38 /oqEdOnS0
<font style="cursor feffeffe:url(mailto:kuso.ani)">nmooi</font>
URLリンク(www.microsoft.com)

676:名無しさん@お腹いっぱい。
07/04/04 09:54:55 qTxRbb9j0
>>675
パッチ来たのか、今回は随分早いな。

677:名無しさん@お腹いっぱい。
07/04/05 03:37:36 l42HB2fw0
>>675
おお!
他にどんなパターンが考えられますか?

678:名無しさん@お腹いっぱい。
07/04/05 14:38:16 /B+A98J/0
nico動画のID表示フィルタってありませんか?

679:名無しさん@お腹いっぱい。
07/04/06 13:25:48 /V316V1o0
URLをリストで管理する際に、ずっと感じている疑問。
href=$AV((URLリンク(|)">URLリンク(|URLリンク(www.google.co.jp)

のように検索パラメータまでアンエスケープされてしまいますので、ご注意下さい。
特に、/&? のアンエスケープは予期せぬ不具合の原因となりそうな気がします。

683:名無しさん@お腹いっぱい。
07/04/06 20:48:20 ZQc0Ffc80
パッチも出たことだし用済みとなりましたが…
>>650,655,664,667,674
>>651,671,675
Match = "cursor[^:=}]+(:|=) url\([^)}]+\)(;|) \1}$SET(0=\1})|"
"style=$AVQ(\1"
" (c|\& # (x (0 )+{0,*}(6 3|4 3)|(0 )+{0,*}(6 7|9 9)) (;|))"
" (u|\& # (x (0 )+{0,*}(7 5|5 5)|(0 )+{0,*}(8 5|1 1 7)) (;|))"
" (r|\& # (x (0 )+{0,*}(7 2|5 2)|(0 )+{0,*}(8 2|1 1 4)) (;|))"
" (s|\& # (x (0 )+{0,*}(7 3|5 3)|(0 )+{0,*}(8 3|1 1 5)) (;|))"
" (o|\& # (x (0 )+{0,*}(6 F|4 F)|(0 )+{0,*}(7 9|1 1 1)) (;|))"
" (r|\& # (x (0 )+{0,*}(7 2|5 2)|(0 )+{0,*}(8 2|1 1 4)) (;|))[^;"]+ \2"
")$SET(0=style=\1\2)"
Replace = "\0"

サンプルテキスト : 30000 バイト
平均時間 : 0.511000 (ミリ秒)

一行目を {} で括って {\1cursor[^:=}]+(:|=)[^;}]+(;|) \2}$SET(0={\1\2}) のようにすると
平均時間 : 0.881000 (ミリ秒)

a{ cursor アXXXイ ウYYYエ: url( mailto: kuso.ani オZZZ ) } ←こんなのも有効でした。
半角スペースの部分は[%00]から[%20]までマッチさせた方が望ましい。

684:679
07/04/07 06:24:57 xLSZD1g90
どうもありがとうございます。
遅くなる上に誤動作の可能性ありですか。パワーのないマシンでは厳しい。

$LST(ROOT) を使う場合、中身は以下のようになるのかな。
(/|/index.html|)(^?)
(/|/index.php|)(^?)
index.php などになっているサイトもあるので。

wƾw.google.co.jp$LST(ROOT) のような場合、
ドメイン名の後に$LST(など、何かしらの文字)を書かねばならないので、
見やすくはなるものの、(/|/index.html|)(^?) を書くのとあまり変わりないかもしれない。
軽さを重視して、何より誤動作させたくないのであれば>679のままでよさそう。

余談だけど>679を書いたのは、
\kの対象などになる URL のリストが長くなったのがきっかけ。
一度登録すると削除することがなかなかないものだから、
ドメインなどのリンク切れチェックや誤爆チェックをするため、
URL を最初から書き直すことにした。
個人サイトのウェブリングや、中小規模のショップなどはリンク切れがけっこうありそう。
1年から2年に1回くらいはリストを書き直すといいかもしれない。

685:680
07/04/07 08:35:42 8xuLEh/P0
>>684
すみません、質問の内容を勘違いしてました。
$LST(ROOT) はサイトのトップだけでなくその他のURLもリストに登録するような場合に使うと便利ですが、
サイトのトップだけをリストにまとめる場合には無駄になります。
この場合はthink氏のようにフィルター側で対応するべきでした。

>$LST(ROOT)の誤動作
私の知る限りは誤動作する心配はいらないと思います。 むしろ(/|/index.html|)(^?)を書く際の
記述ミスの心配が無くなり確認もラクになるので二者択一の場面があれば私なら積極的に使います。

>>682
実際にフィルターを書く場合にはURLの一部を取り出し、そこだけ変換するような書き方になると思います。
しかしURLの一部を改変してしまうことには変わりはないので何らかの不具合は覚悟の上で使うことになります。
この方法は (~|%7E) と比べると余計に面倒なことになるのであまり現実的ではありませんね。

686:think ◆MM0nnAOCiQ
07/04/07 16:55:40 cyEdAINr0
>>683
流れを追い切れてませんが、お疲れ様です。

>>684
誤動作に関しては、しっかりとテストを行えば、クリアできる課題だと思います。
しかし、遅くなるのはどうしようもありませんね…。
(/|/index.html|)(^?) の書き方をする場面は限られてくると思うので、速度も気になるのでしたら、テキストエディタの「一括置換」で管理する方が用途に合うと思います。

>>685
> しかしURLの一部を改変してしまうことには変わりはないので何らかの不具合は覚悟の上で使うことになります。
>682の他に、マルチバイト文字をデコードしたときにも誤爆する可能性があることに気がつきました。
ASCII文字のみに絞ってURLエンコードされた文字列を指定すれば、誤爆を回避できそうですが、面倒なことには変わりなく。
以下の表現からの派生を考えてみましたが、思いの外、時間がかかりそうだったので中断しました。

(URLリンク([_0-9a-z-]+{2,*})(.[_0-9a-z-]+{2,*})+{1,*}(:[0-9]+|(^:))/)\#
(([^#?/%]++)\#(((%([0-7][0-f]))+)\0$SET(#=$UESC(\0))((%[0-f]+)+[^#?/%]+)\#)+(/)\#)+\#

687:名無しさん@お腹いっぱい。
07/04/09 02:20:48 zSOO4a+F0
チラシの裏。

リストの拡張子を.cfgに変更して、.cfgをメモ帳よりもちょっと高機能なエディタに関連付けした。
.txtはいまだにメモ帳を使っているけど、
リストを編集するときにはアンドゥくらいは楽にできるとよいので
拡張子変更という手段をとってみた。
タスクトレイのアイコン右クリックからでも、指定したエディタが起動してなかなかよさげ。

688:名無しさん@お腹いっぱい。
07/04/09 02:22:55 5sO+vonU0
妙な関連付けを一般化するよりは
エデター+パラメターでショーツカッツ作った方が利口そうに思えるのだが

689:名無しさん@お腹いっぱい。
07/04/09 02:35:43 zSOO4a+F0
>688
1. 使用したいエディタのショートカットをSendToフォルダに入れる。
2. リストがあるフォルダを開いてから右クリック→送る
こういうやり方でもいいかなーと思ったけど、
タスクトレイのアイコン右クリックから開けるのが便利なので関連付けすることにした。
.cfgなんて拡張子はProxomitron以外だとあまり見かけないし、
.cfg専用にアイコンを設定しておいたので、開きたくない.cfgを誤って開くこともないかなと。

690:名無しさん@お腹いっぱい。
07/04/09 03:06:58 7Je96E6Q0
いずれにせよ
100歩遅れてるぞ

691:名無しさん@お腹いっぱい。
07/04/09 10:04:18 fUCp2oiA0
それなりのエディタ持っててメモ帳使う意味が分からん。

692:名無しさん@お腹いっぱい。
07/04/09 10:13:25 f4aajwxY0
cfgはOTBEditに関連付けしてる。 関連付けして不都合でもない限りしたほうが利口だと思う。

693:名無しさん@お腹いっぱい。
07/04/09 10:16:15 bCBiMOfp0
ニコニコ動画のURLリンク(www.nicovideo.jp)のgifを
指定のgifにするフィルタってないかな?
030.gifに固定したいんよ…

694:名無しさん@お腹いっぱい。
07/04/09 11:49:27 Lin40nlx0
>>693

[Patterns]
Name = "nicovideo randomgif to static"
Active = TRUE
URL = "www.nicovideo.jp/random $TYPE(htm)"
Limit = 256
Match = "<script type="text/javascript" src="js/illust.js"></script></a><noscript><img src="img/tpl/head/illust/000.gif" alt=""></noscript>"
Replace = "</a><img src="img/tpl/head/illust/030.gif" alt="">"

695:名無しさん@お腹いっぱい。
07/04/09 12:10:25 bCBiMOfp0
>>694
申し訳ありません
効果無いです…

696:名無しさん@お腹いっぱい。
07/04/09 12:37:48 f4aajwxY0
>>695
[HTTP headers]
In = FALSE
Out = TRUE
Key = "URL: niko 030.gif (out)"
Match = "URLリンク(www.nicovideo.jp)(^030.gif)[0-9]+.gif(^?)"
Replace = "$JUMP(URLリンク(www.nicovideo.jp))"

697:名無しさん@お腹いっぱい。
07/04/09 12:43:21 bCBiMOfp0
>>696
ありがと〜ございます!

698:名無しさん@お腹いっぱい。
07/04/09 13:00:49 Lin40nlx0
>>695
きまぐれ検索ページ限定じゃなかったんだな。
ごめんな。

699:名無しさん@お腹いっぱい。
07/04/09 17:15:19 kYTyr62b0
こちらこそごめんなさい。

700:名無しさん@お腹いっぱい。
07/04/11 01:50:11 1C3+uH/D0
>>683修正
Match = "$NEST({,\1cursor[^:=]+(:|=)[^;]+(;|) \2,})$SET(0={\1\2})|"
"style=$AV(\1"
" (c|\& # (x (0 )+{0,*}(6 3|4 3)|(0 )+{0,*}(6 7|9 9)) (;|))"
" (u|\& # (x (0 )+{0,*}(7 5|5 5)|(0 )+{0,*}(8 5|1 1 7)) (;|))"
" (r|\& # (x (0 )+{0,*}(7 2|5 2)|(0 )+{0,*}(8 2|1 1 4)) (;|))"
" (s|\& # (x (0 )+{0,*}(7 3|5 3)|(0 )+{0,*}(8 3|1 1 5)) (;|))"
" (o|\& # (x (0 )+{0,*}(6 F|4 F)|(0 )+{0,*}(7 9|1 1 1)) (;|))"
" (r|\& # (x (0 )+{0,*}(7 2|5 2)|(0 )+{0,*}(8 2|1 1 4)) (;|))[^;]+(;|) \2"
")$SET(0=style="\1\2")"
Replace = "\0"

<font style = ' cursor feffeffe : url( " mailto: kuso.ani " ) '>nmooi</font> ←に対応

1行目比較
サンプルテキスト : 30000 バイト
平均時間 : 0.571000 (ミリ秒) ← cursor[^:=}]+(:|=) url\([^)}]+\)[^;}]+(;|) \1}$SET(0=\1})
平均時間 : 0.821000 (ミリ秒) ← {\1cursor[^:=}]+(:|=)[^;}]+(;|) \2}$SET(0={\1\2})
平均時間 : 0.701000 (ミリ秒) ← $NEST({,\1cursor[^:=]+(:|=)[^;]+(;|) \2,})$SET(0={\1\2})

701:名無しさん@お腹いっぱい。
07/04/11 22:23:13 cQGpqEHg0
特定のサイトだけUAをIEに変えるフィルターありませんか?
具体的に言うとDELL・・

702:名無しさん@お腹いっぱい。
07/04/12 01:55:46 yoxqXBik0
そのくらい自分で

703:名無しさん@お腹いっぱい。
07/04/12 11:03:10 MOcLIRDj0
>>701
自分でやって覚えようってことで、テンプレを示してみるってのはどうかと思ったが

[HTTP headers]
In = FALSE
Out = TRUE
Key = "User-Agent: Template (out) "
URL = ""
Match = "*"
Replace = ""

ほとんど空白になったのでまぁ自分でがんばれ。
URL MatchにDELLのURLを入れて、Replaceに任意のUAを入れるんだよ。

704:名無しさん@お腹いっぱい。
07/04/12 14:05:18 NgCTnRpZ0
ワイルドカードいらない

705:名無しさん@お腹いっぱい。
07/04/15 09:19:20 gMOTS18V0
Vectorでダウンロードのたびに、Vアップ通知画面見させられるの回避するフィルター教えてください。
JUMPとか使いそうなんですけどさっぱりわかりません。

706:名無しさん@お腹いっぱい。
07/04/15 10:58:16 xcMSre2P0
>>705
Vector ってゲームとソフトとで別の構成なのよね。
Vアップ通知画面を回避するという意味で、こんなのはどう?

Leeyes(WindowsNT/2000/XP / 画像&サウンド)
URLリンク(www.vector.co.jp)

とかの、ダウンロード画面でいきなりリダイレクトするWEBページフィルタ。

[Patterns]
Name = "Vector Soft DL Redirect"
Active = TRUE
URL = "*vector.co.jp/soft/dl/"
Limit = 200
Match = "<META NAME="download" CONTENT="\0">"
"$STOP()"
Replace = "<meta http-equiv="refresh" content="0;url=\0">"
"\k"

707:名無しさん@お腹いっぱい。
07/04/15 11:48:44 UGe0bqze0
[Patterns]
Name = "Vector download add link- (2007/04/15)"
Active = TRUE
URL = "www.vector.co.jp/soft/(dl/|)win"
Limit = 256
Match = "(<META NAME="download" CONTENT="http://download.\8">)\0$SET(_link=\8)|"
        "(<META NAME="ve_@title" CONTENT="\8">)\0$SET(_title=\8)|"
        "(<!-- soft data -->\s<table id="soft_data">)\8"
        "$SET(\0=\8\n"
        "<tr>\n"
        "   <td class="celltitle">Download : </td>\n"
        "   <td> <a href="ftp://ftp.$GET(_link)">FTP</a> <a href="http://download.$GET(_link)">HTTP</a> $GET(_title)</td>\n"
        "</tr>\n"
        ")$STOP()"
Replace = "\0"

ダウンロードのリンク追加するフィルタ



708:名無しさん@お腹いっぱい。
07/04/15 12:12:08 2puWsnLs0
漏れもメタタグを置換してリンクにしてる

709:名無しさん@お腹いっぱい。
07/04/15 12:42:36 gMOTS18V0
>>706
助かります!事前にリンク持ってくるって手もあるんですね、なるほど。
似たような例探していじってるだけだから全然応用力ない('A`)

>>707
さらに便利そうだと思って試したら何故かうちの環境じゃCPU100%で固まる・・・

710:名無しさん@お腹いっぱい。
07/04/15 14:11:03 6jv7Rx080
うちでも固まった
どこで暴走しているんだろう

711:名無しさん@お腹いっぱい。
07/04/15 15:05:01 UGe0bqze0
うちでは使えてるんだけどなぁ…

712:名無しさん@お腹いっぱい。
07/04/15 15:39:19 6jv7Rx080
他のフィルタ全部切って>>707だけにしても固まるなあ

一応環境書いておくか
Win2kSP4 IE6SP1 Naoko4.5+日本語化
開こうとしたURLは>>706

713:名無しさん@お腹いっぱい。
07/04/15 16:04:18 BZwh9YcC0
URLリンク(www.goti-death.com)

714:名無しさん@お腹いっぱい。
07/04/15 16:11:13 UGe0bqze0
全部切っても動作した

XPSP2 Firefox2.0.3 4.5June+6
開いたURLは>>706

なにが駄目なのかはわからん

715:名無しさん@お腹いっぱい。
07/04/15 16:52:40 X62yZfmp0
みんなVectorをそんなに利用しているのか。
自分はゲームの新作チェックを週1回と、
よく使うソフトの一部がたまにバージョンアップするときくらいかな。
(こっちは不定期チェック)

広告消しなら作ったけど、リダイレクトのフィルタは使ってないなあ。

716:名無しさん@お腹いっぱい。
07/04/15 19:34:46 xcMSre2P0
Vectorのなにもかも削ぎ落として、
直接ファイルへのリンクを張るWEBページフィルタ。

Treasure Search
URLリンク(www.vector.co.jp)

動いたり動かなかったりだけど、とりあえず ↑みたいなソフト紹介のページ用。

[Patterns]
Name = "Vector Soft All cut"
Active = TRUE
URL = "*vector.co.jp"
Limit = 20000
Match = "<HTML>*"
"<META NAME="download" CONTENT="*/pack/\9">*"
"<META NAME="ve_@title" CONTENT="\1">*"
"<META NAME="ve_@description" CONTENT="\2">*"
""
"treeOnOff'*</script>"
"\0<div class="fr">*<!-- left -->*<!-- /left -->"
"*<!-- soft data -->*<!-- soft data -->\6 <BR clear="ALL">"
"$STOP()"
Replace = "<HTML><head><TITLE>\1</TITLE></head><BODY>"
"<table border="0" width="700" align=center><tr>"
""
"\0 <!-- directory navi -->"
"<hr noshade="noshade" />"
"<font size=6><a href ="URLリンク(my.vector.co.jp) </font> <!-- title -->"
"\6 <!-- explanation -->"
"\k"

717:名無しさん@お腹いっぱい。
07/04/15 20:05:03 2puWsnLs0
URLリンク(my.vector.co.jp)
これだと結局リダイレクトされるから
URLリンク(ftp.)
に置換してやる方が早いかなと思う

でも一つのページで
98用とXP用とかシェア版とフリー版とか
複数のファイルがある場合、メタタグに
URLが書かれないケースがあるんよね

718:名無しさん@お腹いっぱい。
07/04/16 13:54:00 /FD4Gd9i0
>>717
おおっ。確かに、ラスト三行のとこははこれで十分だった。
すっきりしてよかった。ありがとう。

"<font size=6><a href ="URLリンク(ftp.vector.co.jp) </font> <!-- title -->"
"\6 <!-- explanation -->"
"\k"

メタタグに書かれてないアドレスは、拾うのがめんどくさいよなー。

719:名無しさん@お腹いっぱい。
07/04/22 23:44:54 ZzK8n97j0
URLリンク(vird2002.s8.xrea.com)
の汎用Webフィルタ集内のReplace vlink colorフィルタなのですが
background-colorにも誤爆してしまいます
どうすれば誤爆しないように出来るのでしょう?

以下コピペ
Name = "Replace vlink color (html+css) [2005/11/24]"
Active = TRUE
URL = "$TYPE(htm)|$TYPE(css)"
Limit = 256
Match = "(<body(^[^ ]))\#("
"([^>]++\svlink=)\#$AV(\0)([^>]+>)\1&"
"[^>]++\slink=$AV($TST(\0))"
"$SET(#="purple"))|"
"(a:visited {[^}]++color : )\#([0-9a-z#]+)\0"
"([^>]++a:link {[^}]++color : $TST(\0))\1"
"$SET(#=purple)|"
"(a:link {[^}]++color : ([0-9a-z#]+)\0"
"[^>]++a:visited {[^}]++color : )\#$TST(\0)"
"$SET(#=purple)"
Replace = "\@\1$STOP()"


720:think ◆MM0nnAOCiQ
07/04/23 01:25:28 OjjxmJmi0
>>719
懐かしいフィルタですねー。
CSSの表現はスマートな書き方ができなくて苦慮した覚えがあります。

> background-colorにも誤爆してしまいます
[^}]++color を ([^}]++[\t\n\r ;]|)color に変更してやれば、回避できると思います。
ご報告ありがとうございました。

[Patterns]
Name = "Replace vlink color (html+css) [2007/04/23]"
Active = TRUE
URL = "$TYPE(htm)|$TYPE(css)"
Limit = 256
Match = "(<body(^[^ ]))\#("
"([^>]++\svlink=)\#$AV(\0)([^>]+>)\1&"
"[^>]++\slink=$AV($TST(\0))"
"$SET(#="purple"))|"
"(a:visited {([^}]++[\t\n\r ;]|)color : )\#([0-9a-z#]+)\0"
"([^>]++a:link {([^}]++[\t\n\r ;]|)color : $TST(\0))\1"
"$SET(#=purple)|"
"(a:link {([^}]++[\t\n\r ;]|)color : ([0-9a-z#]+)\0"
"[^>]++a:visited {([^}]++[\t\n\r ;]|)color : )\#$TST(\0)"
"$SET(#=purple)"
Replace = "\@\1$STOP()"


次ページ
最新レス表示
スレッドの検索
類似スレ一覧
話題のニュース
おまかせリスト
▼オプションを表示
暇つぶし2ch

4303日前に更新/385 KB
担当:undef