[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 2chのread.cgiへ]
Update time : 04/05 08:18 / Filesize : 385 KB / Number-of Response : 980
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

Proxomitron フィルター作成スレッド Part6



1 名前:ミスターオミトロン [2006/11/13(月) 17:00:32 ID:oCAoIukD0]
このスレは作成依頼されたフィルタを有志により作るスレッドPart4です

アップローダー
wind.prohosting.com/proxmine/cgi-bin/uploader/
proxo.hp.infoseek.co.jp/cgi-bin/sn_uploader/upload.html
Proxomitron等に関するWiki
abc.s65.xrea.com/prox/wiki/
Thinking Archive(仮)
vird2002.s8.xrea.com/
CastleCops Proxomitron Filters
www.castlecops.com/f65-Proxomitron_Filters.html

>>2-10にいろいろと

610 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/22(木) 22:24:29 ID:LqIcExhd0]
Match = "(^gzip|x-gzip)?"
とかにしとかなくていいの

611 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/22(木) 22:57:21 ID:h6gQqGsT0]
>>610
ttp://www.youtube.com/watch?v=LbmbQkX7czo
駄目だ、これ開いたら一面文字だらけになった。

612 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/23(金) 00:57:41 ID:zEKCeVAb0]
文字コード詐称されてフィルターが効かないと言う状態なら
ブラウザも正しく認識出来ないのだからどっちにしろ危険は無いんじゃないのか?

613 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/23(金) 16:29:48 ID:3Pg7luNE0]
オミトロン装備してるとどうも一部の頁が西ヨーロッパ言語になってしまうんだが、どうすればいい?

614 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/23(金) 16:33:29 ID:3Pg7luNE0]
すまない。スレ違いだった。

615 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/23(金) 21:25:45 ID:+CQ+E6V20]
>>609
駄目だった・・・

616 名前:think ◆MM0nnAOCiQ mailto:sage [2007/03/24(土) 14:25:23 ID:Vct6LEbc0]
>>602,615
こちらの環境では、「>609の "Content-Type: Kill charset (in)" を取り入れて、JavaScriptを有効に」すれば、支障なく閲覧できています。
万が一問題があるようでしたら、以下のフィルタを取り込んでみてください。

[HTTP headers]
In = TRUE
Out = FALSE
Key = "Content-Type: Fix g-kaizou charset (in) [2007/03/24]"
URL = "karen.saiin.net/~g-kaizou/"
Match = "text/html; charset=(^shift_jis|euc-jp|iso-2022-jp|utf-(8|16))"
Replace = "text/html; charset=shift_jis"

617 名前:think ◆MM0nnAOCiQ mailto:sage [2007/03/24(土) 14:38:04 ID:Vct6LEbc0]
>616の続き。

Content-Typeヘッダの不正が原因なわけですが、Firefox, Opera9 (IE6, IE7 は [日本語(自動選択)] にチェックONで正常に閲覧可) で閲覧不可では少なからず訪問者を逃がしてしまいます。管理人の運営方針にもよりますが、サイト側の問題と受け取れると思います。
当分は、Proxomitronで凌ぐとしても、サイト運営者に報告しておいた方がお互いの益になるのではないでしょうか。

該当Webサイトのトップページには

-------------
2007年3月18日
なぜか全ページが文字化け(原因不明)
-------------

とあるので、運営者は原因を把握していないと思われます。
おそらく、htaccess に

AddType "text/html; charset=csiso2022kr" .html .htm

の記述があるので、これを

AddType "text/html; charset=shift_jis" .html .htm

に変更すれば、問題は解消されるでしょう。
…ということを運営者に報告してあげてください。

文字化け対策としての.htaccess
ttp://www.shtml.jp/htaccess/mojibake.html
@IT:Javaの文字化け対策FAQ(1)
ttp://www.atmarkit.co.jp/fjava/rensai3/mojibake01/mojibake01.html

618 名前:think ◆MM0nnAOCiQ mailto:sage [2007/03/24(土) 15:26:50 ID:Vct6LEbc0]
問題提起されている件は、

Content-Encoding: text/html; charset=csiso2022kr

でProxomitronフィルタが無効になるという現象ですね。

# Content-Typeの方はフィルタの挙動とは無関係のようです。
# 何より、Content-Typeヘッダを意図的に不正にするとWebブラウザでの閲覧の支障が出るので、そういう設定にされる可能性は低いと思います。

で、この

Content-Encoding: text/html; charset=csiso2022kr

という記述は、正しい書式なのでしょうか?
よく解らないなりに、調べてみると以下の文献が見つかり、

-----------------
内容コーディングは、section 3.5 にて定義されている。使用例を見よ。

HTTP/1.1: ヘッダフィールド定義 - 14.11 Content-Encoding
ttp://www.practical-lamp.com/LAMP/PHP/reference/rfc/html/sec14.html#sec14.11
-----------------
最初は、登録機構は以下のトークンを登録している。... gzip, conpress, deflate, identity

HTTP/1.1: プロトコルパラメータ - 3.5 内容コーディング
ttp://www.practical-lamp.com/LAMP/PHP/reference/rfc/html/sec3.html#sec3.5
-----------------

とあるので、少なくとも>602のWebサイトの出力するContent-Encodingヘッダの書式は誤っているような気がします。




619 名前:think ◆MM0nnAOCiQ mailto:sage [2007/03/24(土) 15:28:47 ID:Vct6LEbc0]
>618の説が正しいとすると、Content-Encodingヘッダも運営者側で修正する方が望ましいので、サイト運営者が .htaccess から

AddEncoding "text/html; charset=csiso2022kr" .html .htm

を削除するという配慮があると有り難いですね。(書式は少し自信がないです…。)


あえて、Proxomitron排除のために残すというサイトがあった場合は、以下のフィルタで回避できる…と思います。

[HTTP headers]
In = TRUE
Out = FALSE
Key = "Content-Encoding: Kill faulty value (in) [2007/03/24]"
Match = "(^gzip|compress|deflate|identity)"

620 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/25(日) 00:39:47 ID:U32bBhWY0]
乙。 httpd.confも疑ったほうがいいですな。

>>619
Content-Encodingヘッダが無い時でもマッチしてしまうようだ。

621 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/25(日) 00:44:01 ID:ykWCl22f0]
Match = "(^gzip|compress|deflate|identity)?+"

622 名前:think ◆MM0nnAOCiQ mailto:sage [2007/03/25(日) 01:03:18 ID:sQ09AHw80]
>>620-621
レス有難う御座います。
>621を取り込ませていただきました。m(_ _)m

[HTTP headers]
In = TRUE
Out = FALSE
Key = "Content-Encoding: Kill faulty value (in) [2007/03/25]"
Match = "(^gzip|compress|deflate|identity)?"

> httpd.confも疑ったほうがいいですな。
>602は自宅サーバじゃないようなので、httpd.conf を編集する権限がないと思います。多分…。

623 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/25(日) 01:43:58 ID:U32bBhWY0]
メンテの後文字化けしたんじゃなかったっけ? 運営側が何かやらかしたのでは。

624 名前:think ◆MM0nnAOCiQ mailto:sage [2007/03/25(日) 02:57:05 ID:sQ09AHw80]
>>623
その可能性には思い至りませんでした。
ざっと調べてみたところ、同サービスの他のサイトでは同様の症状(Content-Type, Content-Encoding 含めて)が発生していないようです。

Google検索: site:saiin.net
ttp://www.google.co.jp/search?ie=utf-8&lr=lang_ja&q=site%3asaiin.net

一部のサイト(サーバ)だけ設定が誤っている可能性も否定出来ませんが…。

625 名前:think ◆MM0nnAOCiQ mailto:sage [2007/03/25(日) 03:26:51 ID:sQ09AHw80]
何にしても両方チェックしておくに超したことはないですね。

その辺りも加味して、>602のサイトへ報告しておきました。

626 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/25(日) 11:34:40 ID:civrXBG40]
ローカルに保存したhtmlをこれを通して閲覧する方法はありますか?
極力改変を加えずに保存し、閲覧時には無駄な広告やflashへのリンクを
殺して動作を軽くしたいです。

627 名前:think ◆MM0nnAOCiQ mailto:sage [2007/03/25(日) 13:44:12 ID:sQ09AHw80]
>>626
URLコマンドの file// がありますが、ローカルファイルに対して常にProxomitronを通すには他のユーティリティを利用しないと無理だと思います。
ttp://www.pluto.dti.ne.jp/~tengu/proxomitron/help/URL_Commands.html

他に、ローカルにWebサーバを立ち上げる方法があります。


628 名前:626 mailto:sage [2007/03/25(日) 15:25:33 ID:Dk5Qg+wy0]
>>627
そうですか・・
ありがとうございます。



629 名前:think ◆MM0nnAOCiQ mailto:sage [2007/03/25(日) 22:23:31 ID:sQ09AHw80]
>602のサイト復旧。
結果的に、"Content-Type: text/html", Content-Encodingなし の状態に落ち着いたようです。
# 匿名で報告したので、具体的な対処法(原因)は判りませんでした。

何はともあれ、>602氏の問題は解決しました。

630 名前:think ◆MM0nnAOCiQ mailto:sage [2007/03/25(日) 22:28:52 ID:sQ09AHw80]
失礼。
>629の件ですが、掲示板に復旧までの経緯が記載されていました。
.htaccess は無関係で、サーバの管理者に報告したのみ…ということです。

631 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/26(月) 17:25:13 ID:z4qaU8SK0]
すべらない名無し(ttp://by774.blog73.fc2.com/)にある、
Brainerのテキスト広告をカットしたいのですが、下記ではうまく仕事をしてくれません。
どなたかご教授願えせんでしょうか。

[Patterns]
Name = "[User] AD @ Brainer"
Active = TRUE
Limit = 1139
Match = "$NEST(<script[^>]+>,</script>)<script[^>]++ad.brainer.jp[^>]+></script>$NEST(<iframe[^>]+>,</iframe>)"
Replace = "<!-- AD @ Brainer - Blocked by Proxomitron -->"



>>626
FirefoxならAdblockが使える。

632 名前:think ◆MM0nnAOCiQ mailto:sage [2007/03/26(月) 18:51:02 ID:hy1J35Zo0]
>>631
該当Webサイトのhtmlソースを拝見しました。
マッチさせたい箇所は以下の部分ですよね?

<script type="text/javascript"><!--
brainer_partner_id = "****";
...
brainer_channel = "****";
//--></script>
<script type="text/javascript" src="ad.brainer.jp/ad.js"></script>

## 引用元: ttp://by774.blog73.fc2.com/blog-entry-2210.html

iframe要素が見あたらないために、マッチしていないと思われます。
更に簡単に書くならば、<script type="text/javascript" src="ad.brainer.jp/ad.js"></script> だけにマッチさせても良いですね。
前述のscript要素の内容コードは、変数の初期化だけですので本元の処理部分をカットするだけでも広告を取り除けます。(script要素の順番に配慮しなくても良いのも利点)
細かいことをいえば、ad.brainer.jp はsrc属性値に限定した方がベターだと思います。

633 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/26(月) 21:21:23 ID:z4qaU8SK0]
>>632
どうもありがとうがざいます。
火狐の「選択した部分のソースを表示する」を使ってしまい、確認を怠っていましたorz
今までのテストでおkなのに引っ掛からなかったフィルタも確認しなければ(´・ω・`)
前半の$NEST部分は仰るとおり必要ないのですが、
ソースを見たときに痕跡があると何故かヽ(`Д´)ノフォオオオ!となるので、
個人的にくっつけていたりいなかったり。

[Patterns]
Name = "[User] AD @ Brainer"
Active = TRUE
Limit = 640
Match = "$NEST(<script[^>]+>,</script>)<script[^>]++src="ad.brainer.jp/ad.js"[^>]+></script>"
Replace = "<!-- AD @ Brainer - Blocked by Proxomitron -->"



634 名前:620 mailto:sage [2007/03/27(火) 21:51:05 ID:WBi+faku0]
>>629-630
お疲れ様でした。 運営側のミスでしたか、こういうこともあるんですね。

>>626
ブラウザを起動してるときにProxomitronのメインウインドウに目的のhtmlファイルをD&Dすれば
フィルタリングされたページがブラウザに表示されます。 このときブラウザのアドレスバーに
表示されるURLをお気に入りに入れておくと便利かも知れません。

635 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/28(水) 07:07:18 ID:LqglA30l0]
ローカルファイルに対してフィルタをかけたいんですが、うまくいきません。
具体体には、FirefoxのRSSリーダであるSageが作成するページに
フィルタリングをかけ、記事中に割り込んでくる広告を削除したいのですが。
file//pathでローカルファイルをWebページと同様にフィルタリングが
出来ると言うところまではわかったのですが(無論プレフィックスも設定しています)、
Webページフィルタの「URLのマッチ」の欄に、
file//C:/*/sage.html
と入れてもマッチしていない様なのです。
フルパスだと
file//C:/Docoments%20and%20Settings/Users/Application/〜/chome/sage.html
と言う感じで、フルパスで書いても同じ現象でした。
ダミーとして簡単なHTMLファイルをC:直下において、file/C:/test.html
やってみたのですが、やはりフィルタリングされない模様です。
どこか記述や使い方など、間違っている部分があればご指摘願いたいのですが・・・。

636 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/28(水) 09:25:12 ID:zqd/h+Lp0]
「URLのマッチ」欄では"http(s|)://"は含めないで下さい。

637 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/28(水) 13:17:57 ID:YK1sZGBa0]
>>635
「URLのマッチ」の欄を消したらフィルタは期待通りに動く? 動かないなら論外。 動くのなら>>636の確認と、
Proxomitronの 「設定」 - 「アクセス」 - 「URLベースのProxomitronコマンドを無効にする」 のチェックが入っていれば外す。

あと、Firefoxで広告消すならAdblockもあるよ。 新しいコマンドが追加されてて面白そう。

【CSS】Mozilla広告ブロック【Adblock】
pc11.2ch.net/test/read.cgi/software/1154403706/584-585

638 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/28(水) 22:54:30 ID:YK1sZGBa0]
>>634の方法だとファイルパスの中の ":" が何故か "%7C" に置換されてしまう。( %7C = "|" 、正しくは %3A。)
このためページが見つからずにエラーになるのでそれを修正するURL Control系のリスト用コード。

--------------------------------------------------------------------------------------------
# ProxomitronウインドウにhtmlファイルをD&Dした時のURLを修正。 "prefix.." は各自のprefixに書き換える。
http://prefix..file//([a-z]+{1,2})\0%7C/\1&$JUMP(http://prefix..file//\0:/\1)
--------------------------------------------------------------------------------------------

この現象はデフォルトの4.5June、4.5 338で確認。



639 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/29(木) 01:40:52 ID:oWBN6QKE0]
>>636-637
試してみましたが、期待通りに動きませんでした・・・論外って事ですね。
フィルタ自体はテストも動くし、同一内容のhtmlをコピーして別サーバにアップして試したところ
問題なく動いたので、フィルタが間違っているわけでは無いと思うのですが・・・。

ログを見ているとローカルに対しては全くフィルタを適用しようとしていない様に見えます。
設定のチェックは外しているのですが。

諦めます・・・レスありがとうございました。

640 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/29(木) 01:47:44 ID:nwH5ZQHV0]
Sageは使ったことないからよく知らないけど、
広告だったら何か規則性があるんでないの?
<div class="ad"> の中に入っているとか、
<a href="広告サイトのURL"> とか。
スタイルシートで消すことが可能かもしれない。

641 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/29(木) 04:02:19 ID:oWBN6QKE0]
ありがとうございます。
おっしゃるとおりで、普段はIEとFirefoxを使い分けているので、どちらかのブラウザに
依存する方法で広告削除はしたくなかったのですが、今回はFirefoxに依存した
問題なのだから、FirefoxのCSSで消してしまえば良かったのですよね。
Proxomitronで消す事ばかりを考えてしまって、そこに考えが至りませんでした。

件の広告はCSSを用いて無事に削除出来ました。
フィルタがローカルに適用されないというのが未だに解決していないのが
気持ちの悪いところではあるのですが、ともあれレスをくれた皆さん、
ありがとうございました。

642 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/29(木) 07:31:26 ID:ve+QA7+t0]
>>639
Ctrl+F5で強制リロードしてもダメ?

643 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/29(木) 07:56:26 ID:oWBN6QKE0]
>>642
キャッシュを読まずにリロードって事ですよね?
ダメでした・・・。

644 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/29(木) 09:22:28 ID:ve+QA7+t0]
検索表現で改行コードを"\n"にしている。

WebにASCIIモードでアップ → 改行コードが 0Ah となり、マッチ
ローカルでフィルタリング → 改行コード 0Dh 0Ah でマッチせず

とか。(苦しいか...)

645 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/29(木) 12:00:10 ID:Tylg9NKN0]
>643
chrome://sage/content/feedsummary.html?uri=[URL]
URLがこういう感じの形式だからじゃないの?

646 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/30(金) 02:27:46 ID:N5oMoR0M0]
>>644
検索条件に改行コードは含んでいないです。

>>645
ロケーションバーに表示されるsageのURLは、
file:///C:/Documents%20and%20Settings/UserName/(省略)/chrome/sage.html
です。省略部分は一般のプロファイルの場所です。

レスが頂けるのは大変嬉しく勉強にもなるのですが、
流石にスレ違いな気がしてきたので、スルーしていただいて結構です・・・。
すみません、ありがとうございます。

647 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/30(金) 03:28:46 ID:Fk+PoKNY0]
FXがローカルのファイルを直接開いてるんじゃないの?
そうだとしたら対処不能

648 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/30(金) 14:55:49 ID:fRAcFZO30]
ttp://www.bbsnews.jp/index.html
ここのトップだけscriptタグを範囲にしてマッチさせようとしても広告消してくれないんですが上手い方法ってあるんでしょうか?
他のランキングは消せたので原因がよくわかりません



649 名前:think ◆MM0nnAOCiQ mailto:sage [2007/03/30(金) 21:43:47 ID:z1oSbQ+H0]
>>648
特に問題は見あたりませんでした。
マッチしないフィルタを開示できるのであれば、アドバイスできるかもしれません。

650 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/31(土) 13:04:14 ID:qvhXZMuJ0]
とりあえずのこの脆弱性対応
ttp://www.microsoft.com/japan/technet/security/advisory/935423.mspx

Name = "Cut Cursor"
Active = TRUE
Limit = 500
Match = "cursor (:|=) [^;}>]+"

超誤爆上等注意
まぁ、見ただけでアウトな脆弱性だから対応パッチが出るまでのしのぎレベルで
#私は昔から常用してるフィルタなんだけどねw

651 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/01(日) 00:28:32 ID:uRgnshK20]
<font style="&#x63;ursor:url(mailto:kuso.ani)">feffeffe</font>

652 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/01(日) 15:01:41 ID:0jf8ZLJk0]
TOK2広告、4月1日現在、Limit = 13640
確実に増え続けている。
Proxomitronを意識しているとしか思えないんだが。

653 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/01(日) 15:05:11 ID:NVBogZYX0]
↑馬鹿

654 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/01(日) 17:20:26 ID:EDThOvVs0]
やっつけ
Match = "(c|\c)(u|\u)(r|\r)(s|\s)(o|\o)(r|\r) (:|=) [^;}>]+"

655 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/01(日) 17:23:40 ID:EDThOvVs0]
ぐは
これでどうだ
Match = "(c|\&#x63;)(u|\&#x75;)(r|\&#x72;)(s|\&#x73;)(o|\&#x6F;)(r|\&#x72;) (:|=) [^;}>]+"

656 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/01(日) 17:29:21 ID:EDThOvVs0]
これ、10進とかにも対応とか考えると重くなるだけな気がするな
$UESCの検索側版って無いのかな?

657 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/01(日) 19:16:38 ID:CvldivIu0]
CSS内の数値文字参照を本来の文字に戻してから、
他のフィルタで処理したほうが良いような

658 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/01(日) 20:55:33 ID:NqLKJzxg0]
>>652
>>574 では駄目なのか




659 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/01(日) 21:20:06 ID:YuF/sEJL0]
>>650
ユーザースタイルシートで
*{cursor:auto!important;}
とやったらどうかな

660 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/02(月) 00:01:33 ID:BXoP6IEA0]
IE6じゃ!important使えなかった希ガス

661 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/02(月) 00:48:07 ID:UKQKuB2c0]
>>660
え??????

662 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/02(月) 13:43:50 ID:poYN2CYf0]
>>653>>658
うん、TOPではなくUNDERのほうだよ。
TOPは増えないから通常通りで大丈夫。

663 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/02(月) 20:31:38 ID:ezmG3rBo0]
>>659
なるほど、その方法は良さそうだな
考えつけなかった

664 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/03(火) 00:33:16 ID:J5HArJ7i0]
>>659,663
それ、ちゃんと機能する?
IE6では駄目だった。

>>650,655の10,16進大文字小文字対応…重いかな?
実体参照の区切り文字 ; が無くても有効だ!
Match = "(c|\&#(x63|x43|67|99)(;|))"
"(u|\&#(x75|x55|85|117)(;|))"
"(r|\&#(x72|x52|82|114)(;|))"
"(s|\&#(x73|x53|83|115)(;|))"
"(o|\&#(x6F|x4F|79|111)(;|))"
"(r|\&#(x72|x52|82|114)(;|)) (:|=)[^;}>"]+"

実体参照が有効なのはインラインでのスタイル定義(>>651)だけで
.cssファイルと<style>ブロック内では無効みたいだね。

665 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/03(火) 01:34:59 ID:NxFim7nS0]
アニメーションカーソルはfaviconにも使えるそうだし拡張子偽装も出来るそうだから
弾くの難しいだろうね


666 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/03(火) 01:58:18 ID:+KrQYJGn0]
IEを使わない。これで>665も解決できると思われ。
MIME-Type もろくに見ないようなブラウザを使うのが悪いと言わざるをえない。
favicon は、*.ico か image/x-icon を\kすればいいのかな。

667 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/03(火) 02:49:31 ID:6wNViq4u0]
うは、数字前部複数の 0 、文字間に %00 があっても有効だった。
キリがない…orz もう、これで終わりにしますぅ。>>664でした。
Match = "(c|\&#(x[0]+{0,*}(63|43)|[0]+{0,*}(67|99)) (;|)) "
"(u|\&#(x[0]+{0,*}(75|55)|[0]+{0,*}(85|117)) (;|)) "
"(r|\&#(x[0]+{0,*}(72|52)|[0]+{0,*}(82|114)) (;|)) "
"(s|\&#(x[0]+{0,*}(73|53)|[0]+{0,*}(83|115)) (;|)) "
"(o|\&#(x[0]+{0,*}(6F|4F)|[0]+{0,*}(79|111)) (;|)) "
"(r|\&#(x[0]+{0,*}(72|52)|[0]+{0,*}(82|114)) (;|)) (:|=) [^;}>"]+"

668 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/03(火) 02:50:32 ID:O0ftgExI0]
>>664
ちょいと&#x063;とかにすりゃもうすり抜けられちゃうし。
こういうのってそうやってゴチャゴチャ書いててもやっつけ解決にすらならんよ。



669 名前:668 mailto:sage [2007/04/03(火) 02:52:16 ID:O0ftgExI0]
入れ違いになってしまった。

670 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/03(火) 02:55:49 ID:O0ftgExI0]
ちなみにキミの書いているのは(文字)実体参照ではなくて数値文字参照だ。

どうでもいいけど。

671 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/03(火) 03:58:17 ID:u5Y7aheh0]
>>667補足です。
>・・・文字間に %00 があっても有効だった。

& # x 0 0 6 3 ; u r s o r :
 ↑半角スペースを %00 と読み替えて下さい。
当然ながら>>667ではマッチしませんから…中途半端でスマソでした。

>>669-670
了解です。

672 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/03(火) 04:53:45 ID:+KrQYJGn0]
仮に理想的なフィルタができたとしても、
よほど処理が軽くない限りは使いたくないものだな。
そこまで悪意を持ったサイトなんてあるんだかというのが知りたい。
まあ、精神的ブラクラを集めたような物好きサイトがあるのも確かだが。

673 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/04(水) 03:51:09 ID:j6rLwbwp0]
この手の物をおみとろんで全部弾くには相当な手間になると言う事か
>>672
半分は思考実験かと
今回だけでなく、今後にも役に立つ可能性が残るし

674 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/04(水) 09:03:43 ID:Ww/FJYxO0]
プロファイル結果...
サンプルテキスト : 30000 バイト(このスレのhtmlソース)
成功マッチ数 : 1
(5回試行した平均値)
>>650 平均時間 : 0.37 (ミリ秒)
>>655 平均時間 : 0.72 (ミリ秒)
>>664 平均時間 : 0.73 (ミリ秒)
>>667 平均時間 : 0.73 (ミリ秒)

   ↓平均時間 : 0.73 (ミリ秒)
Match = "(c|\& # (x (0 )+{0,*}(6 3|4 3)|(0 )+{0,*}(6 7|9 9)) (;|)) "
"(u|\& # (x (0 )+{0,*}(7 5|5 5)|(0 )+{0,*}(8 5|1 1 7)) (;|)) "
"(r|\& # (x (0 )+{0,*}(7 2|5 2)|(0 )+{0,*}(8 2|1 1 4)) (;|)) "
"(s|\& # (x (0 )+{0,*}(7 3|5 3)|(0 )+{0,*}(8 3|1 1 5)) (;|)) "
"(o|\& # (x (0 )+{0,*}(6 F|4 F)|(0 )+{0,*}(7 9|1 1 1)) (;|)) "
"(r|\& # (x (0 )+{0,*}(7 2|5 2)|(0 )+{0,*}(8 2|1 1 4)) (;|)) (:|=) [^;}>"]+"

興味本位の改変なので、突っ込まんで下され。

>>672-673
同意。

675 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/04(水) 09:19:38 ID:/oqEdOnS0]
<font style="cursor feffeffe:url(mailto:kuso.ani)">nmooi</font>
www.microsoft.com/japan/technet/security/bulletin/ms07-017.mspx

676 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/04(水) 09:54:55 ID:qTxRbb9j0]
>>675
パッチ来たのか、今回は随分早いな。

677 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/05(木) 03:37:36 ID:l42HB2fw0]
>>675
おお!
他にどんなパターンが考えられますか?

678 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/05(木) 14:38:16 ID:/B+A98J/0]
nico動画のID表示フィルタってありませんか?



679 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/06(金) 13:25:48 ID:/V316V1o0]
URLをリストで管理する際に、ずっと感じている疑問。
href=$AV((|https://|//|)$LST(リストの名前)*)\1
まず最初に使い方を書いておくと、このような感じ。

疑問1。
「~」と「%7E」のどちらにもマッチさせるには (~|%7E) と書くしかないのかな。
href="http://somehost.jp/~anyname/"
href="http://somehost.jp/%7Eanyname/"
このような例はリンク先が同じになるけれども、両方にマッチさせるには、
somehost.jp/(~|%7E)anyname/
このように書いているのが現状。なんとなくメンテナンスしにくい。
$UESC が使えないかと思うものの、いい方法はないのかな。

疑問2。
href="http://www.yahoo.co.jp/"
href="http://www.yahoo.co.jp"
href="http://www.yahoo.co.jp/index.html"
など、トップページへのリンクのみにマッチさせたいときは、
www.yahoo.co.jp(/|/index.html|)(^?)
こう書いているんだけれど、これもメンテナンスが面倒。
上記は yahoo の例だけど、google に対しても同じことをしたければ、
www.google..co.jp(/|/index.html|)(^?)
やはり(各サイトごとに)このように書かなければならない。


上記2点のようなことがあると、リスト(URL)の内容が煩雑に見えるので、
もっと見やすい(煩雑に見えない)書き方があれば教えてください。
(/|/index.html|)(^?) の部分をフィルタ側に書くなど、何か工夫できるといいんだけど。

680 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/06(金) 16:47:12 ID:Md9XOTKa0]
>>679
%7Eの件はURLを$UESCしたものをグローバル変数に入れて
そのグローバル変数を$TSTでテストする。 (リストを$TSTの中に置く)
ただし速度的にかなり遅くなるので遅いマシンではもっさりしてしまうかも。

(/|/index.html|)(^?)の件はこれだけを記述したリストを別に用意して
www.google.co.jp$LST(ROOT) のように使う。

681 名前:think ◆MM0nnAOCiQ mailto:sage [2007/04/06(金) 17:08:49 ID:7LcMj/ni0]
>>679
> (/|/index.html|)(^?) の部分をフィルタ側に書くなど、何か工夫できるといいんだけど。
未検証の上、効率が下がりますが。

href=$AV((^(^[_0-9a-z-]+{2,*}(.[_0-9a-z-]+{2,*})+{1,*}(:[0-9]+|(^:))((^?)|/index.(html+|php|cgi)(^?))))
\0(index.(html+|php|cgi)(^?)$SET(Temp=\0)|(^?)$SET(Temp=\0/)))
$TST(Temp=$LST(リストの名前)*)

あるいは、煩雑なコードに目をつぶって、テキストエディタの一括置換でメンテナンスするぐらいでしょうか。

682 名前:think ◆MM0nnAOCiQ mailto:sage [2007/04/06(金) 17:24:57 ID:7LcMj/ni0]
>680氏の提案された

> %7Eの件はURLを$UESCしたものをグローバル変数に入れて

ですが、そのままアンエスケープすると、

 ttp://www.google.co.jp/search?ie=utf-8&lr=lang_ja&q=%2f%26%3f

のように検索パラメータまでアンエスケープされてしまいますので、ご注意下さい。
特に、/&? のアンエスケープは予期せぬ不具合の原因となりそうな気がします。

683 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/06(金) 20:48:20 ID:ZQc0Ffc80]
パッチも出たことだし用済みとなりましたが…
>>650,655,664,667,674
>>651,671,675
Match = "cursor[^:=}]+(:|=) url\([^)}]+\)(;|) \1}$SET(0=\1})|"
"style=$AVQ(\1"
" (c|\& # (x (0 )+{0,*}(6 3|4 3)|(0 )+{0,*}(6 7|9 9)) (;|))"
" (u|\& # (x (0 )+{0,*}(7 5|5 5)|(0 )+{0,*}(8 5|1 1 7)) (;|))"
" (r|\& # (x (0 )+{0,*}(7 2|5 2)|(0 )+{0,*}(8 2|1 1 4)) (;|))"
" (s|\& # (x (0 )+{0,*}(7 3|5 3)|(0 )+{0,*}(8 3|1 1 5)) (;|))"
" (o|\& # (x (0 )+{0,*}(6 F|4 F)|(0 )+{0,*}(7 9|1 1 1)) (;|))"
" (r|\& # (x (0 )+{0,*}(7 2|5 2)|(0 )+{0,*}(8 2|1 1 4)) (;|))[^;"]+ \2"
")$SET(0=style=\1\2)"
Replace = "\0"

サンプルテキスト : 30000 バイト
平均時間 : 0.511000 (ミリ秒)

一行目を {} で括って {\1cursor[^:=}]+(:|=)[^;}]+(;|) \2}$SET(0={\1\2}) のようにすると
平均時間 : 0.881000 (ミリ秒)

a{ cursor アXXXイ ウYYYエ: url( mailto: kuso.ani オZZZ ) } ←こんなのも有効でした。
半角スペースの部分は[%00]から[%20]までマッチさせた方が望ましい。

684 名前:679 mailto:sage [2007/04/07(土) 06:24:57 ID:xLSZD1g90]
どうもありがとうございます。
遅くなる上に誤動作の可能性ありですか。パワーのないマシンでは厳しい。

$LST(ROOT) を使う場合、中身は以下のようになるのかな。
(/|/index.html|)(^?)
(/|/index.php|)(^?)
index.php などになっているサイトもあるので。

wƾw.google.co.jp$LST(ROOT) のような場合、
ドメイン名の後に$LST(など、何かしらの文字)を書かねばならないので、
見やすくはなるものの、(/|/index.html|)(^?) を書くのとあまり変わりないかもしれない。
軽さを重視して、何より誤動作させたくないのであれば>679のままでよさそう。

余談だけど>679を書いたのは、
\kの対象などになる URL のリストが長くなったのがきっかけ。
一度登録すると削除することがなかなかないものだから、
ドメインなどのリンク切れチェックや誤爆チェックをするため、
URL を最初から書き直すことにした。
個人サイトのウェブリングや、中小規模のショップなどはリンク切れがけっこうありそう。
1年から2年に1回くらいはリストを書き直すといいかもしれない。

685 名前:680 mailto:sage [2007/04/07(土) 08:35:42 ID:8xuLEh/P0]
>>684
すみません、質問の内容を勘違いしてました。
$LST(ROOT) はサイトのトップだけでなくその他のURLもリストに登録するような場合に使うと便利ですが、
サイトのトップだけをリストにまとめる場合には無駄になります。
この場合はthink氏のようにフィルター側で対応するべきでした。

>$LST(ROOT)の誤動作
私の知る限りは誤動作する心配はいらないと思います。 むしろ(/|/index.html|)(^?)を書く際の
記述ミスの心配が無くなり確認もラクになるので二者択一の場面があれば私なら積極的に使います。

>>682
実際にフィルターを書く場合にはURLの一部を取り出し、そこだけ変換するような書き方になると思います。
しかしURLの一部を改変してしまうことには変わりはないので何らかの不具合は覚悟の上で使うことになります。
この方法は (~|%7E) と比べると余計に面倒なことになるのであまり現実的ではありませんね。

686 名前:think ◆MM0nnAOCiQ mailto:今日こそは、ReplaceStr.txt の汎用フィルタを作ろう sage [2007/04/07(土) 16:55:40 ID:cyEdAINr0]
>>683
流れを追い切れてませんが、お疲れ様です。

>>684
誤動作に関しては、しっかりとテストを行えば、クリアできる課題だと思います。
しかし、遅くなるのはどうしようもありませんね…。
(/|/index.html|)(^?) の書き方をする場面は限られてくると思うので、速度も気になるのでしたら、テキストエディタの「一括置換」で管理する方が用途に合うと思います。

>>685
> しかしURLの一部を改変してしまうことには変わりはないので何らかの不具合は覚悟の上で使うことになります。
>682の他に、マルチバイト文字をデコードしたときにも誤爆する可能性があることに気がつきました。
ASCII文字のみに絞ってURLエンコードされた文字列を指定すれば、誤爆を回避できそうですが、面倒なことには変わりなく。
以下の表現からの派生を考えてみましたが、思いの外、時間がかかりそうだったので中断しました。

([_0-9a-z-]+{2,*}(.[_0-9a-z-]+{2,*})+{1,*}(:[0-9]+|(^:))/)\#
(([^#?/%]++)\#(((%([0-7][0-f]))+)\0$SET(#=$UESC(\0))((%[0-f]+)+[^#?/%]+)\#)+(/)\#)+\#

687 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/09(月) 02:20:48 ID:zSOO4a+F0]
チラシの裏。

リストの拡張子を.cfgに変更して、.cfgをメモ帳よりもちょっと高機能なエディタに関連付けした。
.txtはいまだにメモ帳を使っているけど、
リストを編集するときにはアンドゥくらいは楽にできるとよいので
拡張子変更という手段をとってみた。
タスクトレイのアイコン右クリックからでも、指定したエディタが起動してなかなかよさげ。

688 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/09(月) 02:22:55 ID:5sO+vonU0]
妙な関連付けを一般化するよりは
エデター+パラメターでショーツカッツ作った方が利口そうに思えるのだが



689 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/09(月) 02:35:43 ID:zSOO4a+F0]
>688
1. 使用したいエディタのショートカットをSendToフォルダに入れる。
2. リストがあるフォルダを開いてから右クリック→送る
こういうやり方でもいいかなーと思ったけど、
タスクトレイのアイコン右クリックから開けるのが便利なので関連付けすることにした。
.cfgなんて拡張子はProxomitron以外だとあまり見かけないし、
.cfg専用にアイコンを設定しておいたので、開きたくない.cfgを誤って開くこともないかなと。

690 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/09(月) 03:06:58 ID:7Je96E6Q0]
いずれにせよ
100歩遅れてるぞ

691 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/09(月) 10:04:18 ID:fUCp2oiA0]
それなりのエディタ持っててメモ帳使う意味が分からん。

692 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/09(月) 10:13:25 ID:f4aajwxY0]
cfgはOTBEditに関連付けしてる。 関連付けして不都合でもない限りしたほうが利口だと思う。

693 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/09(月) 10:16:15 ID:bCBiMOfp0]
ニコニコ動画のwww.nicovideo.jp/randomのgifを
指定のgifにするフィルタってないかな?
030.gifに固定したいんよ…

694 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/09(月) 11:49:27 ID:Lin40nlx0]
>>693

[Patterns]
Name = "nicovideo randomgif to static"
Active = TRUE
URL = "www.nicovideo.jp/random $TYPE(htm)"
Limit = 256
Match = "<script type="text/javascript" src="js/illust.js"></script></a><noscript><img src="img/tpl/head/illust/000.gif" alt=""></noscript>"
Replace = "</a><img src="img/tpl/head/illust/030.gif" alt="">"

695 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/09(月) 12:10:25 ID:bCBiMOfp0]
>>694
申し訳ありません
効果無いです…

696 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/09(月) 12:37:48 ID:f4aajwxY0]
>>695
[HTTP headers]
In = FALSE
Out = TRUE
Key = "URL: niko 030.gif (out)"
Match = "www.nicovideo.jp/img/tpl/head/illust/(^030.gif)[0-9]+.gif(^?)"
Replace = "$JUMP(www.nicovideo.jp/img/tpl/head/illust/030.gif)"

697 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/09(月) 12:43:21 ID:bCBiMOfp0]
>>696
ありがと〜ございます!

698 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/09(月) 13:00:49 ID:Lin40nlx0]
>>695
きまぐれ検索ページ限定じゃなかったんだな。
ごめんな。



699 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/09(月) 17:15:19 ID:kYTyr62b0]
こちらこそごめんなさい。

700 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/11(水) 01:50:11 ID:1C3+uH/D0]
>>683修正
Match = "$NEST({,\1cursor[^:=]+(:|=)[^;]+(;|) \2,})$SET(0={\1\2})|"
"style=$AV(\1"
" (c|\& # (x (0 )+{0,*}(6 3|4 3)|(0 )+{0,*}(6 7|9 9)) (;|))"
" (u|\& # (x (0 )+{0,*}(7 5|5 5)|(0 )+{0,*}(8 5|1 1 7)) (;|))"
" (r|\& # (x (0 )+{0,*}(7 2|5 2)|(0 )+{0,*}(8 2|1 1 4)) (;|))"
" (s|\& # (x (0 )+{0,*}(7 3|5 3)|(0 )+{0,*}(8 3|1 1 5)) (;|))"
" (o|\& # (x (0 )+{0,*}(6 F|4 F)|(0 )+{0,*}(7 9|1 1 1)) (;|))"
" (r|\& # (x (0 )+{0,*}(7 2|5 2)|(0 )+{0,*}(8 2|1 1 4)) (;|))[^;]+(;|) \2"
")$SET(0=style="\1\2")"
Replace = "\0"

<font style = ' cursor feffeffe : url( " mailto: kuso.ani " ) '>nmooi</font> ←に対応

1行目比較
サンプルテキスト : 30000 バイト
平均時間 : 0.571000 (ミリ秒) ← cursor[^:=}]+(:|=) url\([^)}]+\)[^;}]+(;|) \1}$SET(0=\1})
平均時間 : 0.821000 (ミリ秒) ← {\1cursor[^:=}]+(:|=)[^;}]+(;|) \2}$SET(0={\1\2})
平均時間 : 0.701000 (ミリ秒) ← $NEST({,\1cursor[^:=]+(:|=)[^;]+(;|) \2,})$SET(0={\1\2})

701 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/11(水) 22:23:13 ID:cQGpqEHg0]
特定のサイトだけUAをIEに変えるフィルターありませんか?
具体的に言うとDELL・・

702 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/12(木) 01:55:46 ID:yoxqXBik0]
そのくらい自分で

703 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/12(木) 11:03:10 ID:MOcLIRDj0]
>>701
自分でやって覚えようってことで、テンプレを示してみるってのはどうかと思ったが

[HTTP headers]
In = FALSE
Out = TRUE
Key = "User-Agent: Template (out) "
URL = ""
Match = "*"
Replace = ""

ほとんど空白になったのでまぁ自分でがんばれ。
URL MatchにDELLのURLを入れて、Replaceに任意のUAを入れるんだよ。

704 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/12(木) 14:05:18 ID:NgCTnRpZ0]
ワイルドカードいらない

705 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/15(日) 09:19:20 ID:gMOTS18V0]
Vectorでダウンロードのたびに、Vアップ通知画面見させられるの回避するフィルター教えてください。
JUMPとか使いそうなんですけどさっぱりわかりません。

706 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/15(日) 10:58:16 ID:xcMSre2P0]
>>705
Vector ってゲームとソフトとで別の構成なのよね。
Vアップ通知画面を回避するという意味で、こんなのはどう?

Leeyes(WindowsNT/2000/XP / 画像&サウンド)
www.vector.co.jp/soft/dl/winnt/art/se381425.html

とかの、ダウンロード画面でいきなりリダイレクトするWEBページフィルタ。

[Patterns]
Name = "Vector Soft DL Redirect"
Active = TRUE
URL = "*vector.co.jp/soft/dl/"
Limit = 200
Match = "<META NAME="download" CONTENT="\0">"
"$STOP()"
Replace = "<meta http-equiv="refresh" content="0;url=\0">"
"\k"

707 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/15(日) 11:48:44 ID:UGe0bqze0]
[Patterns]
Name = "Vector download add link- (2007/04/15)"
Active = TRUE
URL = "www.vector.co.jp/soft/(dl/|)win"
Limit = 256
Match = "(<META NAME="download" CONTENT="http://download.\8">)\0$SET(_link=\8)|"
        "(<META NAME="ve_@title" CONTENT="\8">)\0$SET(_title=\8)|"
        "(<!-- soft data -->\s<table id="soft_data">)\8"
        "$SET(\0=\8\n"
        "<tr>\n"
        "   <td class="celltitle">Download : </td>\n"
        "   <td> <a href="ftp://ftp.$GET(_link)">FTP</a> <a href="http://download.$GET(_link)">HTTP</a> $GET(_title)</td>\n"
        "</tr>\n"
        ")$STOP()"
Replace = "\0"

ダウンロードのリンク追加するフィルタ



708 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/15(日) 12:12:08 ID:2puWsnLs0]
漏れもメタタグを置換してリンクにしてる



709 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/15(日) 12:42:36 ID:gMOTS18V0]
>>706
助かります!事前にリンク持ってくるって手もあるんですね、なるほど。
似たような例探していじってるだけだから全然応用力ない('A`)

>>707
さらに便利そうだと思って試したら何故かうちの環境じゃCPU100%で固まる・・・

710 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/15(日) 14:11:03 ID:6jv7Rx080]
うちでも固まった
どこで暴走しているんだろう






[ 続きを読む ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧](;´∀`)<385KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef