1 名前:ミスターオミトロン [2006/11/13(月) 17:00:32 ID:oCAoIukD0] このスレは作成依頼されたフィルタを有志により作るスレッドPart4です アップローダー wind.prohosting.com/proxmine/cgi-bin/uploader/ proxo.hp.infoseek.co.jp/cgi-bin/sn_uploader/upload.html Proxomitron等に関するWiki abc.s65.xrea.com/prox/wiki/ Thinking Archive(仮) vird2002.s8.xrea.com/ CastleCops Proxomitron Filters www.castlecops.com/f65-Proxomitron_Filters.html >>2-10 にいろいろと
577 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/18(日) 21:56:22 ID:WywTxmu/0] >>573 Content-Type: をimage/jpegからtext/htmlに置換するフィルタで対処。 URL欄を使ってフィルタが動作するサイトを絞ってから使うといいよ。 [HTTP headers] In = TRUE Out = FALSE Key = "Content-Type: image to html (In)" URL = "www.hoge.com/" Match = "image/jpeg" Replace = "text/html" >>576 画像ファイルはデフォルトではフィルタリング対象外のはず。 その画像を見れば対策方法が分かるかも。
578 名前:ROMラー mailto:sage [2007/03/18(日) 23:52:16 ID:WywTxmu/0] >>506 これで期待通りに動くようです。 # NoAddURL (#?+)\9$URL(\8)$SET(ABS=\8\9) ./(?+)\9($TST(SWITCH1=1)$SET(ABS=$GET(CURRENTURL)\9)| $URL(([^:]+://*/([^/]+/)+)\8)$SET(CURRENTURL=\8)$SET(SWITCH1=1)$SET(ABS=\8\9)) /(?+)\9$URL(([^:]+://*/)\8)$SET(ABS=\8\9) ../($TST(SWITCH2=1)$SET(NUM=$GET(LEVEL))|$URL([^:]+://*/$SET(NUM=1) ([^/]+/$LST(increment))+)$SET(SWITCH2=1)$SET(LEVEL=$GET(NUM))) ($LST(decrement)../)+$URL(([^:]+://*/([^/]+/$LST(decrement) $TST(NUM=[^0]*))+)\8)(?+)\9$SET(ABS=\8\9) ([a-z]+:?+)\9$SET(ABS=\9) (?+)\9$URL(([^:]+://*/([^/]+/)+)\8)$SET(ABS=\8\9)
579 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/19(月) 00:42:49 ID:tQMpuigO0] >>575 遅くなりましたが、ありがとうございます。
580 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/19(月) 00:45:50 ID:NXCUdEyC0] 本スレが不毛な言い争いの場に… DOCTYPE宣言があればそのまま、無ければ付加ってフィルタを作ろうと思ったのに 前者が実現できなくて問答無用に付加されてしまう 有効リストなり無効リストなりを作ってマッチさせる手もあるけど それじゃ汎用性が落ちるからなぁ
581 名前:ROMラー mailto:sage [2007/03/19(月) 00:48:14 ID:7ZzHzeuq0] >>506 $GET(ABS)と\8\9が一致しない原因は以下のフィルターを試せば分かります。 テストウインドウに"abc"と書いて下の3つのフィルターを試して下さい。 Name = "$SET test1" Active = FALSE Limit = 256 Match = "*" Replace = "<match>" Name = "$SET test2" Active = FALSE Limit = 256 Match = "*$SET(\0=text)" Replace = "<match>" Name = "$SET test3" Active = FALSE Limit = 256 Match = "?+$SET(\0=text)" Replace = "<match>" 1と2の違いは$SET(\0=text)が付いてるかどうかの違いしかありませんが結果が 変わっていると思います。 3では2で起きた問題を修正するために*を?+に書き換えています。
582 名前:ROMラー mailto:sage [2007/03/19(月) 01:09:43 ID:7ZzHzeuq0] >>506 何故こうなるかというと、*は後ろに何かがあれば最短一致として動作、無ければ 最長一致として動作するためです。 *の後ろに$SETコマンドがあると*は最短一致として 動作するようになってしまうので2のようにカラにマッチしてしまうわけです。 そこで後ろに何があっても最長一致をする?+を使うことでこの問題を回避しています。 >>580 こんな感じですかね。 Active = FALSE Limit = 256 Match = "(" "(^(^ <!DOCTYPE))" "|" "$SET(0=<!DOCTYPE ....)" ")" "$STOP()" Replace = "\0"
583 名前:580 mailto:sage [2007/03/19(月) 06:43:35 ID:NXCUdEyC0] >>582 お、これはありがとうごぜぇやす ブックマークから適当に踏んで試してみたらXML宣言ありなページで誤爆したんで 回避する為に”(^(^ *<;!DOCTYPE))”に変えてしばらく使ってみるっす そこでSTOPかけるのを思い付かんかったのと 宣言文に続く<HTML〜まで見るようにしてたのが敗因か
584 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/19(月) 18:06:50 ID:WHlPa9sf0] >>577 ども URL: Filter image extension をブラクラ用にオンにしてます ログに Protect Contents except HTML が出てます ttp://www.mxtv.co.jp/goji/ ここの画像がそうなります
585 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/20(火) 16:44:20 ID:0LIwAOV50] Amazonの長ったらしいURLを短くするフィルターありませんか? こんな感じで ttp://rag2ch.s151.xrea.com/archives/2007/02/10-0018
586 名前:ROMラー mailto:sage [2007/03/20(火) 17:30:14 ID:PPne+SNt0] >>584 Protect Contents except HTMLというフィルタが誤爆しているようなので このフィルターを修正するしかないですが、ログを検索してみてもこのフィルターを 配布しているところが見つかりません。 よろしければここに貼るか、うpして頂けないでしょうか。 問題が起こるところがそのサイトだけならば (^([^/]++.|)mxtv.co.jp/) をそのフィルターの URL欄の先頭に入れれば回避出来ますが、根本的な解決にはなりません。
587 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/20(火) 20:49:41 ID:PJkWD4Ws0] >>585 ヘボくてすんません、おかしかったら誰か直してやってください 勉強させていただきやす。 [HTTP headers] In = FALSE Out = TRUE Key = "URL: Amazon URI Simplizer alpha.1.3.1" URL = "www.amazon.co.jp/\w(ASIN(/|=)|obidos/|product/)[0-9A-Z]+{10}?" Match = "*([0-9A-Z]+{10})\0" Replace = "$JUMP(www.amazon.co.jp/o/ASIN/\0 )$LOG(R[Amazon] www.amazon.co.jp/o/ASIN/\0 )" www.amazon.co.jp/gp/product/ じゃなくて www.amazon.co.jp/o/ASIN/ に飛ばす仕様なんだけど これだとまずいのかなぁ。飛べない商品とかあるかもしれない。 Amazonの仕様自体イマイチわかってないからそこも不安…。
588 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/20(火) 23:25:12 ID:4ptHUCsg0] >>585 www.amazon.co.jp/商品名/dp/* という形式の商品名の部分が長くなる原因。 この商品名の部分は実は何でも良かったりする。削除しても良し。 これをを削除するだけなら>>587 を改造してこうすれば良いと思う。 [HTTP headers] In = FALSE Out = TRUE Key = "URL: Amazon URI Simplizer (out)" Match = "www.amazon.co.jp/[^/]+/dp/\0" Replace = "$JUMP(www.amazon.co.jp/dp/\0 )"
589 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/20(火) 23:33:47 ID:0LIwAOV50] >587-588 ありがとうございました。 俺もそろそろ自分でフィルター作れるように勉強しないとな・・
590 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/21(水) 00:13:13 ID:1/lCY91m0] >>588 dpでいけるんですか…!
591 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/21(水) 00:53:03 ID:1/lCY91m0] ん、あれ?dpの商品名部分が削れればそれでOK? >>587 だと、(私の知る限りの)全ての形式のURIに対応、 かつASIN以降を全て消し去るという方向で書いてます。 お好きな方をお好みで、かな。 と思いきや、肝心の/dp/に対応してなかったので修正。 その他、商品画像ページ対応、ジャンプ先URIを更に短縮など。 [HTTP headers] In = FALSE Out = TRUE Key = "URL: Amazon URI Simplizer alpha.1.4 (out)" URL = "(www.|)amazon(.co|).jp/\w((ASIN|obidos|dp|product(/images|))(/|=))[0-9A-Z]+{10}?" Match = "*((images/|)([0-9A-Z]+{10}))\0" Replace = "$JUMP(amazon.jp/dp/\0 )" アカウントサービス内での誤爆が一番恐い。 URIに含まれる文字列と[0-9A-Z]+{10}?でのASIN探しで 一応の防御はしてるつもりなんだけど。
592 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/21(水) 01:05:18 ID:d4dDjrEw0] >>591 せっかく作ってもらってるのに贅沢は言えません。 コピーする時に後ろ削れば良いだけですし、確かにASIN以降削れればよりよいことは確かですが そのフィルターだとASINが「hoge1-hoge2-hoge3」と言う形式だと「hoge1」と認識してしまうようです www.amazon.co.jp/b/ref=amb_link_18877906_34/249-2893728-4624309?ie=UTF8&node=3245331 確認用
593 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/21(水) 01:35:35 ID:1/lCY91m0] >>592 これは恥ずかしい…。 URLマッチばっかり気にして実際のマッチを手抜きしてたのが原因でした。 [HTTP headers] In = FALSE Out = TRUE Key = "URL: Amazon URI Simplizer alpha.1.4.5 (out)" URL = "(www.|)amazon(.co|).jp/\w((ASIN|obidos|dp|product(/images|))(/|=))[0-9A-Z]+{10}?" Match = "\w((ASIN|obidos|dp|product)(/|=))((images/|)([0-9A-Z]+{10}))\0" Replace = "$JUMP(amazon.jp/dp/\0 )" まだまだ弄ってみたら、今のところ不具合が ・ユーズド商品関連に対応できない ・商品画像ページで他のカラーが見れない どんどん冗長になってくし、やっぱり>>588 ぐらいシンプルな方が 機能的にも精神衛生的にもいいみたいです。勉強になりました。
594 名前:think ◆MM0nnAOCiQ mailto:sage [2007/03/21(水) 01:55:04 ID:lHqDQGV30] Amazonの商品紹介ページ(URL)をいくつか見ました。 どうやら、/dp/ の手前は「メーカー名-商品型番-備考」で構成されているようなので、以下の形でどうでしょうか? [HTTP headers] In = FALSE Out = TRUE Key = "URL: Omit Amazon URL [2007/03/21] test1" Match = "http://(www.|)amazon.(co.|)jp/[\%0-9a-z]+{1,*}(-[\%0-9a-z]+)+{1,*}/(dp/[^/]+/)\0" Replace = "$JUMP(www.amazon.co.jp/\0 )" # 商品紹介(ASIN) www.amazon.co.jp/o/ASIN/ 商品コード/... ↓ www.amazon.co.jp/o/ASIN/ 商品コード/ # リダイレクタ www.amazon.co.jp/gp/redirect.html%3F...&location=/o/ASIN/ 商品コード%25... ↓ www.amazon.co.jp/o/ASIN/ 商品コード/ 他にも亜種がいくつかあるようですが、最近は /dp/ に統一しようとしている流れに見えますね。
595 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/21(水) 04:23:54 ID:pz60mXe50] タブブラウザでJavascriptが有効だとアドレス短くならないよね? IEだと短くなるね
596 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/21(水) 19:42:09 ID:/5cB5deu0] >>593-594 ありがとうございます。便利になりました。 私はこれで十分ですが発見した不具合でも ・Amazon外部からのURLが反応しない ・>>593 はページを右上の「Would you like to see this page in English?」が効かなくなる (ただし、外部から飛んできた時これをクリックするとURLが短くなるので英語を必要としない場合逆に便利) www.google.co.jp/search?q=Windows+site%3aamazon.co.jp 確認用
597 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/21(水) 22:05:22 ID:xaNVUTV40] アマゾンのアフィリエイトをやっている身としては、 アソシエイトIDまで削られるのは遺憾だな。
598 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/21(水) 23:22:57 ID:NszwPh7m0] オミトロン使うような奴ならアフィは全殺しするだろ・・・常識的に考えて
599 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/21(水) 23:30:02 ID:8H5gmtUL0] 確かアフィIDを指定のものに書き換えるフィルタっていうのも以前あったな
600 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/22(木) 00:55:58 ID:fq9nmX0b0] アマゾンのアフィリエイトは真っ先に殺す。
601 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/22(木) 08:11:08 ID:LPlM1PA70] アフィが見えなくなるのは別に構わないけどさ、 でも自ら進んで踏んだものは有効にしようよ。
602 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/22(木) 16:25:24 ID:uFlrt95P0] htaccessを無効にするフィルタ希望 ていうかkaren.saiin.net/~g-kaizou/ を表示させるフィルタ希望
603 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/22(木) 16:37:01 ID:IfmMON990] ( ゜σ・・ ゜) ホジホジ
604 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/22(木) 16:58:02 ID:h6gQqGsT0] >>602 Content-Encoding: text/html; charset=csiso2022kr
605 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/22(木) 17:12:43 ID:IfmMON990] つ SJIS
606 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/22(木) 20:49:05 ID:i23UPNfh0] >602に行ってみたけど、 ヘッダで文字コードを詐称されると、フィルタがまったく効かなくなるね。 これは Proxomitron を無効化させるための手段になる。危険だな。
607 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/22(木) 21:03:40 ID:HF+LFNrU0] 変なContent-Encodingは消したほうが良いみたいだな gzip, chunk 以外知らんけど
608 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/22(木) 21:10:10 ID:CuyAqdZm0] >>599 それ教えて( ゚д゚) ホスィ・・・
609 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/22(木) 21:43:52 ID:h6gQqGsT0] >>602 [HTTP headers] In = TRUE Out = FALSE Key = "Content-Encoding: Kill Content-Encoding (in)" Match = "*" [HTTP headers] In = TRUE Out = FALSE Key = "Content-Type: Kill charset (in)" Match = "text/html; charset=" Replace = "text/html;" >>606-607 ですね。
610 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/22(木) 22:24:29 ID:LqIcExhd0] Match = "(^gzip|x-gzip)?" とかにしとかなくていいの
611 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/22(木) 22:57:21 ID:h6gQqGsT0] >>610 ttp://www.youtube.com/watch?v=LbmbQkX7czo 駄目だ、これ開いたら一面文字だらけになった。
612 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/23(金) 00:57:41 ID:zEKCeVAb0] 文字コード詐称されてフィルターが効かないと言う状態なら ブラウザも正しく認識出来ないのだからどっちにしろ危険は無いんじゃないのか?
613 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/23(金) 16:29:48 ID:3Pg7luNE0] オミトロン装備してるとどうも一部の頁が西ヨーロッパ言語になってしまうんだが、どうすればいい?
614 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/23(金) 16:33:29 ID:3Pg7luNE0] すまない。スレ違いだった。
615 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/23(金) 21:25:45 ID:+CQ+E6V20] >>609 駄目だった・・・
616 名前:think ◆MM0nnAOCiQ mailto:sage [2007/03/24(土) 14:25:23 ID:Vct6LEbc0] >>602 ,615 こちらの環境では、「>609の "Content-Type: Kill charset (in)" を取り入れて、JavaScriptを有効に」すれば、支障なく閲覧できています。 万が一問題があるようでしたら、以下のフィルタを取り込んでみてください。 [HTTP headers] In = TRUE Out = FALSE Key = "Content-Type: Fix g-kaizou charset (in) [2007/03/24]" URL = "karen.saiin.net/~g-kaizou/" Match = "text/html; charset=(^shift_jis|euc-jp|iso-2022-jp|utf-(8|16))" Replace = "text/html; charset=shift_jis"
617 名前:think ◆MM0nnAOCiQ mailto:sage [2007/03/24(土) 14:38:04 ID:Vct6LEbc0] >616の続き。 Content-Typeヘッダの不正が原因なわけですが、Firefox, Opera9 (IE6, IE7 は [日本語(自動選択)] にチェックONで正常に閲覧可) で閲覧不可では少なからず訪問者を逃がしてしまいます。管理人の運営方針にもよりますが、サイト側の問題と受け取れると思います。 当分は、Proxomitronで凌ぐとしても、サイト運営者に報告しておいた方がお互いの益になるのではないでしょうか。 該当Webサイトのトップページには ------------- 2007年3月18日 なぜか全ページが文字化け(原因不明) ------------- とあるので、運営者は原因を把握していないと思われます。 おそらく、htaccess に AddType "text/html; charset=csiso2022kr" .html .htm の記述があるので、これを AddType "text/html; charset=shift_jis" .html .htm に変更すれば、問題は解消されるでしょう。 …ということを運営者に報告してあげてください。 文字化け対策としての.htaccess ttp://www.shtml.jp/htaccess/mojibake.html @IT:Javaの文字化け対策FAQ(1) ttp://www.atmarkit.co.jp/fjava/rensai3/mojibake01/mojibake01.html
618 名前:think ◆MM0nnAOCiQ mailto:sage [2007/03/24(土) 15:26:50 ID:Vct6LEbc0] 問題提起されている件は、 Content-Encoding: text/html; charset=csiso2022kr でProxomitronフィルタが無効になるという現象ですね。 # Content-Typeの方はフィルタの挙動とは無関係のようです。 # 何より、Content-Typeヘッダを意図的に不正にするとWebブラウザでの閲覧の支障が出るので、そういう設定にされる可能性は低いと思います。 で、この Content-Encoding: text/html; charset=csiso2022kr という記述は、正しい書式なのでしょうか? よく解らないなりに、調べてみると以下の文献が見つかり、 ----------------- 内容コーディングは、section 3.5 にて定義されている。使用例を見よ。 HTTP/1.1: ヘッダフィールド定義 - 14.11 Content-Encoding ttp://www.practical-lamp.com/LAMP/PHP/reference/rfc/html/sec14.html#sec14.11 ----------------- 最初は、登録機構は以下のトークンを登録している。... gzip, conpress, deflate, identity HTTP/1.1: プロトコルパラメータ - 3.5 内容コーディング ttp://www.practical-lamp.com/LAMP/PHP/reference/rfc/html/sec3.html#sec3.5 ----------------- とあるので、少なくとも>602のWebサイトの出力するContent-Encodingヘッダの書式は誤っているような気がします。
619 名前:think ◆MM0nnAOCiQ mailto:sage [2007/03/24(土) 15:28:47 ID:Vct6LEbc0] >618の説が正しいとすると、Content-Encodingヘッダも運営者側で修正する方が望ましいので、サイト運営者が .htaccess から AddEncoding "text/html; charset=csiso2022kr" .html .htm を削除するという配慮があると有り難いですね。(書式は少し自信がないです…。) あえて、Proxomitron排除のために残すというサイトがあった場合は、以下のフィルタで回避できる…と思います。 [HTTP headers] In = TRUE Out = FALSE Key = "Content-Encoding: Kill faulty value (in) [2007/03/24]" Match = "(^gzip|compress|deflate|identity)"
620 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/25(日) 00:39:47 ID:U32bBhWY0] 乙。 httpd.confも疑ったほうがいいですな。 >>619 Content-Encodingヘッダが無い時でもマッチしてしまうようだ。
621 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/25(日) 00:44:01 ID:ykWCl22f0] Match = "(^gzip|compress|deflate|identity)?+"
622 名前:think ◆MM0nnAOCiQ mailto:sage [2007/03/25(日) 01:03:18 ID:sQ09AHw80] >>620-621 レス有難う御座います。 >621を取り込ませていただきました。m(_ _)m [HTTP headers] In = TRUE Out = FALSE Key = "Content-Encoding: Kill faulty value (in) [2007/03/25]" Match = "(^gzip|compress|deflate|identity)?" > httpd.confも疑ったほうがいいですな。 >602は自宅サーバじゃないようなので、httpd.conf を編集する権限がないと思います。多分…。
623 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/25(日) 01:43:58 ID:U32bBhWY0] メンテの後文字化けしたんじゃなかったっけ? 運営側が何かやらかしたのでは。
624 名前:think ◆MM0nnAOCiQ mailto:sage [2007/03/25(日) 02:57:05 ID:sQ09AHw80] >>623 その可能性には思い至りませんでした。 ざっと調べてみたところ、同サービスの他のサイトでは同様の症状(Content-Type, Content-Encoding 含めて)が発生していないようです。 Google検索: site:saiin.net ttp://www.google.co.jp/search?ie=utf-8&lr=lang_ja&q=site%3asaiin.net 一部のサイト(サーバ)だけ設定が誤っている可能性も否定出来ませんが…。
625 名前:think ◆MM0nnAOCiQ mailto:sage [2007/03/25(日) 03:26:51 ID:sQ09AHw80] 何にしても両方チェックしておくに超したことはないですね。 その辺りも加味して、>602のサイトへ報告しておきました。
626 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/25(日) 11:34:40 ID:civrXBG40] ローカルに保存したhtmlをこれを通して閲覧する方法はありますか? 極力改変を加えずに保存し、閲覧時には無駄な広告やflashへのリンクを 殺して動作を軽くしたいです。
627 名前:think ◆MM0nnAOCiQ mailto:sage [2007/03/25(日) 13:44:12 ID:sQ09AHw80] >>626 URLコマンドの file// がありますが、ローカルファイルに対して常にProxomitronを通すには他のユーティリティを利用しないと無理だと思います。 ttp://www.pluto.dti.ne.jp/~tengu/proxomitron/help/URL_Commands.html 他に、ローカルにWebサーバを立ち上げる方法があります。
628 名前:626 mailto:sage [2007/03/25(日) 15:25:33 ID:Dk5Qg+wy0] >>627 そうですか・・ ありがとうございます。
629 名前:think ◆MM0nnAOCiQ mailto:sage [2007/03/25(日) 22:23:31 ID:sQ09AHw80] >602のサイト復旧。 結果的に、"Content-Type: text/html", Content-Encodingなし の状態に落ち着いたようです。 # 匿名で報告したので、具体的な対処法(原因)は判りませんでした。 何はともあれ、>602氏の問題は解決しました。
630 名前:think ◆MM0nnAOCiQ mailto:sage [2007/03/25(日) 22:28:52 ID:sQ09AHw80] 失礼。 >629の件ですが、掲示板に復旧までの経緯が記載されていました。 .htaccess は無関係で、サーバの管理者に報告したのみ…ということです。
631 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/26(月) 17:25:13 ID:z4qaU8SK0] すべらない名無し(ttp://by774.blog73.fc2.com/)にある、 Brainerのテキスト広告をカットしたいのですが、下記ではうまく仕事をしてくれません。 どなたかご教授願えせんでしょうか。 [Patterns] Name = "[User] AD @ Brainer" Active = TRUE Limit = 1139 Match = "$NEST(<script[^>]+>,</script>)<script[^>]++ad.brainer.jp[^>]+></script>$NEST(<iframe[^>]+>,</iframe>)" Replace = "<!-- AD @ Brainer - Blocked by Proxomitron -->" >>626 FirefoxならAdblockが使える。
632 名前:think ◆MM0nnAOCiQ mailto:sage [2007/03/26(月) 18:51:02 ID:hy1J35Zo0] >>631 該当Webサイトのhtmlソースを拝見しました。 マッチさせたい箇所は以下の部分ですよね? <script type="text/javascript"><!-- brainer_partner_id = "****"; ... brainer_channel = "****"; //--></script> <script type="text/javascript" src="ad.brainer.jp/ad.js"></script> ## 引用元: ttp://by774.blog73.fc2.com/blog-entry-2210.html iframe要素が見あたらないために、マッチしていないと思われます。 更に簡単に書くならば、<script type="text/javascript" src="ad.brainer.jp/ad.js"></script> だけにマッチさせても良いですね。 前述のscript要素の内容コードは、変数の初期化だけですので本元の処理部分をカットするだけでも広告を取り除けます。(script要素の順番に配慮しなくても良いのも利点) 細かいことをいえば、ad.brainer.jp はsrc属性値に限定した方がベターだと思います。
633 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/26(月) 21:21:23 ID:z4qaU8SK0] >>632 どうもありがとうがざいます。 火狐の「選択した部分のソースを表示する」を使ってしまい、確認を怠っていましたorz 今までのテストでおkなのに引っ掛からなかったフィルタも確認しなければ(´・ω・`) 前半の$NEST部分は仰るとおり必要ないのですが、 ソースを見たときに痕跡があると何故かヽ(`Д´)ノフォオオオ!となるので、 個人的にくっつけていたりいなかったり。 [Patterns] Name = "[User] AD @ Brainer" Active = TRUE Limit = 640 Match = "$NEST(<script[^>]+>,</script>)<script[^>]++src="ad.brainer.jp/ad.js"[^>]+></script>" Replace = "<!-- AD @ Brainer - Blocked by Proxomitron -->"
634 名前:620 mailto:sage [2007/03/27(火) 21:51:05 ID:WBi+faku0] >>629-630 お疲れ様でした。 運営側のミスでしたか、こういうこともあるんですね。 >>626 ブラウザを起動してるときにProxomitronのメインウインドウに目的のhtmlファイルをD&Dすれば フィルタリングされたページがブラウザに表示されます。 このときブラウザのアドレスバーに 表示されるURLをお気に入りに入れておくと便利かも知れません。
635 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/28(水) 07:07:18 ID:LqglA30l0] ローカルファイルに対してフィルタをかけたいんですが、うまくいきません。 具体体には、FirefoxのRSSリーダであるSageが作成するページに フィルタリングをかけ、記事中に割り込んでくる広告を削除したいのですが。 file//path でローカルファイルをWebページと同様にフィルタリングが 出来ると言うところまではわかったのですが(無論プレフィックスも設定しています)、 Webページフィルタの「URLのマッチ」の欄に、 file//C:/*/sage.html と入れてもマッチしていない様なのです。 フルパスだと file//C:/Docoments%20and%20Settings/Users/Application/ 〜/chome/sage.html と言う感じで、フルパスで書いても同じ現象でした。 ダミーとして簡単なHTMLファイルをC:直下において、file/C:/test.html と やってみたのですが、やはりフィルタリングされない模様です。 どこか記述や使い方など、間違っている部分があればご指摘願いたいのですが・・・。
636 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/28(水) 09:25:12 ID:zqd/h+Lp0] 「URLのマッチ」欄では"http(s|)://"は含めないで下さい。
637 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/28(水) 13:17:57 ID:YK1sZGBa0] >>635 「URLのマッチ」の欄を消したらフィルタは期待通りに動く? 動かないなら論外。 動くのなら>>636 の確認と、 Proxomitronの 「設定」 - 「アクセス」 - 「URLベースのProxomitronコマンドを無効にする」 のチェックが入っていれば外す。 あと、Firefoxで広告消すならAdblockもあるよ。 新しいコマンドが追加されてて面白そう。 【CSS】Mozilla広告ブロック【Adblock】 pc11.2ch.net/test/read.cgi/software/1154403706/584-585
638 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/28(水) 22:54:30 ID:YK1sZGBa0] >>634 の方法だとファイルパスの中の ":" が何故か "%7C" に置換されてしまう。( %7C = "|" 、正しくは %3A。) このためページが見つからずにエラーになるのでそれを修正するURL Control系のリスト用コード。 -------------------------------------------------------------------------------------------- # ProxomitronウインドウにhtmlファイルをD&Dした時のURLを修正。 "prefix.." は各自のprefixに書き換える。 http://prefix..file//([a-z]+{1,2})\0%7C/\1&$JUMP(http://prefix..file//\0:/\1) -------------------------------------------------------------------------------------------- この現象はデフォルトの4.5June、4.5 338で確認。
639 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/29(木) 01:40:52 ID:oWBN6QKE0] >>636-637 試してみましたが、期待通りに動きませんでした・・・論外って事ですね。 フィルタ自体はテストも動くし、同一内容のhtmlをコピーして別サーバにアップして試したところ 問題なく動いたので、フィルタが間違っているわけでは無いと思うのですが・・・。 ログを見ているとローカルに対しては全くフィルタを適用しようとしていない様に見えます。 設定のチェックは外しているのですが。 諦めます・・・レスありがとうございました。
640 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/29(木) 01:47:44 ID:nwH5ZQHV0] Sageは使ったことないからよく知らないけど、 広告だったら何か規則性があるんでないの? <div class="ad"> の中に入っているとか、 <a href="広告サイトのURL"> とか。 スタイルシートで消すことが可能かもしれない。
641 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/29(木) 04:02:19 ID:oWBN6QKE0] ありがとうございます。 おっしゃるとおりで、普段はIEとFirefoxを使い分けているので、どちらかのブラウザに 依存する方法で広告削除はしたくなかったのですが、今回はFirefoxに依存した 問題なのだから、FirefoxのCSSで消してしまえば良かったのですよね。 Proxomitronで消す事ばかりを考えてしまって、そこに考えが至りませんでした。 件の広告はCSSを用いて無事に削除出来ました。 フィルタがローカルに適用されないというのが未だに解決していないのが 気持ちの悪いところではあるのですが、ともあれレスをくれた皆さん、 ありがとうございました。
642 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/29(木) 07:31:26 ID:ve+QA7+t0] >>639 Ctrl+F5で強制リロードしてもダメ?
643 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/29(木) 07:56:26 ID:oWBN6QKE0] >>642 キャッシュを読まずにリロードって事ですよね? ダメでした・・・。
644 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/29(木) 09:22:28 ID:ve+QA7+t0] 検索表現で改行コードを"\n"にしている。 WebにASCIIモードでアップ → 改行コードが 0Ah となり、マッチ ローカルでフィルタリング → 改行コード 0Dh 0Ah でマッチせず とか。(苦しいか...)
645 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/29(木) 12:00:10 ID:Tylg9NKN0] >643 chrome://sage/content/feedsummary.html?uri=[URL] URLがこういう感じの形式だからじゃないの?
646 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/30(金) 02:27:46 ID:N5oMoR0M0] >>644 検索条件に改行コードは含んでいないです。 >>645 ロケーションバーに表示されるsageのURLは、 file:///C:/Documents%20and%20Settings/UserName/(省略)/chrome/sage.html です。省略部分は一般のプロファイルの場所です。 レスが頂けるのは大変嬉しく勉強にもなるのですが、 流石にスレ違いな気がしてきたので、スルーしていただいて結構です・・・。 すみません、ありがとうございます。
647 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/30(金) 03:28:46 ID:Fk+PoKNY0] FXがローカルのファイルを直接開いてるんじゃないの? そうだとしたら対処不能
648 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/30(金) 14:55:49 ID:fRAcFZO30] ttp://www.bbsnews.jp/index.html ここのトップだけscriptタグを範囲にしてマッチさせようとしても広告消してくれないんですが上手い方法ってあるんでしょうか? 他のランキングは消せたので原因がよくわかりません
649 名前:think ◆MM0nnAOCiQ mailto:sage [2007/03/30(金) 21:43:47 ID:z1oSbQ+H0] >>648 特に問題は見あたりませんでした。 マッチしないフィルタを開示できるのであれば、アドバイスできるかもしれません。
650 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/31(土) 13:04:14 ID:qvhXZMuJ0] とりあえずのこの脆弱性対応 ttp://www.microsoft.com/japan/technet/security/advisory/935423.mspx Name = "Cut Cursor" Active = TRUE Limit = 500 Match = "cursor (:|=) [^;}>]+" 超誤爆上等注意 まぁ、見ただけでアウトな脆弱性だから対応パッチが出るまでのしのぎレベルで #私は昔から常用してるフィルタなんだけどねw
651 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/01(日) 00:28:32 ID:uRgnshK20] <font style="cursor:url(mailto:kuso.ani)">feffeffe</font>
652 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/01(日) 15:01:41 ID:0jf8ZLJk0] TOK2広告、4月1日現在、Limit = 13640 確実に増え続けている。 Proxomitronを意識しているとしか思えないんだが。
653 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/01(日) 15:05:11 ID:NVBogZYX0] ↑馬鹿
654 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/01(日) 17:20:26 ID:EDThOvVs0] やっつけ Match = "(c|\c)(u|\u)(r|\r)(s|\s)(o|\o)(r|\r) (:|=) [^;}>]+"
655 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/01(日) 17:23:40 ID:EDThOvVs0] ぐは これでどうだ Match = "(c|\c)(u|\u)(r|\r)(s|\s)(o|\o)(r|\r) (:|=) [^;}>]+"
656 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/01(日) 17:29:21 ID:EDThOvVs0] これ、10進とかにも対応とか考えると重くなるだけな気がするな $UESCの検索側版って無いのかな?
657 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/01(日) 19:16:38 ID:CvldivIu0] CSS内の数値文字参照を本来の文字に戻してから、 他のフィルタで処理したほうが良いような
658 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/01(日) 20:55:33 ID:NqLKJzxg0] >>652 >>574 では駄目なのか
659 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/01(日) 21:20:06 ID:YuF/sEJL0] >>650 ユーザースタイルシートで *{cursor:auto!important;} とやったらどうかな
660 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/02(月) 00:01:33 ID:BXoP6IEA0] IE6じゃ!important使えなかった希ガス
661 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/02(月) 00:48:07 ID:UKQKuB2c0] >>660 え??????
662 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/02(月) 13:43:50 ID:poYN2CYf0] >>653 >>658 うん、TOPではなくUNDERのほうだよ。 TOPは増えないから通常通りで大丈夫。
663 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/02(月) 20:31:38 ID:ezmG3rBo0] >>659 なるほど、その方法は良さそうだな 考えつけなかった
664 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/03(火) 00:33:16 ID:J5HArJ7i0] >>659 ,663 それ、ちゃんと機能する? IE6では駄目だった。 >>650 ,655の10,16進大文字小文字対応…重いかな? 実体参照の区切り文字 ; が無くても有効だ! Match = "(c|\&#(x63|x43|67|99)(;|))" "(u|\&#(x75|x55|85|117)(;|))" "(r|\&#(x72|x52|82|114)(;|))" "(s|\&#(x73|x53|83|115)(;|))" "(o|\&#(x6F|x4F|79|111)(;|))" "(r|\&#(x72|x52|82|114)(;|)) (:|=)[^;}>"]+" 実体参照が有効なのはインラインでのスタイル定義(>>651 )だけで .cssファイルと<style>ブロック内では無効みたいだね。
665 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/03(火) 01:34:59 ID:NxFim7nS0] アニメーションカーソルはfaviconにも使えるそうだし拡張子偽装も出来るそうだから 弾くの難しいだろうね
666 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/03(火) 01:58:18 ID:+KrQYJGn0] IEを使わない。これで>665も解決できると思われ。 MIME-Type もろくに見ないようなブラウザを使うのが悪いと言わざるをえない。 favicon は、*.ico か image/x-icon を\kすればいいのかな。
667 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/03(火) 02:49:31 ID:6wNViq4u0] うは、数字前部複数の 0 、文字間に %00 があっても有効だった。 キリがない…orz もう、これで終わりにしますぅ。>>664 でした。 Match = "(c|\&#(x[0]+{0,*}(63|43)|[0]+{0,*}(67|99)) (;|)) " "(u|\&#(x[0]+{0,*}(75|55)|[0]+{0,*}(85|117)) (;|)) " "(r|\&#(x[0]+{0,*}(72|52)|[0]+{0,*}(82|114)) (;|)) " "(s|\&#(x[0]+{0,*}(73|53)|[0]+{0,*}(83|115)) (;|)) " "(o|\&#(x[0]+{0,*}(6F|4F)|[0]+{0,*}(79|111)) (;|)) " "(r|\&#(x[0]+{0,*}(72|52)|[0]+{0,*}(82|114)) (;|)) (:|=) [^;}>"]+"
668 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/03(火) 02:50:32 ID:O0ftgExI0] >>664 ちょいとcとかにすりゃもうすり抜けられちゃうし。 こういうのってそうやってゴチャゴチャ書いててもやっつけ解決にすらならんよ。
669 名前:668 mailto:sage [2007/04/03(火) 02:52:16 ID:O0ftgExI0] 入れ違いになってしまった。
670 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/03(火) 02:55:49 ID:O0ftgExI0] ちなみにキミの書いているのは(文字)実体参照ではなくて数値文字参照だ。 どうでもいいけど。
671 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/03(火) 03:58:17 ID:u5Y7aheh0] >>667 補足です。 >・・・文字間に %00 があっても有効だった。 & # x 0 0 6 3 ; u r s o r : ↑半角スペースを %00 と読み替えて下さい。 当然ながら>>667 ではマッチしませんから…中途半端でスマソでした。 >>669-670 了解です。
672 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/03(火) 04:53:45 ID:+KrQYJGn0] 仮に理想的なフィルタができたとしても、 よほど処理が軽くない限りは使いたくないものだな。 そこまで悪意を持ったサイトなんてあるんだかというのが知りたい。 まあ、精神的ブラクラを集めたような物好きサイトがあるのも確かだが。
673 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/04(水) 03:51:09 ID:j6rLwbwp0] この手の物をおみとろんで全部弾くには相当な手間になると言う事か >>672 半分は思考実験かと 今回だけでなく、今後にも役に立つ可能性が残るし
674 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/04(水) 09:03:43 ID:Ww/FJYxO0] プロファイル結果... サンプルテキスト : 30000 バイト(このスレのhtmlソース) 成功マッチ数 : 1 (5回試行した平均値) >>650 平均時間 : 0.37 (ミリ秒) >>655 平均時間 : 0.72 (ミリ秒) >>664 平均時間 : 0.73 (ミリ秒) >>667 平均時間 : 0.73 (ミリ秒) ↓平均時間 : 0.73 (ミリ秒) Match = "(c|\& # (x (0 )+{0,*}(6 3|4 3)|(0 )+{0,*}(6 7|9 9)) (;|)) " "(u|\& # (x (0 )+{0,*}(7 5|5 5)|(0 )+{0,*}(8 5|1 1 7)) (;|)) " "(r|\& # (x (0 )+{0,*}(7 2|5 2)|(0 )+{0,*}(8 2|1 1 4)) (;|)) " "(s|\& # (x (0 )+{0,*}(7 3|5 3)|(0 )+{0,*}(8 3|1 1 5)) (;|)) " "(o|\& # (x (0 )+{0,*}(6 F|4 F)|(0 )+{0,*}(7 9|1 1 1)) (;|)) " "(r|\& # (x (0 )+{0,*}(7 2|5 2)|(0 )+{0,*}(8 2|1 1 4)) (;|)) (:|=) [^;}>"]+" 興味本位の改変なので、突っ込まんで下され。 >>672-673 同意。
675 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/04(水) 09:19:38 ID:/oqEdOnS0] <font style="cursor feffeffe:url(mailto:kuso.ani)">nmooi</font> www.microsoft.com/japan/technet/security/bulletin/ms07-017.mspx
676 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/04(水) 09:54:55 ID:qTxRbb9j0] >>675 パッチ来たのか、今回は随分早いな。
677 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/05(木) 03:37:36 ID:l42HB2fw0] >>675 おお! 他にどんなパターンが考えられますか?