[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 1001- 2chのread.cgiへ]
Update time : 07/13 16:46 / Filesize : 334 KB / Number-of Response : 1002
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

Proxomitron フィルター作成スレッド Part8



1 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/12/02(日) 03:02:52 ID:1l6Tk/UJ0]
このスレは作成依頼されたフィルタを有志により作るスレッドPart8です

Proxmine - Uploader
wind.prohosting.com/proxmine/cgi-bin/uploader/
Proxomitron専用Uploader
proxo.hp.infoseek.co.jp/cgi-bin/sn_uploader/upload.html

Proxomitron等に関するWiki
abc.s65.xrea.com/prox/wiki/
Thinking Archive(仮)
vird2002.s8.xrea.com/

>>2-10にいろいろと

809 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/11(火) 01:28:42 ID:iD4WjoM50]
>>808
な。俺も何言ってるか全然わかんね

810 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/11(火) 01:29:54 ID:b6p4os+U0]
ああ、確かにごっちゃにしてるな。 ISP規制されたらオミトロン使っても書けないし。
串刺すとかすれば別だが。

811 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/11(火) 01:47:15 ID:0GAjhws90]
ISPが板別や全サーバで規制されるとする。
2ch専用ブラウザはCGIプロキシを利用できない。
Webブラウザだと利用可能だが、今度は人大杉を回避できない。
2ch dat Converterなら全ておk。

知らない板で結構規制されてたりする。(行かないから気付かない)
qb6.2ch.net/_403/madakana.cgi

812 名前: mailto:sage [2008/03/11(火) 01:48:14 ID:0GAjhws90]
勿論閲覧ではなく、書き込みの話ね。

813 名前:名無しさん@お腹いっぱい。 [2008/03/11(火) 04:46:32 ID:CBNBty6z0]
ホスト名調査に失敗の状態を取得してキャッシュへのリンクを張るにはどうすればいいですか
404とかではないです

814 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/12(水) 23:51:07 ID:j2dx5y5k0]
どなたかAmazonトラップを防止するフィルタ作っていただけないでしょうか

815 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/12(水) 23:56:14 ID:DtF/4fyx0]
買物時以外はサインアウトする

816 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/13(木) 00:07:05 ID:4maFG1Ve0]
すみません>>814ですが、mixiトラップ用のフィルタを流用しどうにか作成出来ました

817 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/13(木) 13:15:16 ID:IuSGhDLM0]
>>816
mixiトラップとは何ですか?



818 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/13(木) 13:27:13 ID:9Z2p3YPs0]
画像にmixiのアドレスを.htaccessとかで指定して、
知らないうちに足跡に残すようにするスパイウェア紛いの行為。
今はもう繋がらないみたいだけど過去の例。
ここはたしかCSSに画像を仕込んでわかりづらくしてた。

> 129 名前:名無しさん@お腹いっぱい。 [sage] 投稿日:2007/01/02(火) 17:13:36 ID:Ny7Bu6X50
> 前フィルター投下してくれた人、ありがとう。
> 今日初めてmixiの足跡殺せたよ。
> フィルター入れといて良かった。
>
> ↓アクセスする時は気をつけてくれ。
> www.nishishi.com/blog/2006/05/perl_use_strict.html
> www.nishishi.com/pt/sp/mr.gif

819 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/13(木) 13:27:14 ID:zkFPukf/0]
てかフィルタ書くまでもなくAmazon側でトラップ無効化されてると思うけど。

820 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/13(木) 21:56:24 ID:vQtOASWB0]
これでgoo右上のフラッシュ広告が消えるんだけど段を詰めてくれないんだけど、どうしたらいい?
m(_ _)m

[Patterns]
Name = "goo AD killer"
Active = TRUE
URL = "[^.]+.goo.ne.jp/"
Limit = 7000
Match = "$NEST(<!-- ((h02|banner02|osusume|top_text|ad|ad_focus|pr)\0|Sniffer Code for Flash version=60) -->,<!-- /($TST(\0)|html.ng/cat=*) -->)"


821 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/14(金) 01:38:26 ID:oxncJDZY0]
>>820
[Patterns]
Name = "New HTML filter"
Active = TRUE
URL = "www.goo.ne.jp/css/top_15.css"
Limit = 256
Match = ".banner{margin:0 0 8px 0;display:block;}"
Replace = ".banner{display:none;}"

タイトルとかURLとか細かい検証は任せる

822 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/14(金) 03:21:03 ID:l57OAAGe0]
それだとcssファイルのパスが変わったりcssの書き方が変わっただけでマッチしなくなってしまうから
フラッシュを表示させるためのタグのstyle属性をいじるか、html内にcssを埋め込んでimportantするほうが
仕様変更に強いフィルタになるとかならないとか。


823 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/14(金) 11:42:37 ID:YpMtG1EW0]
>>821
>>822
サンクス!いろいろ試してみる。

824 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/15(土) 02:40:46 ID:FVjzi/9U0]
ここのGamedayってところ新しい窓じゃなくてタブで開けれるようにできますでしょうか?orz
mlb.mlb.com/mlb/gameday/

825 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/15(土) 16:59:11 ID:V7KyWXr60]
オークファンの検索結果に連動広告がどんどん増えてきて邪魔・・・
どなたかフィルターを作っていただけないでしょうか。
よろしくお願いします

aucfan.com/

826 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/15(土) 17:49:08 ID:IIYvvmtu0]
「mixiの絵文字パレットを完全に読み込まなくする」のではなく
「絵文字挿入ボタンが押されるまで読み込まなくする」というのを
Proxomitron のフィルタで実現できるでしょうか。 ↓ のは参考です。

mixiを高速化したよ - yukobaの日記
d.hatena.ne.jp/yukoba/20080304

827 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/15(土) 18:21:10 ID:+NTyjWBS0]
DMMのTOPページはOKなんだが
作品の詳細サイトに行くと
必ず文字化けするんだが
おまいらどうよ?



828 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/15(土) 18:55:32 ID:7t8H1HOA0]
>>827
どこのページのことかよくわからなかったけど
一通り見ても化けない。
そのページをどのブラウザでどのフィルタ適用なのか書かないと
まともなレス付かないよ。

829 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/16(日) 18:12:25 ID:GR9PUa/K0]
>>824
ポップアップで開く部分を全部

window.open(url, name, 〜);

window.open(url, null);

みたいに変更したけど別窓で開いてしまうんだよなぁ。

行数制限が異様に厳しいので続く。


830 名前:829 mailto:sage [2008/03/16(日) 18:12:52 ID:GR9PUa/K0]
制御の流れは以下の感じで、大体追えたと思うんだけど。
javascriptの知識そんなに無いから、これ以上はよく分からない。

<a href="javascript:void(0)" onclick="launchGameday('" + gameID + "')">

ttp://mlb.mlb.com/scripts/global.js:
function launchGameday(params) {
   :
   popWin(/*baseURL+*/gamedayURL,'GamedayWin',gd_w,gd_h,'location=no,menubar=no,scrollbars=no,status=no,toolbar=no,resizable=yes');

ttp://mlb.mlb.com/shared/scripts/util.js:
function popWin(url,n,w,h,o) {
   :
   _pw_z=window.open(url,n,'width='+w+',height='+h+',left='+_pw_l+',top='+_pw_t+','+o);
}


831 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/16(日) 18:16:07 ID:GR9PUa/K0]
>>825
Name = "aucfan"
Active = TRUE
URL = "(ap.|www.|)aucfan.com/"
Limit = 360
Match = "<iframe*</iframe>"
"|$NEST(<script, *(overture|urchin)*, </script>)"
"|</head>$SET(#=<style>\n<!--\n"
"#top_header_1, #CATEGORY_AD_FRAME { display: none; }\n-->\n</style>\n</head>)"
"|(<title>)\1*[%a1][%d7]-\2(</title>)\3$SET(#=\1\2\3)"
"|(class=$AV(keyword_input_box))\1$SET(#=\1 accesskey="q")"
"|(class=$AV(l_price_input_box))\1$SET(#=\1 accesskey="1")"
Replace = "\@"

ついでにタイトルを短めにして、ALT+Q と ALT+1 で検索と値段のとこにアクセスキーを設定してみた。


832 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/16(日) 22:54:29 ID:gI7o6bEo0]
連番ウォーカー
proxo.hp.infoseek.co.jp/cgi-bin/sn_uploader/src/pr0051.txt
面白く、有用なフィルターありがとうございます

「$LST(***)」でなく、「$LST(***)」に対応するようにしたいです
生半可の知識で全く歯が立ちません。よろしくお願いします

833 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/17(月) 07:35:53 ID:8saex8z00]
>>831
動作しない

834 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/17(月) 14:55:43 ID:133Hoy0o0]
>>832
$JUMP( → $JUMP(http://
(4箇所)

$RDIR( → $RDIR(http://
(2箇所)

で動きました。

835 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/17(月) 19:18:00 ID:OrmS5cD30]
>>834
ありがとうございます。上手く動作しました。感謝です
\0とかまったく別のとこみてた…

836 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/18(火) 09:37:24 ID:A+626kv60]
画像とか背景、CSSにわざわざhttps://を使っていて
毎回IEがSSLのダイアログをだすうざいサイトがたまにあるんですが
ソースコード内のhttps://の記述を一括でhttp://に置換えする
フィルタをお願いします。
httpでは403吐くところもあるんですがそれは気にしないので。。。

837 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/18(火) 09:54:37 ID:w0HDnC8w0]
$TYPE(css)

https://

http://



838 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/18(火) 10:43:27 ID:A+626kv60]
>>837
レスありがとうございます
早速試してみたんですがうまくいかないみたいです。。
たとえばこんなサイトです
ttp://61.211.231.130/flax/fss/1237794328/Snc_About

すいませんあと、できればインポータブルな形式で記述していただけますと。。。
ワガママでほんと申し訳ありません。


839 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/18(火) 11:07:14 ID:qiZvkiRJ0]
>>838
インターネットオプション
接続
LANの設定
詳細設定
すべてのプロトコルに〜 のチェックを外す
Secure、FTP、Socks の各項目を真白にする
OK x 3回

じゃダメ?

840 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/18(火) 11:34:14 ID:0Ee2R/td0]
<link([^>]++rel=$AV(stylesheet)&[^>]++href=$AV(https://*$URL(http://))[^>]+>)
<img[^>]++src=$AV(https://*$URL(http://))[^>]+>
<[a-z]+[^>]++bgcolor=$AV(https://*$URL(http://))[^>]+>

841 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/18(火) 11:35:28 ID:A+626kv60]
>>839
レスありがとうございます。
proxomitronの使い方などはわかっているつもりなので
そのあたりは問題ないです。
firefoxでもダイアログが出てしまいます。
ただ、フィルタの編集とかは不得手というか正規表現などの知識がないので、
単純に>>837さんのレスをうまくフィルタに反映できていないかもしれません。。
cfgに直接書き込みできる形式でお願いできませんでしょうか

842 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/18(火) 11:38:12 ID:0Ee2R/td0]
bgcolorじゃなくてbackgroundだった、まあそんな感じで

843 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/18(火) 12:52:18 ID:pPXvBy9b0]
\0が2の時と3の時で置き換えを変える事が出来ますか?

844 名前: mailto:sage [2008/03/18(火) 12:52:51 ID:pPXvBy9b0]
条件分岐という意味です。

845 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/18(火) 13:02:30 ID:wsTHKde10]
>836
IEを窓から投げ捨てる。それがベスト。

846 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/18(火) 13:16:01 ID:qiZvkiRJ0]
>>841
そっか、ごめん。 >>840さんの使って書いてみた。

[Patterns]
Name = "New HTML filter"
Active = TRUE
Multi = TRUE
URL = "$TYPE(htm)$URL(http://)"
Limit = 512
Match = "("
"<link\s(^(^[^>]++rel=$AV(stylesheet)))[^>]++href="
"|<img\s[^>]++src="
"|<[a-z]+\s[^>]++background="
")\0"
"$AV(https://\1)"
Replace = "\0"\1" "

>>843
出来ますよ〜。 マッチングコマンドの$TSTの説明を参照して下さい。

(
$TST(\0=2)$SET(9=中身は2です)
|
$TST(\0=3)$SET(9=中身は3です)
)

847 名前:843 mailto:sage [2008/03/18(火) 14:15:40 ID:pPXvBy9b0]
>>846
ありがとうございます!



848 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/18(火) 17:01:22 ID:7tc1F1e80]
みんなUser-Agentなんにしてるの?


849 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/18(火) 17:13:45 ID:TjO0Rc440]
>>848
色々だよ

850 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/18(火) 18:31:55 ID:MLDVv7/j0]
>>848
Opera/9.30 (Nintendo Wii; U; ; 2047-7; ja)

851 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/18(火) 20:43:48 ID:vfFKYSDo0]
>>848
Googlebot/2.1

852 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/18(火) 22:12:34 ID:1F3qwVJX0]
DoCoMo/2.0 P2102V(c100;TB)

853 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/19(水) 00:16:18 ID:7pQMiiA00]
>848
SuperFamicon(SNES)

854 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/19(水) 11:50:38 ID:eLecFv960]
>>848
Mozilla/4.0 (compatible; MSIE 4.0; MSN 2.5; Windows 95)

855 名前:pQJDWyIJOeLSyRqIPKC mailto:nikoletwesting@yaho.com [2008/03/19(水) 16:46:39 ID:xqdfE1ka0]
Nice site!

856 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/19(水) 21:41:06 ID:dJXtNMco0]
投稿者では無いのだが、Proxomitron入門スレッド 6で以下の質問に
付いてもめてます。此方の方の回答も参考にしたいのですが、
因みに俺は[^/]++microsoft.com/ [^/]++google.(com|co.jp)/ で
良いのではと


45ひよこ名無しさんsage2008/03/15(土) 03:20:10 ???P

MicrosoftとGoogleの全てのサイトをBypassにしたいのですがURLの
数が厖大で極力少ない適切な記述方法を教えて頂けないでしょうか

さしあたりMicrosoft UpdateとGoogleのメール、カレンダーの表示
障害で困って下ります。どうか宜しく御願いします。

857 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/19(水) 21:44:32 ID:h8tfBuxM0]
virusmicrosoft.com/
usogoogle.com/



858 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/19(水) 21:48:35 ID:h8tfBuxM0]
ドメイン名がいろいろあるから無理ぽがFAだと思います。 ホスト名ではなくIPアドレスで書かれた
場合のことも考慮しなきゃいけないし。 同じ質問はよくFWのスレでも見かけます。

859 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/20(木) 00:25:32 ID:xAtr1s+h0]
GmailではSSLが使えるから、自分はSSLの方を利用する。
SSLに対してフィルタリングさせない設定だったらまったく問題ない。

ログウィンドウの中身をテキストにでも保存して、
ドメインを調査してみるという方法もありそうだがいかがか。
正規表現で書くよりも誤爆・誤動作の類は減ると思われる。

860 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/20(木) 01:07:29 ID:7MGWdgkZ0]
>>855
爆撃レスも褒めててちょっとワラタ

861 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/20(木) 10:48:14 ID:TXoSDyZx0]
入門スレ荒れててわろたw 入門者同士のやり取りに一人上級者が入って浮いてるw

■■■■Proxomitron入門スレッド■■■■6
pc11.2ch.net/test/read.cgi/pcqa/1201242934/

862 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/20(木) 11:06:14 ID:YmIfVqIU0]
ちょっとタイミング逃したネタだが、
他の人も言っているようにThink氏のパラノイア的こだわりは
「フィルタ速度の話以外」においては結果的にいい効果をもたらすことが多い。
ここ数ヶ月のThink氏を見る限りちゃんと速度ネタは自重していると思う。
だから今後も自分はThink氏を「信じる」ことにするからよろしく。

863 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/20(木) 11:41:56 ID:TXoSDyZx0]
信者うざす

864 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/20(木) 11:53:31 ID:YmIfVqIU0]
便器の横の張り紙の
「いつもきれいに使っていただいてありがとうございます」
みたいなもんだ。わかるかなこのネタ。

今後もThink氏が自己の中でのみ留めておくべき探求心を
外へ垂れ流さないことを信じてるよ。

865 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/20(木) 13:18:58 ID:st1PfBrg0]
またお前か。

866 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/20(木) 13:57:21 ID:TXoSDyZx0]
ちんこの高速化ネタ禁止な。

867 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/20(木) 14:31:52 ID:YIqIV1q+0]
オチンチンを高速でしごくんだ!



868 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/20(木) 17:53:08 ID:kd9KI4rN0]
アンチうぜえ

869 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/20(木) 23:42:01 ID:E4HRA4SR0]
tes

870 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/21(金) 13:37:26 ID:mr3hZsqy0]
>>856
live.com とかも必要ではないかと思うのだけれど。

871 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/22(土) 11:09:10 ID:FM8cqCDa0]
www.uploader.jp/
このあぷろだの広告除去フィルタを希望します

サンプルも置いておきます
よろしくお願いします
www.uploader.jp/home/sample/
www.uploader.jp/dl/sample/sample_uljp00046.png.html

872 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/22(土) 15:48:20 ID:Lk8WRKeE0]
テストしてないけど、どちらかお好きな方をどうぞ。

body#bhome img { display: none !important; }

body#bhome div.photo,
body#bhome a[href^="http://sys.uploader.jp/campaign/"] { display: none !important; }

873 名前:UVUxWBVcIdLhvwRI mailto:linnn@yaho.com [2008/03/22(土) 23:28:25 ID:TJZqUCvG0]
<a href=nuvistor.cn/map.html >pills</a>
mythically.cn/map.html
<a href=mythically.cn/map.html >online</a>
nutsch.cn/map.html
<a href=nutsch.cn/map.html >online</a>
nutsche.cn/map.html
<a href=nutsche.cn/map.html >online</a>
<a href=meds10top.com/online-prescription-viagra.html >online prescription viagra</a>
<a href=meds10top.com/tramadol-and-acetaminophen.html >tramadol and acetaminophen</a>

874 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/23(日) 12:27:21 ID:k1SXF9lB0]
>>871
こんなのはどうでしょ?
[Patterns]
Name = "uploader.jp"
Active = TRUE
URL = "www.uploader.jp"
Limit = 16
Match = "<!--aa-->"
Replace = "\k$STOP()"

875 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/23(日) 18:33:51 ID:k1SXF9lB0]
>>871
訂正
[Patterns]
Name = "uploader.jp"
Active = TRUE
URL = "www.uploader.jp"
Limit = 240
Match = "<div\salign="center">$SET(0=<div style="display:none">)|"
"<!--c(sr|an)-->*<!--/c(sr|an)-->|"
"<div\sid="footer">$SET(0=\k$STOP())"
Replace = "\0"



876 名前:871 mailto:sage [2008/03/23(日) 20:02:57 ID:rnklNppY0]
ありがとうございます

>>872
すみません。色々試してみたんですけどよく分かりませんでした。

>>875
このフィルタでwww.uploader.jp/home/sample/のページの広告などを綺麗に消えましたが、
www.uploader.jp/dl/sample/sample_uljp00046.png.htmlのページの広告は消えませんでした

それとこのあぷろだは今のところ
www3.uploader.jp/user.php
から
www11.uploader.jp/user.php
までサーバーがあるようですので考慮していただけると嬉しいです

877 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/23(日) 20:44:06 ID:NcL/zBuT0]
*.images-amazon.com/
sys.uploader.jp/




878 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/23(日) 20:59:09 ID:k1SXF9lB0]
>>876
[Patterns]
Name = "uploader.jp"
Active = TRUE
URL = "www(|[0-9]+).uploader.jp/"
Limit = 64
Match = "*.images-amazon.com/|"
"sys.uploader.jp/"

又は

Name = "uploader.jp"
Active = TRUE
URL = "www(|[0-9]+).uploader.jp/"
Limit = 240
Match = "<div\salign="center">$SET(0=<div style="display:none">)|"
"<!--c(sr|an)-->*<!--/c(sr|an)-->|"
"<div\sid="footer">$SET(0=\k$STOP())|"
"<!--aa-->$SET(0=\k$STOP())"
Replace = "\0"

のどちらかで如何でしょうか?

879 名前:871 mailto:sage [2008/03/23(日) 21:31:21 ID:rnklNppY0]
>>878
上のフィルタのMatchだと残ったゴミにhttp Text to Linkなどが誤爆して使いづらかったです

下のフィルタだと残念ながら肝心の「ダウンロード」リンクまで消えてしまいました

880 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/23(日) 21:31:33 ID:k1SXF9lB0]
>>878
ご免なさい、また訂正。下側のフィルタは下記のように
[Patterns]
Name = "uploader.jp"
Active = TRUE
URL = "www(|[0-9]+).uploader.jp/"
Limit = 240
Match = "(</h1>|</table> )\1<div\salign="center">$SET(0=\1<div style="display:none">)|"
"<!--c(sr|an)-->*<!--/c(sr|an)-->|"
"<div\sid="footer">$SET(0=\k$STOP())|"
"<!--aa-->$SET(0=\k$STOP())"
Replace = "\0"

881 名前:871 mailto:sage [2008/03/23(日) 22:23:33 ID:rnklNppY0]
>>880
綺麗に消えました
ありがとうございました

882 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/23(日) 23:21:50 ID:Ct0APsuk0]
www[0-9]+.uploader.jp/ で十分。

ところで、
(</h1>|</table> )\1<div\salign="center">
のようなものにマッチさせる場合、

(^(^</h1>|</table> ))
先頭をこのようにしているとマッチしない。
ずっと前から疑問に思っているんだけど、これはなぜだろう。

883 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/23(日) 23:42:44 ID:u63ovOYo0]
これからも疑問に思っていなさい。

884 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/24(月) 00:13:59 ID:xKdi8PQZ0]
Scott 曰く...

だって「/」と「d」が同時に同じ場所に存在するなんてありえませんからね ;-) 。

885 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/24(月) 03:33:25 ID:Z2sKZxFT0]
ttp://msdn2.microsoft.com/ja-jp/library/ae5bf541(VS.80).aspx

(?!pattern)
否定先読み検索を実行する部分式です。
pattern に一致しない文字列が始まる位置にある検索文字列と一致します。
一致した文字列は記憶されず、後で使用することはできません。
たとえば "Windows (?!95|98|NT|2000)" は、
"Windows 3.1" の "Windows" には一致しますが、
"Windows 2000" の "Windows" には一致しません。
先読み処理では、読み進まれた文字は処理済みとは見なされません。
一致の検出後、次の検索処理は先読みされた文字列の後からではなく、
一致文字列のすぐ後から開始されます。


>884
どうもありがとうございます。なんとなくですが理解できたような気がします。
肯定先読みという言葉は見たことがあるものの、
どういう概念なのかは知りませんでした。
否定先読みの方だけは、そういう言葉すら知らないうちから使っていたのですが…。


以下テスト用。
Match = "(^(^</h1> )) <"

<h1> </h1> <div>
にマッチさせてみる。

886 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/24(月) 03:36:35 ID:Z2sKZxFT0]
転載する場所を間違えたのでやり直し。

(?=pattern)
肯定先読みを実行する部分式です。
pattern に一致する文字列が始まる位置にある検索文字列と一致します。
一致した文字列は記憶されず、後で使用することはできません。
たとえば "Windows (?=95|98|NT|2000)" は、
"Windows 2000" の "Windows" には一致しますが、
"Windows 3.1" の "Windows" には一致しません。
先読み処理では、読み進まれた文字は処理済みとは見なされません。
一致の検出後、次の検索処理は先読みされた文字列の後からではなく、
一致文字列のすぐ後から開始されます。

887 名前:think ◆MM0nnAOCiQ mailto:sage [2008/03/24(月) 03:48:42 ID:0gHMU6EQ0]
先読みと前読みをはき違えているような気がします…。(Proxomitronは先読みしかできません)

Google検索: 先読み 前読み
ttp://www.google.co.jp/search?q=%E5%85%88%E8%AA%AD%E3%81%BF+%E5%89%8D%E8%AA%AD%E3%81%BF&lr=lang_ja&ie=utf-8

>882を例にとると、以下の表現ならマッチするはずです。この違いがわかるでしょうか?

(</h1>|</table> )(^(^<div\salign="center">))

>>885
> Match = "(^(^</h1> )) <"
この書き方では、</h1> だけでもマッチしてしまいますよ…。
先読み後に消費すると、同じ文字列を2度検索することになります。



888 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/24(月) 04:32:12 ID:gGfErR5e0]
「文字列を消費しない」という意味を
「マッチはしたけど取り込まない、置換対象としない」なんて理解(誤解)しているから
こういうことになるんだろうな。

要するにゼロ幅の位置指定子なんだが。

889 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/24(月) 05:41:07 ID:gGfErR5e0]
理解を助ける為に、例えば文字列 "foobarbaz" について、
"|f|o|o|b|a|r|b|a|z|" という具合に、各文字間に仕切り線(これは文字ではない。
あくまで便宜的に表示したもの。この文字列の長さは9である)があるものと思うことにしよう。

この場合、肯定先読み "(?=baz)" ってのは
「"baz" にマッチする(けど、"baz" は取り込みや置換の対象とはしない)」
のではなく、
「その仕切り線に "baz" が続く、そのような仕切り線」にマッチする。
つまり上の例で言えば、7本目の仕切り線にマッチする。

肯定/否定先読みがマッチするのは、「(幅を持った)文字」ではなくて
「(ゼロ幅の)位置(便宜的に"|"で書き表したもの)」なのである。

前読みとか戻り読みとか呼ばれるのも同じ。

肯定戻り読み "(?<=foo)" ってのは、
「"foo" にマッチする(けど、"foo" は取り込みや置換の対象とはしない)」
のではなく、「"foo" に続く仕切り線」にマッチする。
つまり上の例で言えば、4本目の仕切り線にマッチする。


要するにだ、正規表現 "(?=foo)bar"(Proxomitron でいうところの "(^(^foo))bar")ってのは、
「その仕切り線に "foo" が続く、そのような仕切り線と、更にその仕切り線から続く "bar"」
を検索していることになる。

同時に同じ場所に "foo" と "bar" とが存在するわけなどなく、これは絶対にマッチしない。

890 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/24(月) 06:10:26 ID:HhQF8TOr0]
難しいけどわかりやすいわ。
GJ!

891 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/24(月) 07:25:36 ID:gGfErR5e0]
くどいようだけど、"foo(?=bar)" がマッチするのは
「"foo" と、それに続く仕切り線。どのような仕切り線かというと、その後に "bar" が続くような、仕切り線」
なのであり、決して「"foobar" にマッチする。但し、"bar" の部分はいじらないものとする」というのではない。

後者のような捉え方をしていると、検索対象文字列を探索していくポインタ("|"で表そう)が
既に "foobar|" にまで進んでいるような勘違いを起こしてしまう。
この時、ポインタはあくまで "foo|bar" にとどまっているのである。

ポインタはそこにとどまりつつ(これが「文字列を消費しない」の意味。"bar" は消費されずに残る)、
その先を見通す(これがつまり「先読み」)。


マッチングが完了した時のポインタの位置(模式図)

正しい理解:
                     Proxomitron の声
 foo|bar (<おお、この先にお望み通り "bar" があるべ。無事マッチしたお^^)


誤った理解:
                     Proxomitron の声
 foobar| (<は〜るばる来たぜ "bar" の後〜♪ でも波線部分は置換しないお^^)
   ~~~

892 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/24(月) 08:06:16 ID:gGfErR5e0]
"foobarbaz" の "bar" だけ残そうと思って

Match = "foo(^(^bar))baz"
Replace = ""

とやっても、決してマッチしないのがお分かり頂けるかと思う。

ダブルネガティブ表現 "(^(^...))" は「"..." を置換せずにおく」という意味の表現ではない。
あくまで位置指定子なのである。

検索表現 "foo(^(^bar))baz" の、"foo" を (1)、"(^(^bar))" を (2)、"baz" を (3) とすると、

foo|barbaz (<部分表現 (1) がマッチしたぞ。どれどれ、更に部分表現 (2) を試してみるか…)
foo|barbaz (<ここから先 "bar" が続いてる!(2) もマッチした!次は (3) を試すぞ!)
foo|barbaz (<…って、後続文字列が "bar" なんだから、(3) がマッチするわけないじゃん…)
foob|arbaz (<結局全体としてマッチしなかったね。とっとと次行こう、次)
foobarbaz| (<どんどん行くよ〜)

893 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/24(月) 09:10:56 ID:Oyc56iF70]
>>880
MicroAd の部分もけすことはできませんか

894 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/24(月) 10:49:08 ID:V1GaVwxd0]
次スレのテンプレにこれ入れて欲しいな。 というか誰だ削ったの。
www.pluto.dti.ne.jp/~tengu/proxomitron/help/Contents.html

895 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/24(月) 11:52:09 ID:o+9/ilN90]
>>894
Proxomitronに疎い俺はそこが見やすかった。
しかしどこも表記が逆スラッシュなんだよな。
日本語環境に合わせて\でいいのに。
なんか理由があるんかな。

896 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/24(月) 13:27:10 ID:+mfxkhZ/0]
>>889>>891-892
これどっかに残しておくと便利だな
せっかくの長文だしもったいない

897 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/24(月) 14:17:11 ID:NIturYQe0]
>>887
俺には前読みとはき違えてるようには見えんのだけど
どの辺でそう思いました?

ってか>>885-886の「〜検索文字列と一致します」って表現はゼロ幅だという
意味合いが読み取りにくくて紛らわしい文章だなあ。



898 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/24(月) 15:07:15 ID:V1GaVwxd0]
先読みってそんなに難しいかね、否定が分かってればすぐ理解出来るものだと思う。

899 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/24(月) 15:21:53 ID:BiGCibQY0]
>>893
[Patterns]
Name = "uploader.jp"
Active = TRUE
URL = "www[0-9]+.uploader.jp/"
Limit = 256
Match = "</h1><div\salign="center">$SET(0=</h1><div style="display:none">)|"
"</table> <div\salign="center">$SET(0=</table> <div style="display:none">)|"
"<!--cs*sr-->|<!--ca*an-->|"
"<IFRAME*>|$NEST(<script,</script>)|$NEST(<noscript,</noscript>)|"
"<div\sid="footer">$SET(0=\k$STOP())|<!--aa-->$SET(0=\k$STOP())"
Replace = "\0"

僅かばかりの高速化

900 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/24(月) 18:33:07 ID:Z2sKZxFT0]
細かく解説していただきましてありがとうございます。
テキストファイルにコピペしておいて、またわからなくなったら読み返してみます。

901 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/24(月) 20:13:43 ID:Oyc56iF70]
>>899
ありがとう すべて綺麗に消すことができました

902 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/24(月) 20:25:07 ID:gGfErR5e0]
> ってか>>885-886の「〜検索文字列と一致します」って表現はゼロ幅だという
> 意味合いが読み取りにくくて紛らわしい文章だなあ。

「〜位置と一致します」と書くべきですよね。


本論とは関係ないけど、>>892のポインタ移動の説明はマズかったですね。
特に "foo|b" から "foob|" と進む部分。ここは一旦 "f|oob" とバックトラックするところでしょう。

  .↓これより以前は処理済。ここに大しおり("V")を設置した上でポインタを進めて探索。
hoge|foobarbazfuga

  .V ↓部分表現 "foo" がマッチ。ここに小しおり("v")を設置した上で、部分表現 "(^(^bar))" をテストする為に更にポインタを進める。
hogefoo|barbazfuga

  .V .v ↓部分表現 "bar" がマッチ(小しおりの位置に部分表現 "(^(^bar))" がマッチ)することを確認。先読み完了。小しおりまで戻る。
hogefoobar|bazfuga

  .V ↓部分表現 "baz" はマッチせず。結局、表現 "foo(^(^bar))baz" は表現全体としてはマッチしなかった。大しおりまで戻って1進む。
hogefoo|barbazfuga

   .↓これより以前は処理済。この位置から改めてマッチングを試行していく。
hogef|oobarbazfuga



毎度毎度何気な〜くWebページを読んでいるその裏に、いちいちこういう
ポインタが前へ後ろへと細かく激しく行き来する「三歩進んで二歩下がる〜♪」な処理を
うんざりするほど繰り返した末にようやく1バイト前進するという
Proxomitron の涙ぐましい努力があるのかと思うと泣けてくる…。(´Д⊂ ホントニオツカレサマデス

903 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/24(月) 20:46:04 ID:gGfErR5e0]
この辺が分かり易いかな。
www4.ocn.ne.jp/~kaerume/k2e/regex_3.html#d5

先読みだとか戻り読みだとかは抜きにして、ゼロ幅の位置指定子というもの自体は
普段から標準的な正規表現を使っている人なら難なく受け入れられると思う。
"^"(文字列の先頭位置にマッチ)や "$"(文字列の終端位置にマッチ)とかあるし。

904 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/25(火) 14:04:09 ID:vUVjkAL20]
www.4gamer.net/
ここの左右の広告を削除する方法はないでしょうか

905 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/25(火) 16:19:49 ID:7aE8Jh2k0]
>>904
[Patterns]
Name = "4gamer.net"
Active = TRUE
URL = "www.4gamer.net/"
Limit = 128
Match = "$NEST(<script,</script>)|$NEST(<noscript,</noscript>)|"
"<div class="ad_top">$SET(0=<div style="display:none">)|"
"<div class="hot_game_now">$SET(0=<div style="display:none">)|"
"<div class="support">$SET(0=<div style="display:none">)|"
"<div class="rectangle">$SET(0=<div style="display:none">)|"
"<div class="ad_premium">$SET(0=<div style="display:none">)|"
"<div class="contents_bottom_pr">$SET(0=<div style="display:none">)|"
"<div class="sidetop">$SET(0=<div style="display:none">)|"
"<div class="topics"> <div class="title">[%a5][%c8]$SET(0=<div style="display:none"><div class="title">)|"
"<div class="special">$SET(0=<div style="display:none">)"
Replace = "\0"

906 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/25(火) 17:28:04 ID:vUVjkAL20]
>>905
すっきりしました ありがとうございます

907 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/25(火) 18:16:23 ID:7aE8Jh2k0]
>>904
問題点を改善しました。上のフィルタは使わないでください
[Patterns]
Name = "4gamer.net"
Active = TRUE
URL = "www.4gamer.net/"
Limit = 40
Match = "ad.adplan-ds.com\w+$SET(0=')|"
"class="ad_top$SET(0=style="display:none)|"
"class="hot_game_now$SET(0=style="display:none)|"
"class="support$SET(0=style="display:none)|"
"class="rectangle$SET(0=style="display:none)|"
"class="ad_premium$SET(0=style="display:none)|"
"class="contents_bottom_pr$SET(0=style="display:none)|"
"class="sidetop$SET(0=style="display:none)|"
"class="topics"> <div class="title">[%a5][%c8]$SET(0=style="display:none"><div class="title">)|"
"class="special$SET(0=style="display:none)"
Replace = "\0"



908 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/25(火) 19:55:35 ID:WJKTamS10]
up.pandoravote.net/index.php?id=000000000
のアドレスに移動しようとしたら、
up.pandoravote.net/img/pandora000000000.jpg
に飛ぶフィルタおながいします。
拡張子はjpg決め撃ちでいいです。

909 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/25(火) 21:09:28 ID:g/JbX01o0]
>>908
>>1のWiki→フィルタ、リスト公開にList: JumpToっていうのがあるよ(リストで管理するやつだけど)






[ 続きを読む ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧](;´∀`)<334KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef