- 1 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/08/01(火) 12:41:46 ID:IsoaU6wd0]
- フィルタをアップするときに書き込む項目(推奨)
・フィルタを適用したブラウザ ・ブロックに使用した手段 ・ブロックされる広告の説明 ・フィルタ 過去のスレッド Mozilla Firefox Adblockフィルター スレッド Part1 pc7.2ch.net/test/read.cgi/software/1131101772/
- 652 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/10(火) 13:17:34 ID:uWpJW6oY0]
- >>649
おまいは何を言ってるんだ? 「複数の正規表現をひとつにまとめるとむしろ速度が落ちるかも知れない」 って記述を正規表現と普通のフィルタの話と誤読しているアホが居る。 最初から結論は変わってないのにそいつのせいで一部の住人が混乱している。 それだけの話だ。
- 653 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/10(火) 15:57:52 ID:Gcq3Bagq0]
- >>651
> 当然、軽い方がいいにきまってる > 当然、軽い方がいいにきまってる > 当然、軽い方がいいにきまってる バカか。 1バイトでも少ない = 軽い のかよw
- 654 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/10(火) 19:17:02 ID:Aqk1lV2B0]
- >>653
>1バイトでも少ない = 軽い のかよ >1バイトでも少ない = 軽い のかよ >1バイトでも少ない = 軽い のかよ バカめ。 1バイトでも少ない = 軽い んだよw
- 655 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/10(火) 19:28:14 ID:zAyWvgGn0]
- >653
お前の脳ミソは一般人より軽いなwwwwwwwww
- 656 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/10(火) 20:08:07 ID:b9lE0leW0]
- オマエら653の体重は一般人より重いぞw
- 657 名前:653 mailto:sage [2007/04/10(火) 20:32:41 ID:Gcq3Bagq0]
- 軽いってのは動作が軽いって意味でいったんだけど・・・。
まさか1バイト容量が少なくなることに意味あるって理論だったの? HDDが GB、多い人ならTBつまれる時代に、1バイト節約して何になるんだか。
- 658 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/10(火) 20:41:18 ID:zXxQi0gh0]
- 動作も軽いだろ。何言ってんだ?
- 659 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/10(火) 20:59:05 ID:Gcq3Bagq0]
- >>658
容量が小さい正規表現の方が動作が軽いって? ご冗談を。 長さが長い正規表現でも動作軽い場合もあるし、長さ短い正規表現でも動作が重い場合もある。
- 660 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/10(火) 22:31:57 ID:uWpJW6oY0]
- >>659
誤爆が無いという前提条件があることを忘れてないか? 過不足なく同じ広告を検出するのに文字数が違うフィルタが2個あると考えてみ? まだ変な事を言うようならもう「日本語お上手ですね^^」で流すぞ。
- 661 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/10(火) 22:50:09 ID:Gcq3Bagq0]
- >>660
極端な例でいけば、"adwords" にマッチさせたいとき、 1: "^ad.*$" 2: "^adwords$" で、前者のがバイト数は少ないけど、後者のが処理は早い。 バイト数が大きいと、処理速度が遅いとかありえない。
- 662 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/10(火) 22:50:55 ID:ZUxm9XoF0]
- 1バイトでも軽い方がいいに決まってる。
- 663 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/10(火) 22:52:27 ID:Gcq3Bagq0]
- あ、これだと誤爆がどうだのといわれそうだからかえると、
AdNo01 と AdNo02 と AdNo03 にマッチさせたいとき、 1: "^AdNo0[1-3]$" 2: "^AdNo0(1|2|3)$" だと、後者のが早いが、後者のがバイト数が大きい。
- 664 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/10(火) 23:24:33 ID:iV8Yg5la0]
- 良いフィルターの条件
1 誤爆がない 2 広い範囲で使える 3 字数が1バイトでも少ない
- 665 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/11(水) 00:38:43 ID:1X5GzRe80]
- >>663=己のものさしでしかもの言えない馬鹿
- 666 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/11(水) 00:59:20 ID:r5xxXnCe0]
- なんだかわけがわからないよヽ(`Д´)ノウワァアン!
…要は好きなほうを使えってことでおk?
- 667 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/11(水) 01:04:40 ID:GGq4MXguP]
- 速度を論じながらもフィルタは全て正規表現という前提なのは一体何故なんだぜ?
ここ数日のログをちゃんと読んでるならその思考はありえんだろ
- 668 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/11(水) 07:30:07 ID:YXUpXo3Q0]
- >>667
「1バイトでも少ないほうが処理速度が速い」 なんて言い出している勘違い厨への反論だろ。
- 669 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/11(水) 11:34:16 ID:R8bUgAO40]
- とりあえずID:Gcq3Bagq0は使ってるフィルタを晒せ。話はそれからだ。
- 670 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/11(水) 11:37:03 ID:VtFYwKQs0]
- >>663
それは前者のほうが早いです(プ
- 671 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/11(水) 11:52:05 ID:GGq4MXguP]
- >>668
速度の話をするなら正規表現じゃないフィルタを例にすべきじゃないの? 正規表現という時点で遅いんだから。
- 672 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/11(水) 12:25:04 ID:sLzZfGkV0]
- 正規表現じゃない書き方をしても内部処理は正規表現。
- 673 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/11(水) 12:27:59 ID:Rq1SuNqI0]
- その前に速度をどういう計り方しているか?だろ
条件が異なると当然(ry
- 674 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/11(水) 12:44:57 ID:GGq4MXguP]
- >>672
日本語がお上手なのはもう分かったから、 次は本当の日本人として通用するレベルの読解力を身に付けられるように頑張ろうね^^
- 675 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/11(水) 13:48:41 ID:mZN9E+zg0]
- >>663の例で言えば
"AdNo0*"と"AdNo0"と"AdNo"でどれが速いかという話ではないの?
- 676 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/11(水) 13:50:43 ID:VtFYwKQs0]
- >>674
分かってないのはおまえだよ。 今までの流れを全然読まずに書いてるだろ。 >>675 はぁ?? 全然違う。
- 677 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/11(水) 14:04:26 ID:mZN9E+zg0]
- さあ盛り上がってまいりますた。
>>675 何がどう違うのか具体的にkwsk書いてくれないと平行線を辿るよ。
- 678 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/11(水) 14:08:50 ID:VtFYwKQs0]
- >>677
自演?
- 679 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/11(水) 14:11:51 ID:VtFYwKQs0]
- つか、分かってない奴が首突っ込むからややこしくなるんだよな。
俺とか>>672とか>>668あたりの奴だけで十分だから雑魚どもは消えろ。
- 680 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/11(水) 14:17:19 ID:BDpXK2TJ0]
- >>674
全然関係ないけど、H"接続?
- 681 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/11(水) 14:35:27 ID:R8bUgAO40]
- いろいろ理屈言ってるやつのフィルタなんで参考にさせて貰いたいんだが、
いつになったらフィルタ晒してくれるんだ?それとも口先だけなのか?
- 682 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/11(水) 15:32:07 ID:VXWZXCSR0]
- 口先だけなんだろ(藁
- 683 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/11(水) 15:54:48 ID:GGq4MXguP]
- >>680
いや普通のドコモっす。
- 684 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/11(水) 16:45:14 ID:3FWdLppe0]
- >>683 IDの末尾Pだから「これが噂の?」てオモタ
とりあえず ヘ⌒ヽフ ( ・ω・) dd / ~つと)
- 685 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/11(水) 16:55:03 ID:GGq4MXguP]
- 携帯(O)→フルブラウザアプリ(Q)→公式p2(P)と皮を被ってるので
最終的なID末尾がPになってます。
- 686 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/11(水) 18:43:14 ID:mZN9E+zg0]
- adblockplus.org/forum/viewtopic.php?t=1222
AmirG の質問: Q1.www.adserver.com/から広告が来るとして、 以下のフィルタの中ではどれが効率が良い(CPUパワーを食わない)ですか? ここから↓ .adserver.com/ www.adserver.com/ www.adserver.com/ |www.adserver.com/ ↑ここまで。 Q2.8文字のシンプルなフィルタは正規表現のものよりも効率が良いとのことですが、 複数のシンプルなフィルタはひとつの正規表現にまとめることができます。 例えば↓ abcd1111 abcd2222 abcd3333 abcd4444 ↑これを『/abcd[1-4]{4}/』にするとか。 この場合に正規表現で書かれたものは上の4つよりも効率的でしょうか? (『abcd*』は abcdefg とかに誤爆するので良くないし8文字より短い) 効率的でないという場合、シンプルなフィルタの束よりも正規表現のフィルタがより効率的になる区切りはどこになりますか?
- 687 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/11(水) 18:44:07 ID:mZN9E+zg0]
- Wladimir Palant(現行の Adblock Plus の開発者)の答え:
A1.どれでも良し。 8文字以上のフィルタはほとんど速度差が出ません。 ただし誤爆が起きないという点においては一番最後のものがお勧めです。 A2.例えシンプルなフィルタが100個あっても1個の正規表現よりはまだ速いです。 勿論"banner34(34は任意の2桁の数字)"をブロックするのに100個ものシンプルなフィルタを登録するのは労力が割に合わないが、 この例においては正規表現の使用にはそれくらいのメリットしかありません。 rick752 の補足: 効率が良いのは直列した8文字(ワイルドカードで分割されていない)。 『banner1234』は良い。 『banner*1234』は悪い。 上の条件を満たすならワイルドカードはどこに使っても良い(※1)。 AmirG のお礼: 正規表現は8文字未満のフィルタにのみ使えってことですね。 rick752 の補足: そう、でも普通に書いたら8文字は超える。 大量のシンプルなフィルタは1つの正規表現に勝ります。 またそれらは読みやすく管理も楽でオン・オフの切り替えも簡単です。 それに『$~image』を正規表現の塊にセットしたりとかしたくないでしょう?(※2) ※1は多分『bannnnnner*12345678』はおkという意味だと思うんだ。 ※2は多分複雑な正規表現にオプションを適用するために起こりうる全てのケースをチェックするのは 激しく手間だから素直に普通のフィルタにオプション付けて使っとけと言いたいんだと思うんだ。
- 688 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/11(水) 19:38:29 ID:JhuwSaWL0]
- >A2.例えシンプルなフィルタが100個あっても1個の正規表現よりはまだ速いです。
う〜む・・・これほどとは
- 689 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/11(水) 21:17:41 ID:mZN9E+zg0]
- [チラシの裏]
普通のフィルタ>>>正規表現なことは>>621-624でも触れられていたんで 本当に分かっている人はその前提で話をしているはずなんだが、 正規表現のフィルタをちゃんと「正規表現でしか書けないようなフィルタ」と言ってあげないと 理解できない人が話をややこしくしてる。>>672とか。 >>637の条件は必ずしも「速い」フィルタの条件とは言えないわけだが、 それが「良い」フィルタでもないとは必ずしも限らない。 それを勝手に速度の話だけに限定した人達が居て、 それにわざわざ速度で劣る正規表現しか見えてない奇特な人が応戦したもんで 妙な方向に議論を持って行かれて話がしっちゃかめっちゃかに。 [/チラシの裏] 木を見て森を見ないような議論はもう止めないか?
- 690 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/11(水) 21:29:08 ID:VtFYwKQs0]
- >>637が言ってることは論外なんだが釣られる奴が多すぎるな。
- 691 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/11(水) 22:36:31 ID:GGq4MXguP]
- 正直俺には君が一番……いや何でもない。
- 692 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/12(木) 01:43:14 ID:iyOL1m3l0]
- 誤爆がないフィルターが論外とはけもじなことを
- 693 名前:名無しさん@お腹いっぱい。 [2007/04/12(木) 04:16:07 ID:3oGjE6PR0]
- 正規表現オワタ\(^o^)/
- 694 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/12(木) 04:57:36 ID:KgYtY/3O0]
- >>690が言ってることは論外なんだが釣られる奴が多すぎるな。
- 695 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/12(木) 08:46:36 ID:L0tEZM2p0]
- >>637は正規表現が書けないから「字数が1バイトでも少ない」なんて書けるんだろうな。
正規表現も書けない奴の書いたことにあーだこーだ言ってもしょうがねぇと思うが。
- 696 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/12(木) 12:32:33 ID:sZrj1Vxm0]
- 自分の使ってるフィルターうpすれば問題は全て解決
試しにうp頼む
- 697 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/12(木) 12:45:07 ID:XA9zI8Dp0]
- 8文字は、shortcutsの文字数が最大8文字から来てるのね。
なら621の感じ方で間違えなさそうかも。
- 698 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/12(木) 15:02:46 ID:L0tEZM2p0]
- >>606
FAQのほうに > フィルタは内部的には全て正規表現に変換される。例えば『ad*banner.gif|』は内部では > 『/ad.*banner\.gif$/』になる。 と書いてあるが、これは /ad.*?banner\.gif$/ とするべきだな。 正規表現に疎い人のほとんどは最短一致でいいところを最長一致で書くから困る。 複雑な正規表現の場合、最長一致にしてしまうと速度に大きく影響してしまう。 作者がこれを知らないようなら教えてあげてくれ。
- 699 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/12(木) 15:11:35 ID:CrnX8U750]
- *108 *.bannerbridge.net/$link,image,object
*295 *.a8.net/$image,link 1474 *.jp.ap.valuecommerce.com/*/$image,link,subdocument *144 affiliate$link,subdocument,background,object *189 *.dtiserv*.com/*/$link,subdocument **14 *.jpassport.jp/*/$subdocument,image ***7 affid=$subdocument,link **69 *.99bb.com/$image,link,object *218 affili$image *155 /(\/|www\.|page)ad(\/|click\/|server\.|justnetwork\.|\.watch\.)/$image,link,subdocument ***0 rcm-images.amazon.com/images/$image,background **14 rcm-jp.amazon.co.jp/e/$subdocument *114 www.accesstrade.net/*/$image,link **42 *.afl.rakuten.co.jp/*/$image,link **12 *.valueclick.ne.jp/$image,link ***0 *.trafficgate.net/$image,link ***8 *.linksynergy.com/fs-bin/$image,link ***0 s*.j-a-net.jp/gateway/$image,link **62 w1.ax.xrea.com/$image,link **50 /(ct|x)[0-9]\..*\.(com|jp)\/(gg|ll|bin)\//$image,link **54 grp01.ias.rakuten.co.jp/$link,subdocument ***0 www.af-board.com/new/$image,link **28 sbs.nsk-sys.com/track/traffic$link stylishと併用。自分の巡回してるところはほぼ消えるけど>>687見る限りadもばらして作り直そうかな 頭の数字はhit数です
- 700 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/12(木) 15:45:34 ID:7YpaQITx0]
- どっちにしても
example.ad.jp/banner.gifに誤爆するけどw
- 701 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/12(木) 16:46:00 ID:VqhhjR7h0]
- 良いフィルターの条件
1 誤爆がない 2 広い範囲で使える 3 字数が1バイトでも少ない(正規表現含む)
- 702 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/12(木) 17:03:02 ID:mDMr6nJH0]
- 以下のような感じの計測方法が適当か分からないけど、それで5回ずつ測定してみた
ところ「|ad.」と「/^ad\./」は同等、「ad0〜ad9999の1万行」と「ad[0-9]{1,4}」 は後者の方が2秒ほど速かった。 <script type="text/javascript"> const start = new Date().getTime(); function get_diff() { const finish = new Date().getTime(); const diff = finish - start; document.getElementById( "time" ).textContent = "経過時間:" + diff + " ms"; } </script> <body onload="javascript:get_diff();"> <p id="time">計測中</p> <img src="ad.localhost/ad/ad0"> 〜省略〜 <img src="ad.localhost/ad/ad9999">
- 703 名前:名無しさん@お腹いっぱい。 [2007/04/12(木) 17:07:16 ID:3oGjE6PR0]
- >>699
http//*.とか後の/とかいらんと思うんだけど・・・ valuecommerce.com$image,subdocument こんな感じで十分じゃないの? 一発目の8文字(以内)検索で完結するように valuecom$image,subdocument みたいにひたすら短縮するのもアリかもしれん 誤爆することもないだろうし
- 704 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/12(木) 17:26:20 ID:NrgQlk+w0]
- >>699
Adblock Plus の内部機構においても『/ad.*banner\.gif$/』より 『/ad.*?banner\.gif$/』の方が速いと俺に分かるように説明してくれたら伝えるけど、 個人的にそこは今の Adblock Plus にはあまり重要ではないことのような気がする。 それはそうと、実はそこの部分は思いっきり誤訳しててさw 正しくはこう↓
- 705 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/12(木) 17:27:12 ID:NrgQlk+w0]
- Adblock Plus はどのようにフィルタを処理し、また如何なるフィルタがより高速なのか?
フィルタは内部的には全て正規表現に変換される(正規表現で書かれていないものであっても)。 例えば『ad*banner.gif|』は内部では『/ad.*banner\.gif$/』となる。 しかしながら Adblock Plus はチェックすべきフィルタがある時に それらを全てひとつひとつチェックしたりはしない……そんなことをしても無駄に重くなるだけだ。 フィルタの正規表現への変換に際し、Adblock Plus はそれらからテキスト情報を抜き出そうとする。 必要なのは8文字のユニークな文字列("shortcut")である。 これはそれぞれのフィルタ内のアドレスから抜き出されたもので、 例えば『|ad.*』というフィルタからは Adblock Plus は “a” か “ttp://ad” か “tp://ad.” のどれかを選ぶ (これらはどれも本来のフィルタがマッチすべきアドレスにマッチする)。 不幸にもワイルドカード等で区切られて8文字も無いとか、正規表現で書かれているとかならこの shortcut は作れない。 全ての shortcut は検索テーブルに放り込まれ、それによって Adblock Plus は必要なフィルタを極めて効率的に呼び出せるようになる。 とあるアドレスをチェックする時には Adblock Plus はまずそれらの shortcut を検索する (これは非常に速く終わり、また登録された shortcut の数にもほとんど影響を受けない)。 shortcut にヒットした場合にのみ本来のフィルタから変換された正規表現でチェックする。 また、shortcut を作れなかったフィルタに関してはひとつひとつチェックされる。 まとめ:どんなフィルタが速いのか? ・可能な限り正規表現は使わない(正規表現は問答無用に遅い)。 ・8文字の直列した文字列(中にワイルドカード『*』のような特殊な文字が含まれない)を内包する シンプルなフィルタを使うように心掛ける。そうでないフィルタは正規表現と同様に遅い。 ・上記の『速い』フィルタはいくつあっても良い。数に関係なく処理時間は一定である。 つまり1個の正規表現よりも20個のシンプルなフィルタを使う方がマシである。 ・というわけで、Deregifier(adblockplus.org/en/deregifier)マジお勧め。
- 706 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/12(木) 17:29:06 ID:NrgQlk+w0]
- ちなみに Deregifier とは正規表現を単発フィルタに分解してくれるツール。
adblockplus.org/en/deregifier 例えば>>699の中にある『/(\/|www\.|page)ad(\/|click\/|server\.|justnetwork\.|\.watch\.)/』なら↓ /ad.watch. */ad/ */adclick/ /adjustnetwork. /adserver. pagead.watch. pagead/ pageadclick/ pageadjustnetwork. pageadserver. www.ad.watch. www.ad/ www.adclick/ www.adjustnetwork. www.adserver. ↑といった感じに分解してくれる。
- 707 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/12(木) 17:32:08 ID:NrgQlk+w0]
- >>704は>>699じゃなくて>>698宛てだった。スマソ
- 708 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/12(木) 17:36:28 ID:1TsEBTx50]
- >>695
いろいろな書き方がある訳で、同速同条件のフィルターが2つある場合 字数は1バイトでも少ない方が良い。 >>698はこの場合では1バイト増やした方がより良い事を証明したにすぎない。 お前の文章には人間的欠陥がある。 ID:L0tEZM2p0=己のものさしでしかもの言えない馬鹿
- 709 名前:名無しさん@お腹いっぱい。 [2007/04/12(木) 17:41:19 ID:V85EMG0Q0]
- ID:L0tEZM2p0=チンカス
- 710 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/12(木) 17:44:09 ID:ibYXc5q40]
- >作者がこれを知らないようなら教えてあげてくれ。
>作者がこれを知らないようなら教えてあげてくれ。 >作者がこれを知らないようなら教えてあげてくれ。 >作者がこれを知らないようなら教えてあげてくれ。 >作者がこれを知らないようなら教えてあげてくれ。 ( ´,_ゝ`)プッ
- 711 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/12(木) 17:54:51 ID:SixmzFVx0]
- >>704-706
,'从从)〉 rヤ^ー゚ノi| 乙であります。 あんたネ申だよ♥ 漏れはあんたを師事する!蛆蟲なんか踏みつぶせ!!
- 712 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/12(木) 17:58:33 ID:SixmzFVx0]
- >>703
胴衣
- 713 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/12(木) 18:04:25 ID:SixmzFVx0]
- >>699氏は、>>686-687にあるアンサーに従ったのか…
- 714 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/12(木) 18:25:41 ID:ozNw2ZSs0]
- 8文字未満だとshortcut作られないから、可能なら8文字以上に増やした方がいいってこと?
- 715 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/12(木) 18:58:16 ID:CrnX8U750]
- >>703
>>712 なるほど。ありがとう 作り直してみる
- 716 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/12(木) 19:02:50 ID:DgqfLt7S0]
- 住人に有益な情報を提供しているネ申と住人に吠えるだけの糞蟲ぢゃ(ry
>>704 乙。
- 717 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/12(木) 19:18:22 ID:NrgQlk+w0]
- FAQによると『banner』と『/banner/』は同義なんだが、
これが『bannnner』と『/bannnner/』だったとしても同義になるのかな? どれだけ単純でも明示的に正規表現で書かれたフィルタはそういうものとして扱うだろうから この場合は shortcut の有無で如実な差が出ることになるのだろうか。 >>711 別に俺は誰とも対立してないぞ。煽るな。 >>714 俺が読んだ限りではそのように見える。 『banner』はNG。 『bannnner』はおk。 『bannnner*hage』はおk。 『banner*hagehoge』も多分おk。 『*hagehoge』も多分おkだが『http://』部分に意味があるかどうかは微妙、 それなら最初から『hagehoge』だけでも良いかも知れない。つまり>>703。 そして正規表現は柔軟だか鈍重というまるで脂肪の塊のようなもの。 >>716 実はこの手の情報は過去スレでは散々既出な希ガス。 日本語で読めるまとめが無いせいで定期的に話題がループしてるっぽ。
- 718 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/12(木) 19:44:59 ID:b4CFXTZA0]
- 正規表現から単発が主流になりそう(なった?)みたいだけど昔あった速いとは別の
フィルターが多い=重い(くなる) っていう事は、もうなくなったの?
- 719 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/12(木) 19:55:32 ID:XhsaMfFB0]
- \dはまだしも\Wはさすがに分解する気にならんなあw
- 720 名前:698 mailto:sage [2007/04/12(木) 20:16:34 ID:L0tEZM2p0]
- >>704
Adblock Plus の内部機構でもそれ以外のもの(perl等)でも同様に早くなるよ。 URL処理するためだけの正規表現が複雑になることはまずないから恩恵は期待出来ないが。 それで何故早くなるかというと、 .* は可能な限り長くマッチしようとし、 .*? は可能な限り短くマッチしようとする特性がある。 1、/a.*b/ 2、/a.*?b/ という2つの表現を使って説明すると、 a 0000000000000 b 111111111111111 b 2222222222222 b 33333333333333 c という文字列に対してこの2つの正規表現を使うと 1は "a 0000000000000 b 111111111111111 b 2222222222222 b" にマッチするのに対し(最長一致)、 2は "a 0000000000000 b" にマッチする(最短一致)。 つまり1の場合、000.. の後ろの b を見つけた後もその後ろに b が無いか探し続けてしまう。 それに対し2は 000.. の後ろの b を見つけたらそこで検索を止める。 その分早くなる。 >誤訳 了解。 8文字の固定文字列を取り出して検索するとはいい方法だ。 正規表現を書くときも同じでまず固定文字列を 探すような表現にすると格段に早くなる。 >>708 >同速同条件のフィルターが2つある場合 つまり条件付きってことだな。 ある条件のもとでしか正しくならないわけだ。 「月は満月だ。」 (満月のときの月は確かに満月だが三日月などもある) みたいな無茶苦茶な理論だな。 自分では気付いてないようだが。
- 721 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/12(木) 22:23:46 ID:es/RVV9+0]
- >>699
>**69 *.99bb.com/$image,link,object エロサイトw
- 722 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/12(木) 22:56:41 ID:ozNw2ZSs0]
- >>721
アフィのリンクとか張ってるやついるからそのフィルタなんだろ。 本人がそのサイト使ってたら誤爆しまくりの意味ないフィルタだし。
- 723 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/12(木) 23:21:29 ID:1Wy44Dv40]
- >>717
乙。漢だねw >>720 お前さ、698って名乗ってるけど>>695ですから。残念! 始めに煽るような毒づいてるレスさえしなきゃID:NrgQlk+w0みたいくもっと住人に愛されたのになw
- 724 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/12(木) 23:58:49 ID:mlRMOeBa0]
- 669氏のフィルターを例題に借りると
>703もありだが、逆にa8とかはhttp://をつけて無理矢理でも増やせってか 717氏 乙 720氏 ね
- 725 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/13(金) 00:20:45 ID:ubQ11F7W0]
- 平行線の話題はそろそろやめないか?
ここにゴチャゴチャ書かずに、それぞれ自分の中でそう思っておけばいいことだろ。 有益な情報が妙な叩き合いで見にくくなる。
- 726 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/13(金) 00:58:58 ID:1DrFi/l80]
- おう
- 727 名前:名無しさん@お腹いっぱい。 [2007/04/13(金) 01:19:43 ID:6niKKmEx0]
- >>725
禿同 しかしまぁ、以前からネチケットの悪い糞蟲が消えなきゃ無理なんぢゃねぇーの、とも思ったり・・・・
- 728 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/13(金) 01:35:30 ID:MdxtMwnV0]
- 確かに1匹いるね。前から…
CSS派には申し訳ないがこの機会に テンプレのABP部分をまとめても良いか、とも思ったり…
- 729 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/13(金) 02:04:40 ID:oTLqjw2d0]
- 賛成の賛成なのだ
せっかくだからまとめサイトのAdblockページの更新もしたいね ページにはファイルのうpも出来る訳だし 597氏が翻訳してくれた>>606とかは 是非まとめサイトのファイルうpを使って欲しいよ でなきゃもったいないよ せっかくの597氏の苦労が それと質問なんだけどまとめサイトの 「フィルターを増やすと動作が重くなるので」の部分は今後どうなるの 正規表現をばらして増すと速いけどやっぱり重くなるの?
- 730 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/13(金) 03:52:50 ID:QovjZ3Lw0]
- >>728
胴衣 >>729 胴衣 ではスタート↓
- 731 名前:名無しさん@お腹いっぱい。 [2007/04/13(金) 05:35:54 ID:zOu8WnQA0]
- ↑無視ですまんが・・・
たとえば ias.rakuten.co.jp$script と登録すると shortcut=rakuten. になるんだが これは楽天開いたときなんかはショートカット検索の段階でヒットしまくることになる。 そこで ias.raku$script と登録すると shortcut=ias.raku になるわけで これだとショートカット検索の段階でもヒットするのは僅か。 最終的にはregexpの方でチェックするから結果は一緒なんだが 最初から数を絞り込んでる後者の方が気持ち速いのかね? ただ後者だと何を登録してるかわからなくなりそうでアレだが。
- 732 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/13(金) 08:58:48 ID:3lmLf/0m0]
- >>708
意味分かんなくてワロタw リアル厨房?
- 733 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/13(金) 11:40:38 ID:HGX/pVAJ0]
- >>729
アップされてる同期フィルタ群を見る限り、正規表現は推奨されてないっぽいけど。 フランスのみたく正規表現のみなんてのもあるけど、使ってもリスト内の1,2割程度なのが多い。 ttp://adblockplus.org/en/subscriptions
- 734 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/13(金) 12:00:07 ID:wDybXcFE0]
- >>732
>>725-727
- 735 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/13(金) 12:58:32 ID:9ue/Z7Zv0]
- 今日は風が強いなあ。
>>702 shortcut の利点は無意味なフィルタのチェックをしないことにあるから、 全てのフィルタが100%ヒットする条件下ではむしろ無駄な処理になる。 そのテスト用のページにヒットしないフィルタを大量に加えると 通常のフィルタなら shortcut のお陰でほとんど悪影響を出さないが、 shortcut が作れないフィルタや正規表現のものはその数に比例して Adblock Plus のパフォーマンスを下げると思われ。 >>720 それじゃあまあ、そのうち他の疑問もひっくるめてまとめて聞いてみる。 流れ的に「今更正規表現っすかwwww」で流されそうな気もするがw 何か考えがあっての事かも知れんしな。 >>724 ワイルドカードで区切られていない8文字というのが shortcut 成立の条件で、 >>699の『*.a8.net/$image,link』の場合は『.a8.net/』の部分が8文字なのでおk。 これが『.a8.net』だったら7文字しかないことになるから、 前か後ろに http:// でも / でもとにかく何か付けて8文字以上にしないといけない。 で、『*』のところは誤爆回避の役にも立たんと思われるので それなら『.a8.net/$image,link』だけでよくね?と。 『http://』って7文字だから shortcut にも使えんしね。
- 736 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/13(金) 12:59:25 ID:9ue/Z7Zv0]
- >>729
あの和訳は自分が理解するために作ったもので他人のためのものじゃないから、 このまま埋もれてしまっても別に俺は勿体なくないw それに和訳のクオリティが不十分だから、表に出すなら 何人かの英語に堪能で Adblock Plus の挙動に詳しい人達による添削が必要。 あと、あのまとめサイトは Adblock と Adblock Plus を一緒くたにしていて Plus のみに向けた記述は書きにくい。 まあこの辺をクリアできるならどこに転載されても俺は構わんよ。 で、質問の答えだけど、 普通のフィルタがいくつあっても shortcut が作れるものであれば速度上はほとんど問題ない。 shortcut が作れないフィルタや正規表現のものはその数に応じて重くなる。 複雑な正規表現をいくつかのシンプルな正規表現にすることは速度を向上させる『かも知れない』。 ただし基本的には100個の普通のフィルタ>>>1個の正規表現なので、 いくつかの普通のフィルタをひとつの正規表現にまとめるようなことはしない方が良い。
- 737 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/13(金) 13:11:44 ID:9ue/Z7Zv0]
- >>731
多分その通りだと思う。可読性と誤爆回避と速度のトレードオフだね。 ただ、懸念として例えばフィルタがこの3つ↓ .a8.net/*/hage/ .a8.net/*/hoge/ .a8.net/*/huge/ ↑の場合は shortcut は最初の1つだけに作成される。 つまり1つの shortcut に複数のフィルタが対応することはできないっぽいので、 あまり余裕のないフィルタリストを作ると どこかで意図せずに shortcut からはみ出るフィルタが出てしまうかも知れない。 これが『ias.rakuten.co.jp$script』なら Adblock Plus は "ias.raku" から "en.co.jp" までの合計10パターンから選ぶことができるから 似たようなフィルタを他に作っても上手く住み分けができるだろうが。 >>733 Fanboy’s List と adblock.free.fr には注意書きとして 『このリストは Plus には最適化されてないので重いです』と書いてあるね。
- 738 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/13(金) 13:38:53 ID:3lmLf/0m0]
- 内部的には普通のフィルタも正規表現に直してるのだから
今更もなにもないと思う。>>704の正規表現だって元は普通のフィルタだし。
- 739 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/13(金) 13:42:45 ID:3lmLf/0m0]
- つまり>>704の変更をすれば普通のフィルタが早くなるってことじゃない?
- 740 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/13(金) 14:08:21 ID:N5nZ1Xv/P]
- 一瞬コイツは何の話をしているのかとオモタ。
- 741 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/13(金) 18:27:27 ID:9ue/Z7Zv0]
- 今のところ Element Hiding に関しては Stylish もしくは userContent.css の方が速いっぽい。
まあ俺は Adblock Plus だけでも特に困ってないけど。 同期フィルタとして EasyList と EasyElement と dutchblock を購読している人が 「他に Filterset.G か何かも入れた方が良いか?」と相談した時の開発者達の返事。 adblockplus.org/forum/viewtopic.php?t=936 rick752(EasyList と EasyElement の作者): 「フィルタリストは小さいに越した事はないから、ぞれぞれ試して良さそうなのを選ぼう。 後は引っ越ししないように頑張れ。 (環境の変化に伴ってネット上の行動範囲が変わると広告の傾向が変わるから?)」 Wladimir Palant(Adblock Plus 開発者): 「EasyList と dutchblock はどちらも全世界的に通用するリストで内容が被りまくりんぐ。 併用しても大した効果は見込めないが誤爆その他のトラブルは2倍になる。 なので購読はどれか1個だけにしとくのがマジお勧め。 あと Adblock Plus で Filterset.G はとにかくヤメトメ」 dutchmega(dutchblock の作者): 「YOUもう Filterset.G は自動拒否にしちゃいなYO!」 ちなみに dutchblock は今は配信終了してる。
- 742 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/13(金) 23:54:25 ID:9ue/Z7Zv0]
- 何点か疑問に思っていたことを Wladimir Palant(Adblock Plus 開発者)に聞いてみた。
adblockplus.org/forum/viewtopic.php?p=10676 Q1.FAQ によると『banner』と『/banner/』は同義だそうですが、 『bannnner』と『/bannnner/』も同義になりますか? それともこの場合は shortcut によって『bannnner』がより高速になるのですか? A1.高速になります。 Q2.FAQ によると『ad*banner.gif|』は内部的には /ad.*banner\.gif$/ という正規表現に変換されるそうですが、 何で /ad.*?banner\.gif$/ じゃないんですか? その方が速くね? A2.どんだけ速くなるか疑問。 それに特定のマッチを取って終わりではなく全てのマッチを取ってる手前、大した違いもなかんべぇ。 (↑多分フィルタのヒットカウントの都合だな) Q3.『*.ad.net/』の『*』部分は『@@|https://』というホワイトリストがあればあっても無駄? A3.世の中には HTTP と HTTPS 以外にも FTP とか MMS とか色々プロトコルはあるわけだが、 まあ確かにその『http://』にあまり意味がないという点には同意。 理想を言えばこの "" に続くワイルドカード(*)は ".ad.net" の部分をホストの一部分として解釈できるように "[^/]*"(つまり "/" 以外の任意の文字で構成される0文字以上の文字列)と解釈されるべきなのだが、 残念ながら今のところそのようには動かない。 (↑つまり "hage.hoge/huge.ad.net" 等が『誤爆』すると言いたいと思われ)
- 743 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/13(金) 23:56:14 ID:9ue/Z7Zv0]
- Q4.以下のようなフィルタ↓
.ad.net/*/hage/ .ad.net/*/hoge/ .ad.net/*/huge/ ↑は最初の1つだけが ".ad.net/" という shortcut を作るが、他のは shortcut を作れず正規表現と同等に遅くになる? A4.Yes! Yes! Yes! Q5.Adblock Plus の『項目を隠すルール(Element Hiding)』は Stylish や userContent.css を使うよりも遅い? あ、それでも漏れは Adblock Plus 使いますよ勿論ww A5.やってることは何も変わらんのでパフォーマンスも変わらん。 ちなみに Element Hiding Helper というアドオンを入れると『項目を隠すルール』の設定の手伝いしてくれる。 これは実際の処理にはノータッチなので(そこは Adblock Plus が1人で全部やる)、 これを入れても項目を隠すルールのパフォーマンスは悪化しないしマジお勧め。 ちなみに Element Hiding Helper とは『項目を隠すルール(Element Hiding)』の設定作業を支援するアドオン。 https://addons.mozilla.org/ja/firefox/addon/4364 丁度これが便利すぎたのでここに書こうと思ってたところでこんな事を書く Wladimir Palant は間違いなくエスパー。
- 744 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/14(土) 00:54:39 ID:Cfy9Vn2v0]
- ワロタすごく便利>Element Hiding Helper
- 745 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/14(土) 01:14:40 ID:xUY1KOm60]
- >>735
> そのテスト用のページにヒットしないフィルタを大量に加えると テストは他の余計な要素がなく、以下のような感じでフィルタが1つしかない 状態でそれぞれ行ったよ。 ttp://f39.aaa.livedoor.jp/~hitomin/up/img/hitotan143.jpg >>742 > ".ad.net" の部分をホストの一部分として解釈できるように ".ad.net$hostname"みたいに出来れば良いのにね。非正規表現の場合は少 しでも誤爆を防ぐために".ad.net/"みたいにするくらいしか出来ないのかな。 "ad.net:8080/"とかだったら…。 作者も「遅い」とか「速い」と言うだけではなく、作者の環境でいいからパターン 別に速度の違いを数値で示してくれれば分かり易いのになぁ…。
- 746 名前:名無しさん@お腹いっぱい。 [2007/04/14(土) 06:17:43 ID:zt6Ax5U40]
- 公式にも特に書いてないからわからんのだけど「バナーのリンク先をチェックする」をONにすると
<a href=""> </a>の間を全部消せるから文字リンク消せたり広告まとめて消せたりして便利だけど チェックする対象が増える分少しは遅くなるのかな? ime.nuの大量の広告も個別に画像やオブジェクトを指定すると面倒だけど i-cute.jp$linkとすればほとんど消せて便利
- 747 名前:698 mailto:sage [2007/04/14(土) 09:09:08 ID:3/K+9yVQ0]
- >>742
乙。 .*? の問題の回答は正直意味不明。 たいした差が無いのは同意だが特定のマッチか全てのマッチか とか関係無く .*? を使うべきなので。 .* を使うと無駄な処理が増えるだけでメリットは何も無いはずなのだが..。 >↑多分フィルタのヒットカウントの都合だな 上に書いた通りなのでこれも理解不能。 特定のマッチでもカウントは出来るだろうし。 まぁもし対応しても1万分の1秒くらいの違いしか無いだろうからもうこの話はやめよう。 他の質問も参考になった、サンクス。
- 748 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/14(土) 11:43:14 ID:lp4kfE/W0]
- お、だんだんと本筋に戻ってきたぞ。
9ue/Z7Zv0 乙&GJ!
- 749 名前:名無しさん@お腹いっぱい。 [2007/04/14(土) 14:07:13 ID:5NdM3US90]
- > .*? の問題の回答は正直意味不明。
対応しても1万分の1秒くらいの違いしか無いだろうから んなこたぁどうでもいいじゃん って早い話、言われんだよ。バーカ! 相変わらず読解力のねー己の意見に固執した視野の狭い糞虫だなw
- 750 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/14(土) 14:18:41 ID:JtpjcXmC0]
- ホントこれで尻尾まいて消えてくれれば良いんだけど
次回からしったかな小馬鹿にしたレスをつけてきても どーせ又コイツなんだと判すぐに明するからallスルーでいいんジャマイカ
- 751 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/14(土) 14:22:35 ID:3/K+9yVQ0]
- 弱い犬ほど良く吠える。
- 752 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/14(土) 14:24:10 ID:LpU23rb00]
- Element Hiding Helperすげーね。
Firebugで似たような事やってたけど更に楽になった。
|

|