[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 2chのread.cgiへ]
Update time : 11/09 04:52 / Filesize : 226 KB / Number-of Response : 778
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

Proxomitron フィルター作成スレッド Part12



1 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/07/13(月) 17:54:26 ID:gFGxBE8e0]
Proxomitron-J
www.pluto.dti.ne.jp/~tengu/proxomitron/

日本語訳ヘルプ
www.pluto.dti.ne.jp/~tengu/proxomitron/help/Contents.html
Proxomitron等に関するWiki
abc.s65.xrea.com/prox/wiki/

Thinking Archive(仮)
vird2002.s8.xrea.com/

Proxomitron専用Uploader ( Upパス=Naoko )
proxo.hp.infoseek.co.jp/

4.5June+7 + 有難屋アイコン + バイパス赤アイコン な本体
ttp://proxo.hp.infoseek.co.jp/cgi-bin/sn_uploader/src/pr0165.zip

【前スレ】Proxomitron フィルター作成スレッド Part11
pc12.2ch.net/test/read.cgi/software/1233657293/

---- 関連スレ ----
Proxomitron Part 30
pc11.2ch.net/test/read.cgi/win/1218905098/

■■■■Proxomitron入門スレッド■■■■6
pc11.2ch.net/test/read.cgi/pcqa/1201242934/

ニコニコ動画専用オミトロンソフト板 Part23
pc12.2ch.net/test/read.cgi/software/1241342602/

【オミトロン】ニコニコ動画RC2専用オミトロン part12【.js】
pc11.2ch.net/test/read.cgi/streaming/1221869500/

151 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/10/21(水) 20:47:31 ID:L7sQ1bea0]
>>148
SleipnirならGILBっていうプラグイン入れると似たような感じで快適。
autopager入れたらオミトロンが効かなくなったので移行。

152 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/10/21(水) 22:12:47 ID:Xxabp5n00]
>>151
ありがとう
直リン禁止のも見られて良い感じです。

153 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/10/22(木) 23:57:08 ID:36s50RdI0]
my yahooにでっかいflash広告が出るようになってしまったんですけどこれを表示させなくするフィルターお願いします
アドレスはcm.my.yahoo.co.jp/

154 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/10/25(日) 18:14:27 ID:peYtggov0]
youtube仕様変わった?

155 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/10/26(月) 20:56:59 ID:LAR5AR2S0]
最近、fc2系のサイトを見ているとfc2携帯変換とかいう広告が出てくるのですが
画像やテキストの上にもお構いなしで出る上に閉じるをクリックしないと消えない仕様の様で
非常に鬱陶しいです

表示させない様にするフィルタはあるでしょうか?

156 名前:名無しさん@お腹いっぱい。 [2009/10/27(火) 17:03:28 ID:TXzS+eic0]
URLの一部部を切り取るにはどうしたらいいの?
abcde0fghi0jk/
↑これの0と0の間の文字を切り取って(2つの0も含む
abcdejk/
こんな感じに置き換えたいんです




Match\00*0\1
$RDIR(\0\1)

157 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/10/27(火) 17:06:07 ID:TXzS+eic0]
途中で送ってしまった・・

URLの一部部を切り取るにはどうしたらいいの?
abcde0fghi0jk/
↑これの0と0の間の文字を切り取って(2つの0も含む
abcdejk/
こんな感じに置き換えたいんです

一応自分でも書いてみたけど
Match \00*0\1
Replace $RDIR(\0\1)
何故か無限にヘッダを送り続けてて…

どうしたら良いのでしょうか

158 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/10/27(火) 19:24:33 ID:+0oqtcYu0]
$RDIRだからじゃね、JUMP

159 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/10/28(水) 18:25:51 ID:wAiHxxu80]
googleの検索結果で
リンク先が2chなら
リンクの色が赤になる
フィルターありますか?



160 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/06(金) 16:27:27 ID:MsLtt2qy0]
>>159
亀レスだが作ってみた。

[Patterns]
Name = "Google Search Result : If URL of 2ch, it reddens."
Active = TRUE
URL = "www.google.co.jp"
Limit = 141
Match = "(<a href="[^.]++.2ch.net/[^>]+)\0"
Replace = "\0 style="color : red;""

161 名前:159 mailto:sage [2009/11/06(金) 19:02:38 ID:8Ee+4E3K0]
>>160
ありがとうございました。
勉強になりました

また、よろしくお願いします。

162 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/07(土) 18:15:52 ID:q9wsQhRN0]
>>161
URL = "www.google.co(m|.jp)/"にしたほうが良いかも

ttp://www.animate.tv/radio/
PICKUP部分を丸ごと消すの下さい。

163 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/07(土) 19:05:29 ID:CeGvAUtbP]
>>162
<div id="pickup_list" class="clearfix"> に
style="display:none" を足してやればいい

164 名前:名無しさん@お腹いっぱい。 [2009/11/07(土) 22:18:16 ID:f9umQ68IO]
WikipediaやUncyclopediaを閲覧しているときに
URLがエンコードされて表示されています。
HTML上のURLエンコードをデコードするようなフィルターってないでしょうか?



165 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/08(日) 03:28:09 ID:z+gdfd1e0]
>>163
簡単な置き換えですか?
初心者スレに行った方がいいかな・・・

[Patterns]
Name = "animate.tv"
Active = TRUE
URL = "www.animate.tv/radio/"
Limit = 512
Match = "<div id="pickup_list" class="clearfix">"
Replace = "<div id="pickup_list" class="clearfix" style="display:none">"

166 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/08(日) 11:44:11 ID:srch9S8b0]
No object!!(似非NoScript)って特定のページでフィルター自体読み込ませないようにしたいんだけどどうすればいい?
Allow_Int.txt Allow_Ext.txtに書き込むんじゃなくて

167 名前:たぶん作者 mailto:sage [2009/11/08(日) 14:01:29 ID:0KA4py580]
>>166
No object!! Int、No object!! ExtのURLのマッチの最後に
(^$LST(Bypass_No_object))とでも追記して、ブロックファイルを作成してあげればおけ


168 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/08(日) 14:24:54 ID:9nIjhOBb0]
汎用スクリプトキラーはトラブルの元になるデメリットのほうが大きいな。

169 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/08(日) 14:36:15 ID:srch9S8b0]
>>167
    ___
   ,;f     ヽ
  i:         i
  |         |
  |        |  ///;ト,
  |    ^  ^ ) ////゙l゙l;
  (.  >ノ(、_, )ヽ、} l   .i .! |
  ,,∧ヽ !-=ニ=- | │   | .|
/\..\\`ニニ´ !, {   .ノ.ノ
/  \ \ ̄ ̄ ̄../   / .|




170 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/09(月) 00:01:10 ID:TdpAEtnT0]
あの〜YahooJトップなどにある動く広告だけをブロックするシンプルなフィルターだけってないですか?
killed多すぎですぐにbypassしてます

171 名前:165 mailto:sage [2009/11/09(月) 18:38:15 ID:xwNpXEjJP]
解決しました。

172 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/09(月) 22:41:53 ID:cwQVG1eF0]
マッチした数字から指定した数字を加算減算してReplaceで使うことは出来るでしょうか?
例えば-1して、10000にマッチしたら9999に、1にマッチしたら0にするというような使い方です

173 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/09(月) 23:51:45 ID:2/6aQrFU0]
>>172
実際にどういう処理を考えてるのか分かんないけど、javascript使うのはどうかな
Replaceに
<script>
var a = \0 - 1;
document.write(a)
</script>
とか書けば\0から-1したのが表示されるけど

174 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/10(火) 00:52:13 ID:fCJmA6uy0]
>>173
ありがとうございます
実際に書こうとしてるのはこんな感じです

Match = <b>([0-9]+)\0</b>$SET(1=<a href="hoge">\0</a>)
Replace = \1

hogeの部分に\0から-1した数字を入れようとしています
ページ数のカウントは1からなのにページナンバーが0から振られているサイトで、
ページ数とページナンバーが一致しないのでこのような処理を考えています
$SETを使ってるのは、要点以外省略しましたが他にもいろいろとごちゃごちゃ書いてるからです
href属性なのでそのまま使えそうにないですが、教わったjavascriptでどうにかできないか考えてみます

175 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/10(火) 01:22:16 ID:2qgD9ArS0]
「banner」にはマッチさせたいけど、
「nobanner」はマッチさせたくないって場合、
どうすればいいのか教えてください。

「(^no)banner」でやってみましたが、
「nobanner」の「banner」にもマッチしてしまいます。

176 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/10(火) 08:35:53 ID:wdcafvSo0]
ヘルプ読んでる?
「否定の表現はどんな文字も消費しないことに気をつけてください。」

177 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/10(火) 13:04:37 ID:tG5gm3580]
>>174
リスト作ってマッチさせれば出来るよ
末尾が0の時用に上の方に桁数の多いものを並べていく。replaceで\0をやれば-1したものが使える。
1000$SET(9=999)
100$SET(9=99)
200$SET(9=199)

800$SET(9=799)
900$SET(9=899)
10$SET(9=9)
20$SET(9=19)

80$SET(9=79)
90$SET(9=89)
1$SET(9=0)
2$SET(9=1)

9$SET(9=8)
0$SET(9=9)
この状態だと1~1999まで使える。

178 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/10(火) 13:05:30 ID:tG5gm3580]
replaceで\0

replaceで\9

179 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/10(火) 17:52:49 ID:oHc+8/+D0]
リストの先頭につける
"NoAddURL" "JunkBuster" "NoHash" "NoUrlHash" "NoPreHash"
をどのように使い分ければよいのかわからない。
wikiを見ても詳しく書かれてないし、日本語ヘルプだけだと理解できない。
利用頻度が低くてメモリを節約したければ
"NoHash" "NoUrlHash" "NoPreHash"
の3つを書いておけばいいのかなと思うんだけどどうなんだろう。

なお、今回はURL転送用リストを書くつもり。



180 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/10(火) 18:06:52 ID:X3QfLcm20]
>>175
そのまんま^nobannerでおk

181 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/10(火) 20:22:48 ID:sW0cgyTa0]
無知は黙ってろ

182 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/13(金) 00:10:14 ID:R2TUfzRp0]
>>177-178
ありがとうございます
取り込んだもともとの数字もそのまま使いたかったのと、
どうも数字以外にもマッチしてしまって誤爆していたので、
このように書いてみました

Match = <b>$LST(minus)</b>$SET(1=<a href="\0">\@</a>)
Replace = \1

リスト
[0-9]+&(100)\#$SET(0=99)

いまのところ問題なさそうです
リスト内にもコマンドが書けるという事を知らなかったので、
これからはもっといろいろ出来そうです

183 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/13(金) 01:57:26 ID:R2TUfzRp0]
問題ありありでした……
>>182の書き方だと100,200,300じゃなくて100,101,102…300って書かないとダメか
なーんか10件,20件とキリのいい数字が並んでると思った

184 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/13(金) 09:14:04 ID:weOo+DXm0]
<b>([0-9]++)\2$LST(minus)</b>$SET(1=<a href="\2\0">〜</a>)
リスト
>>177
$SET(0=)は1マイナスした数

<b>の後から数字を目いっぱい探して、末尾の数字がリストにマッチしたら変数0に-1された数が入ってる。
100とか末尾が00、000、・・・の時は09と誤爆してしまうので、リストの上に00,000を追加。これで先にマッチしてくれる。

185 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/14(土) 21:24:44 ID:PCvQuIhu0]
Proxomitronに慣れる為にiswebの広告を消してみたんだが、これでいいんだろうか?
何か関係ないものを間違って消したりしないかな?
Matching Expression:<!-- isweb auto-insert * ((isweb auto-insert ?.* -->)|(NEWS Banner BOTTOM END -->))
Replacement Text:\0

186 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/14(土) 22:34:00 ID:hQCvmlas0]
>>184
ありがとうございます
最短一致で桁が下がる場合以外の2桁以上の桁は別途格納し、
リストは桁が下がる場合と一の位の数字にのみ使うものと遅蒔きながら理解しました
<b>(([0-9]++)\2$LST(minus))\3</b>$SET(1=<a href="\2\0">\3</a>)
とすることで元の数字も使うことが出来ました
結局全部教えて貰ってしまって、ありがたいやら情けないやら……

187 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/14(土) 22:47:19 ID:hQCvmlas0]
「桁が下がる」じゃなくて、「一番上の桁が変化する」でした、もうダメだ

188 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/15(日) 10:04:05 ID:uEZc9fp/0]
>>185
自分で確認して間違ってなかったら、それでいい
Replaceの\0は要らないけど

189 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/15(日) 13:01:04 ID:Jr2UMHLQ0]
入門用のサイトも読まないで質問してくるようなアホはスルーでおk



190 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/16(月) 00:09:59 ID:6fWF0Sv60]
フィルタの高速化
vird2002.s8.xrea.com/proxomitron/tips_speed_up_filter.html

↑このページの、「$STOP, \k を使うと、速くなる」ってところ、変じゃない?

> Jump to abc.com test1 … 0.022ミリ秒
> Jump to abc.com test2 … 0.0906ミリ秒
>
> 約4倍の差ですね。

使ってる方が遅くなってるって言うか、
そもそも、Jump to abc.com test2だと、
その下のhtmlソースにマッチしないし。

> Jump to abc.com test2
> Match = "<a\s[^>]++href=$AV((abc.com/*a)\0)$STOP()"

*の後のaが邪魔かな。

191 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/16(月) 01:11:17 ID:Zuwrcy+R0]
そのページ読む価値なし。$NESTなんてまったく高速化になってないし。

192 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/16(月) 12:51:19 ID:7kd7J49q0]
またチンコか。

193 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/16(月) 17:18:20 ID:MRGKoJdp0]
>>191
場合によってはなるぜ?


194 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/16(月) 17:27:54 ID:X0F/vqJU0]
>>190
>$URLを検索表現の先頭に〜
って$URL(〜)がマッチしなければ先頭に置いたほうが早いのかな?
URLで絞ってさらに、$URLで分ける場合。

195 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/17(火) 05:46:01 ID:3WbTWbjU0]
www.ugtop.com/spill.shtml

196 名前:think ◆bKk/qcAKuM mailto:sage [2009/11/17(火) 19:47:20 ID:wo0mHQNx0]
>>190
仰るとおり、矛盾していますね。"a" もtypoでした。後ほど直しておきます。

高速化に関しては感情的になって反論する方が多くいるのと、
環境に左右されるところが大きいので議論するつもりはないのですが、
指摘は有り難いです。ありがとうございます。

>>194
> >$URLを検索表現の先頭に〜
> って$URL(〜)がマッチしなければ先頭に置いたほうが早いのかな?
$URL(〜)がマッチしなくても、当該Webページフィルタが有効である限り、「一文字ずつ $URL() を試行してマッチしない処理を行う」ので遅くなると思います。

[Patterns]
Name = "New HTML filter"
Active = TRUE
URL = "hoge.com/"
Limit = 256
Match = "$URL(hoge.com/1/)(test1)\0|"
"$URL(hoge.com/2/)(test2)\0"
Replace = ""\0""

1. hoge.com/1/ にリクエストする場合
一文字ずつ $URL(hoge.com/1/) を試行して、マッチすれば "test1" を返す。
マッチしなければ、$URL(hoge.com/2/) を試行して、マッチしない処理を行う。

2. hoge.com/2/ にリクエストする場合
一文字ずつ $URL(hoge.com/1/) を試行して、マッチしない。
続いて、$URL(hoge.com/2/) を試行して、マッチすれば "test2" を返す。

管理しづらくなるでしょうが、フィルタを2つに分けるのが最も速くなります。
速度を妥協するなら、$URL() を後ろに持って行くということになります。
この辺は考え方次第なので、人それぞれだと思います。

197 名前:194 mailto:sage [2009/11/17(火) 20:03:20 ID:oQ8C5FDM0]
>>196
レスありがとうございます。
$URL()の場合は文字→$URLなので遅いんですね・・・
関連して、$KEYCHK(〜)はMatchではなく、URL部分に入れたほうが早いということでいいでしょうか?

198 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/19(木) 01:46:21 ID:0Fl5Neji0]
>>193
分かりやすい例で例えるとすれば、「深爪すればダイエット出来る」と言ってるようなものだ。
確かに切った爪の重さの分だけ軽量化されてるが、果たしてこれはダイエットと呼べるのか、という。

感情的にでなく冷静に考えても高速化とは言い難い内容です。

199 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/19(木) 09:37:35 ID:nQbDfQsR0]
分かりにくい例えより実例をこれでもかと言うほど沢山挙げた方が良いのでは?



200 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/19(木) 10:10:10 ID:o6io/xEKP]
くだらん議論が延々続くだけだからやめれ

201 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/19(木) 21:06:54 ID:kXGvwsp70]
>>198
例えるのなら「空気が適度に入った自転車」と「少し空気の抜けた自転車」が正しいと思うが

NEST使用例 :<tag$NEST(>,<)/tag>
NEST不使用例:<tag>*</tag>
サンプルテキスト:<tag>aaaaa</tag>とかをいっぱい
これだと上のがちょい速い


202 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/19(木) 21:52:40 ID:kNNZxI460]
YourFileHostの動画に表示される広告って非表示にできませんか?
自分でやってみたらプレーヤーじたいが表示されなくなりました・・・
よかったら誰か教えてください、お願いします。

203 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/19(木) 21:53:46 ID:0JxVr7R/0]
まず服を脱ぎます

204 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/19(木) 22:03:28 ID:gRUGig0h0]
>>201
いかにもウンコ的思想だな。

205 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/19(木) 22:55:16 ID:kXGvwsp70]
>>204
頭の悪い奴だな
速い「場合」もあるって言ってるだろ
NEST使っても$NEST(<tag>,</tag>)だと遅くなるんだぞ

206 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/20(金) 02:15:34 ID:RU/z784X0]
> NEST使用例 :<tag$NEST(>,<)/tag>

( ゚Д゚) スゲー こんな書き方があったんだ。
勉強になったわ。

ちなみに、テスト結果。
0.40 <tag$NEST(>,<)/tag>
0.45 <tag>*</tag>
0.50 $NEST(<tag>,</tag>)

207 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/20(金) 04:31:52 ID:+UH4i8Cz0]
(>,<)

208 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/20(金) 04:32:17 ID:i2XcIHdn0]
(>,<)/~

209 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/20(金) 14:25:49 ID:o4Kj3ltD0]
それって<tag>[^<]+</tag>より速いの?



210 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/20(金) 18:13:26 ID:+p1FrTHq0]
>>206
大量に書いてテストしてるにも関わらず最大でも0.1しか違わないの?これが高速化?

211 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/20(金) 20:16:13 ID:5nz/1Z4p0]
>>209
その書き方だと<tag>*</tag>より確実に遅くなるから

>>210
高速化するかどうかって話ならな

212 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/20(金) 22:02:16 ID:f9OjW4+n0]
日本語とかの全角文字だけにマッチするには[%00-FF]?
半角すべてを除外したほうが楽かな?

213 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/20(金) 22:46:37 ID:+p1FrTHq0]
>>211
なるほど、これはもう誤差の範囲ですね

214 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/20(金) 23:04:09 ID:mB4dIU6j0]
>>213
うん
あとNESTだとマッチしなくて、*使ったらちゃんと動いたってのは前に経験した

215 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/21(土) 12:40:00 ID:UfPMXBtj0]
いつもの人は相変わらずだね。

216 名前:think ◆bKk/qcAKuM mailto:sage [2009/11/21(土) 14:33:17 ID:A5RkcVy50]
>>197
> 関連して、$KEYCHK(〜)はMatchではなく、URL部分に入れたほうが早いということでいいでしょうか?
そうですね。
URLマッチで $KEYCHK() した場合は、ブラウザからリクエストURIを受け取った時に一回だけフィルタテストします。
Match欄で $KEYCHK() した場合は、ブラウザが1バイト読み込む度にフィルタテストしてしまいます。
なので、前者の方が圧倒的に速くなります。

よくURLマッチに $TYPE() が使われますが、高速化と不必要に動作させないことで誤爆を防いでいる意味もあるので、
URLマッチは出来るだけ厳密にすると良いと思います。

217 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/21(土) 15:50:19 ID:dH2n5SMR0]
前に$KEYCHKについて>197と同じようなことを質問したとき、
URLマッチよりも検索表現に置いた方が速いって答えをもらったことがあったな。
自分の質問のしかたが悪かったのかもしれん。

218 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/21(土) 16:56:25 ID:tgqfXaDr0]
$TYPE(htm)はURLの前に置くか後に置くかで違いはありますか?

219 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/21(土) 19:46:49 ID:eTIfGYcR0]
jp.techcrunch.com/archives/20091120rippols-video-discovery-engine-launches-to-the-public/
この記事読んでRippolを試してみたんだが、どうやらAdd LinkがRippolの検索では不具合を起こす模様



220 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/21(土) 22:38:15 ID:n5mdegag0]
>>217-218
軽く実験してみた
単位は秒、約12,000行の30回の平均

$TYPE
URL
1.54803
Match 最後
1.41023
Match 最初
1.48366

$URL
URL
1.52293
Match 最初
1.98303
Match 最後
1.56253

$KEYCHK(面倒くさかったから否定でやった)
URL
1.5456
Match 最初
話にならないくらい遅い
Match 最後
1.88253


221 名前:think ◆bKk/qcAKuM mailto:sage [2009/11/21(土) 23:02:31 ID:A5RkcVy50]
>>218
> $TYPE(htm)はURLの前に置くか後に置くかで違いはありますか?
URL = "hoge.com/$TYPE(htm)"



URL = "$TYPE(htm)hoge.com/"

の比較ということなら、実験できない(テストウインドウではヘッダが関わるテストは出来ない)のではっきりとは言えないのですが…。

通信する過程を考えると、

1. URLをリクエストする (URLマッチ)
2. サーバからContent-Typeヘッダを受け取る ($TYPE処理)

と処理順は決まっているので、「URLマッチ全体を構文解析した後に順番に処理している」気がします。
つまり、「どちらも同じ」なのではないかと。

222 名前:think ◆bKk/qcAKuM mailto:sage [2009/11/21(土) 23:04:52 ID:A5RkcVy50]
>>221を訂正します。

× 「どちらも同じ」
○ 「処理順は変わらないので、同等の速度」

223 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/21(土) 23:39:46 ID:vMSDZcY30]
>>175
[Patterns]
Multi = TRUE
Match = "$STOP()(?|)\0banner"
Replace = "\0-"

Multi = TRUE
Match = "(^no)(??)\0banner"
Replace = "\0-"

最初のフィルタで行頭に対応
2つめのフィルタで行頭以外に対応

無駄なマッチが出るので、Multi=TRUEは必須かも(無限ループ注意)

224 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/22(日) 05:14:44 ID:nrSpy19j0]
win7 64bit上でProxomitronは動きます?

225 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/22(日) 06:52:12 ID:Ei3D7LOI0]
ええ

226 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/25(水) 01:07:40 ID:DjTqUMwg0]
初歩的な質問をさせてください。

特定の構文内に「ある文字列が無い場合」に注釈文を追記するフィルタを作りたいのですが
「ある文字列がある場合」の置換はカンタンなのですがこの場合の記述方法はどうすればいいのでしょうか?

ちなみにやりたい事はヤフオクにおいて「かんたん決済非対応」の案件に目立つ注記を挿入したいのです・・・。

227 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/25(水) 09:09:42 ID:X9dAPRAJP]
「ある文字列が現れずに次に来る文字列が現れている場合」にマッチさせればいいのでは

228 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/25(水) 12:43:18 ID:DrlhOeoE0]
適当な文字列(^*ある文字列)*でいけたんじゃないっけ?

別の方法としては
「在る文字列がある場合とない場合で共通している部分」
(在る文字列|$SET(0=〜))
「共通部分」

229 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/25(水) 14:13:15 ID:uRxOOtH30]
>>226
(特定の構文内&&(^*ある文字列)*)

$NEST(特定の構文内の最初の文字列,(^*ある文字列)*,特定の構文内の最後の文字列)

特定の構文内の最初の文字列(^((^特定の構文内の最後の文字列)?)++ある文字列)*特定の構文内の最後の文字列



230 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/25(水) 22:04:08 ID:E8oKtaMkP]
(^(^$NEST(<tag, id="hoge"[^>]+>(^*ある文字列)*,</tag>)))
(<tag[^>]+>)\#$SET(#=挿入内容)
とか

231 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/27(金) 01:39:17 ID:5vCUWHnt0]
皆様アドバイスありがとうございました。
直感的に理解しやすい>>231の真ん中の行を使ってみました。

[Patterns]
Name = "Yahoo auctions alerts"
Active = TRUE
URL = "*auctions.yahoo.co.jp*"
Limit = 4000
Match = "$NEST(<h3>[%bb][%d9][%ca][%a7][%a4][%a4][%a4][%cb][%a4][%c4][%a4][%a4][%a4][%c6]</h3>,(^*[%a4][%ab][%a4][%f3][%a4][%bf][%a4][%f3][%b7][%e8][%ba][%d1])\1,</table>)"
Replace = "<h3>[%bb][%d9][%ca][%a7][%a4][%a4][%a4][%cb][%a4][%c4][%a4][%a4][%a4][%c6]</h3>,\1,[%a4][%ab][%a4][%f3][%a4][%bf][%a4][%f3][%b7][%e8][%ba][%d1][%c8][%f3][%c2][%d0][%b1][%fe]</table>"



不恰好ながらもこれでうまくマッチしてくれたのですが置換後の文字がコードそのまま置換されてしまいました。
全角文字に変換して置換するにはどこを直せば良いのでしょうか・・・・

232 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/27(金) 01:50:24 ID:QxjsnpfI0]
>>3
---- 文字参照関係 ----

233 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/27(金) 06:26:38 ID:nvFnCeFV0]
このソフトってxmlタグは書き換えられないのか?
できないんだが

234 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/27(金) 08:14:49 ID:mgg7SA2r0]
Conetnt-Typeヘッダの text/xml や application/xml を text/html とかに適当に置換

235 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/27(金) 09:32:28 ID:GwH22NJEP]
$FILTER(true)

236 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/27(金) 15:15:25 ID:nvFnCeFV0]
サンクス

237 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/27(金) 17:28:10 ID:XLzW5h/Z0]
>>231
それ$NEST使う必要ないね。
どうしても使うなら$NEST(<table〜,〜,</table>)かな。ネストのカッコ内の最初と最後のタグは対。

238 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/27(金) 18:02:28 ID:D6GsiNhZP]
一応範囲狭める役には立ってるんじゃないかな

239 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/28(土) 03:38:48 ID:dHca1lakP]
問題無くてもできるアドバイスはしてやってもいいだろ



240 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/28(土) 11:39:54 ID:A5NrQKd10]
間違ったアドバイスしといて何言ってんだこいつは。。。

241 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/28(土) 11:40:50 ID:0Ggu2iJG0]
(;゚д゚)ァ

242 名前:237 mailto:sage [2009/11/28(土) 11:52:30 ID:69SxiubT0]
一応行っておくけど≠>>239
$NESTって始まりと終わりがついになってるのしか見たことないけど違う場合って、ネストなしのマッチングルールと違いあるの?

243 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/28(土) 12:33:21 ID:DWwYiZb0P]
ABC⇒Aにマッチ→Bにマッチ→Cにマッチ
$NEST(A,B,C)⇒Aにマッチ→AかCにマッチ(AとCのマッチした数が同じになるまで検索)→間の部分がBにマッチ


244 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/28(土) 12:43:57 ID:69SxiubT0]
>>243
すげーよくわかったw
ネストがA(*C*A)++B(*C*A)++C見たいな感じ(あくまで”みたいな”。Bの位置が不十分)ってのはわかってたんだけど、やっとすっきりしたよ。
確かに>>237間違ってたな。スマン

245 名前:think ◆bKk/qcAKuM mailto:sage [2009/11/28(土) 14:08:25 ID:BKXCBlZx0]
蛇足ですが、

$NEST(A,B,C)

は入れ子になっていなければ、

A*C&&ABC

とほぼ等価で、役割的には Bounds が該当しますね。
入れ子になっていない場所で $NEST を使うと「本当に入れ子になってしまった場合」に予期せぬ事態を招いてしまう可能性があります。

特にYahooはお世辞にも綺麗なソースとは言えないので、入れ子チェックが機能するよう $NEST を使った方が無難だと思います…。

[Patterns]
Name = "Yahoo auctions alerts [2009/11/28] fixed"
Active = TRUE
URL = "page[0-9].auctions.yahoo.co.jp/$TYPE(htm)"
Limit = 4096
Match = "($NEST(<div,\s[^>]++class=$AV(untHead)[^>]+>*<h3>[%bb][%d9][%ca][%a7][%a4][%a4][%a4][%cb][%a4][%c4][%a4][%a4][%a4][%c6]</h3>*,</div>))\#"
" $NEST((<div)\#,(\s[^>]++class=$AV(untBody)[^>]+>)\#"
"(^*[%a4][%ab][%a4][%f3][%a4][%bf][%a4][%f3][%b7][%e8][%ba][%d1])"
"(*<th\s[^>]+>[%b7][%e8][%ba][%d1][%ca][%fd][%cb][%a1]</th> <td\s[^>]+>)\#$SET(#=<strong style='color: red;'>かんたん決済非対応</strong><br />)\#"
",</div>)$STOP()"
Replace = "\@</div>"

246 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/28(土) 14:22:00 ID:BKXCBlZx0]
>245のフィルタのテスト用URL
page9.auctions.yahoo.co.jp/jp/auction/k117982968

247 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/29(日) 00:44:53 ID:qupe/7Tm0]
>>247
upload.jpn.ph/upload/img/u52854.jpg

こんな感じに化けてしまうのですが・・・

248 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/29(日) 00:56:42 ID:LK6AZYXkP]
かんたん決済非対応

&#12363;&#12435;&#12383;&#12435;&#27770;&#28168;&#38750;&#23550;&#24540;

249 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/29(日) 01:06:13 ID:qupe/7Tm0]
>>250
補足ありがとう。
あとヤフオクはpage10以降もあるので一桁のみだと不足しているので少し変えてみたよ。

[Patterns]
Name = "Yahoo auctions alerts [2009/11/28] fixed"
Active = TRUE
URL = "*.auctions.yahoo.co.jp/$TYPE(htm)"
Limit = 4096
Match = "($NEST(<div,\s[^>]++class=$AV(untHead)[^>]+>*<h3>[%bb][%d9][%ca][%a7][%a4][%a4][%a4][%cb][%a4][%c4][%a4][%a4][%a4][%c6]</h3>*,</div>))\#"
" $NEST((<div)\#,(\s[^>]++class=$AV(untBody)[^>]+>)\#"
"(^*[%a4][%ab][%a4][%f3][%a4][%bf][%a4][%f3][%b7][%e8][%ba][%d1])"
"(*<th\s[^>]+>[%b7][%e8][%ba][%d1][%ca][%fd][%cb][%a1]</th> <td\s[^>]+>)\#$SET(#=<strong style='color: red;'>かんたん決済非対応</strong><br />)\#"
",</div>)$STOP()"
Replace = "\@</div>"


どうせなら挿入箇所を「商品の情報」の部分にできると下までスクロールさせる手間も省けて便利になるかな〜。



250 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/29(日) 01:39:59 ID:0ZxInaX90]
>>249
レス番ずれてるから再取得で。

251 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/11/29(日) 02:00:36 ID:LK6AZYXkP]
" $NEST((<div)\#,(\s[^>]++class=$AV(untBody)[^>]+>)\#"は
" $NEST(<div,$SET(#=<div)(\s[^>]++class=$AV(untBody)[^>]+>)\#"
に変えたほうがいいかも。(入れ子になってるとその分#に<divが入って<div<div<div class="untbody">みたいになるため)






[ 続きを読む ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<226KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef