Proxomitron フィルタ ..
905:名無しさん@お腹いっぱい。
06/10/27 15:33:23 cpcnkQie0
昨日、寝る前にベッドの中で思いついたアイデアを今思い出したので、書き残しておきます。
hrefの中で../を発見することが相対リンク→絶対リンクの発動条件ですが、これを肯定先読みを使うことで
よりスマートに、より複雑に、より分かりづらいフィルタに(w)することができます。
href=$AV((^(^../))
この段階でフィルタの発動条件を満たします。
この直後に現在いる階層の深さを測ります。(>902をそのまま利用)
($TST(SWITCH=1)$SET(\0=URL)|
$URL([^:]+://[^/]+/$LST(increment)([^./]+/$LST(increment))+)$SET(URL=\0)$SET(SWITCH=1))
そしてhref内の../を数え上げて、decrementによって引き算します。
(../$LST(decrement))+(*)\3
最後に>900をそのまま利用します。
以上より
Match = "$NEST(<a\s,\1href=$AV((^(^../))($TST(SWITCH=1)$SET(\0=URL)|"
"$URL([^:]+://[^/]+/$LST(increment)([^./]+/$LST(increment))+)$SET(URL=\0)$SET(SWITCH=1))(../$LST(decrement))+(*)\3)(*)\4,>)"
"$URL(([^:]+://[^/]+/$LST(decrement)$TST(\0=[^0])([^./]+/$LST(decrement)$TST(\0=[^0]))+)\5)"
Replace = "<a \1href="\5\3"\4>"
href=$AV()の中に詰め込んだだけで、それ以外は何も変わりません。
906:名無しさん@お腹いっぱい。
06/10/27 16:26:44 cpcnkQie0
ウェブ上での動作確認版
Name = "URL"
Active = TRUE
URL = "$TYPE(htm)"
Limit = 256
Match = "$NEST(<a\s,\1href=$AV((^(^../))($TST(SWITCH=1)$SET(NUM=$GET(URL))|"
"$URL([^:]+://[^/]+/$SET(NUM=1)([^./]+/$LST(increment))+)$SET(SWITCH=1)$SET(URL=$GET(NUM)))(../$LST(decrement))+(*)\3)(*)\4,>)"
"$URL(([^:]+://[^/]+/$LST(decrement)$TST(NUM=[^0])([^./]+/$LST(decrement)$TST(NUM=[^0]))+)\5)"
Replace = "<a \1href="\5\3"\4>"
incrementリストの中身
***********************************************
$TST(NUM=1)$SET(NUM=2)
$TST(NUM=2)$SET(NUM=3)
$TST(NUM=3)$SET(NUM=4)
$TST(NUM=4)$SET(NUM=5)
$TST(NUM=5)$SET(NUM=6)
$TST(NUM=6)$SET(NUM=7)
$TST(NUM=7)$SET(NUM=8)
$TST(NUM=8)$SET(NUM=9)
$TST(NUM=9)$SET(NUM=A)
$TST(NUM=0)$SET(NUM=1)
************************************************
907:名無しさん@お腹いっぱい。
06/10/28 02:01:34 K8mTgtv60
韓国とか朝鮮という言葉を一切目にしたくありません。そういうフィルターをお願いします。
908:名無しさん@お腹いっぱい。
06/10/28 02:05:21 KHlbWOOD0
&の基本的な使い方がまだよくわかっていないようで、つまずいています。
Bounds = "<textarea\s*>"
Limit = 128
Match = "*(*cols=$AV([#51:*])\1)&(*rows=$AV(\2))"
Replace = "<textarea cols="50" rows="\2" title="large textarea resized - \1">"
textarea の cols が大きいと横スクロールバーが発生するので、
それを防ぐためのものです。
上のMatchだと、\2の中身が数字にとどまらず、余計なものまで入れてしまうようです。
$AVを使うことで属性値を正しく解釈してくれるものと期待したのですが、
うまくいっていないようです。
textarea は空要素ですが、空要素でないものでは、
上記のような方法で望み通りの結果が出ています。
テスト用サンプル
<textarea rows="20" id="sample" cols="100">
<textarea cols="100" rows="20" id="sample">
909:名無しさん@お腹いっぱい。
06/10/28 02:29:52 z3Kpim4u0
textareaの中のcols属性の値が50を超える場合は50にして、それ以外は変更しない、というフィルタでOK?
こんな感じになると思う。
マッチ欄だけね。Boundsは使わない。
$NEST(<textarea\s,*cols=$AV([#51:*])*,>)
NESTをこのように使うと","と","の間には以下のような文字列がはまる。
<textarea rows="20" id="sample" cols="100">なら
rows="20" id="sample" cols="100"
<textarea cols="100" rows="20" id="sample">なら
cols="100" rows="20" id="sample"
そしてアスタリスクサンドイッチによって*cols=$AV(hogehoge)*としてやると
cols属性の前部分と後ろ部分は*(アスタリスク)によって消費する。
俺の場合はNESTとアスタリスクサンドイッチは、一つの属性だけに着目するときに常用する常套手段だね。
他の人だったらまた別の手法を常用しているのは↑のフィルタ例を見れば分かる通りで、唯一の解はない。
あとはアスタリスクで消費される部分をローカル変数に収めてやればよい。
\1cols=$AV(hogehoge)(*)\2
このようにね。
このローカル変数をそのまま利用するのであればReplace欄は以下になる。
<textare \1cols="50"\2>
以上より
Match = "$NEST(<textarea\s,\1cols=$AV([#51:*])(*)\2,>)"
Replace = "<textare \1cols="50"\2>"
がお望みのフィルタとなると思う。
&は使ったことがないので、もし&の使い方を勉強がしたかったのなら力になれずスマソ。
人によって書き方って全然違うからね・・・。
910:名無しさん@お腹いっぱい。
06/10/28 02:32:49 z3Kpim4u0
書き忘れたけどNEST+アスタリスクサンドイッチの書き方はかなわずこうでなきゃいけないので注意。
$NEST(tagname\s,*hogehoge=$AV(foobar)*,>)
911:名無しさん@お腹いっぱい。
06/10/28 09:46:21 9IGS2CbP0
memo : ([^?#/]+/)\#+{1,*}
912:名無しさん@お腹いっぱい。
06/10/29 20:48:09 Y14y3roy0
久々にイメージ検索をした時に気づいたんだけど、
google image (060810_kai) +js+がたまに悪さをして、
イメージ部分が表示されない時があるみたい。
なんでだろう。
あと以前のgoogle imageは、画像をクリックするとオリジナルのサイズの画像で表示されたけど、
これだと画像サイズが固定された状態に拡大縮小されてしまってるかも。
もし良かったら修正お願いしマッス。
913:名無しさん@お腹いっぱい。
06/10/30 22:25:46 4HUAuLcP0
こんばんは。
もしご存知の方がいれば教えて頂きたいのですが、よろしいでしょうか?
>>160さんの回答で出てくると同じオンラインゲーム「Livly Island」の
「技」のなかで特定の物を表示できなくしたいのですが、できるのでしょうか。
もし、技swfをシャットアウトしてしまう方法をご存知の方がいらっしゃいましたら、
よろしくお願いいたします。
(アクションスクリプトかどうかはわかりません。Flashやったことないもので…)
914:名無しさん@お腹いっぱい。
06/10/31 17:55:19 8orGPcrc0
既出なので今更と思うかも知れないが、
Livly Island 関係のフィルタはゲームのモラルやポリシーに関わるものが多い。
このスレでは扱わない方がいいだろうと思うんだ。
基礎さえ知っていれば難しいことじゃないし、
あちらの専用スレでも自力でできることが前提だと言われていたしな。
915:名無しさん@お腹いっぱい。
06/10/31 18:42:34 8orGPcrc0
>>913
確認してきたらマルチじゃないか。
向こうで追っ払われたからってこちらに来ないでくれよ。
916:名無しさん@お腹いっぱい。
06/11/01 17:03:39 lqgq8ohV0
特許庁のIPDL公報テキスト検索
URLリンク(www7.ipdl.ncipi.go.jp)
の検索結果を新しいタブ(ウインドウ)で開きたい。
下のような、フィルタではうまく行かなかった。
submitの値をreturnしてwindow.openと組み合わせればできそうなんだけど。。
[Patterns]
Name = "IPDL new tab opener"
Active = TRUE
Limit = 256
Match = "HREF="JavaScript:ListSubmit"
Replace = "HREF="JavaScript:window.open"
917:名無しさん@お腹いっぱい。
06/11/01 20:40:48 egiE4oOy0
>>151 = >>913 の可能性がドロリ濃厚な件。
918:think ◆MM0nnAOCiQ
06/11/03 00:42:38 508VMIZd0
>>905-906
遅レスで申し訳ありません。
あれから、他のフィルタに夢中になってしまいまして、デクリメントから遠ざかっていました。(汗)
そちらは一区切り付いたので、またデクリメントに挑戦してみようと思います。
で、改めてみて気がついたのですが、検索表現で$TSTする都合上、グローバル変数を使わざるを得ないのですね。
そういう意味で、\#に拘ったのは無意味だったかもしれません。
>>908
まだ見ていますか…?
とりあえず、& は使わなくて良い気がします。
title属性で格納したい対象がよく判りませんが、私なら以下のように書きます。
Match = "(<textarea\s[^>]++cols=)\0$AV(([#51:*])\1)"
Replace = "\0"50" title="resized cols \1 -> 50""
>>909
お疲れ様です。
細かなことですけど、(*)\2 は \2 にして大丈夫です。
$AVの括弧はグループ化ではありませんので、\2はアスタリスクと同じように働き、消費されます。
919:823
06/11/03 00:59:24 c1M+0JK70
>>823のヘッポコmixiフィルタを書いたものです。
ちょっぴり訂正
|(<(table|td)\s[^>]++width=)\2$AV(710)([^>]+>)\3
の下に、
$URL(^URLリンク(mixi.jp))
が必要だす。
高度な内容が並ぶなか、お恥ずかしい。
$NEST恐怖症を解消して綺麗なフィルタ書きを目指したいな。
920:名無しさん@お腹いっぱい。
06/11/03 01:23:21 zp3j1wvA0
goooooogleimageが効かねー。誰か作り直し頼んだ
921:名無しさん@お腹いっぱい。
06/11/03 11:37:12 wGQAznhc0
[Patterns]
Name = "Google image redirector [061103]"
Active = TRUE
URL = "images.google."
Limit = 1024
Match = "var\ e=\"/imgres\?imgurl=\"\+\0\+\"\&imgrefurl=\"\+\1\+[^;]+;c\+=\"<a href=[^>]+>$STOP()"
"$SET(9=c+="<a href="+unescape(\1.match(/^[^&]+/))+" target=_blank>Link</a><a target=_blank href="+unescape(\0)+">)"
"|"
"<a href=/imgres\?imgurl=\0\&imgrefurl=\1\&h=*>"
"$SET(9=<a href=$UESC(\1) target=_blank>Link</a><a href=$UESC(\0) target=_blank>)"
Replace = "\9"
922:名無しさん@お腹いっぱい。
06/11/03 11:38:48 wGQAznhc0
[Patterns]
Name = "google image (061103) +js+"
Active = TRUE
URL = "images.google.co(.jp|m)/"
Limit = 1024
Match = "var\ e=\"/imgres\?imgurl=\"\+\0\+\"\&imgrefurl=\"\+\1\+[^;]+;c\+=[^;]+;[^;]+;[^;]+;$STOP()"
"$SET(9=var e=unescape(\1.match(/^[^&]+/));var proxvar=\0;"
"c+="<a href="+e+" target=_blank>imgref</a> / <a target=_blank href="+unescape(proxvar)+">img</a><br>"
"<img ondblclick='this.src="+'"";this.style.display="none"'"
"+"' onclick='if(this.a){this.src=this.a;this.a=0}else{this.a=this.src;this.src="+'"http://'+unescape(proxvar)+'"}'"
"+"' src=/images?q=tbn:"+b.d+proxvar+">";)"
"|"
"<a href=/imgres\?imgurl=[^&]+\&imgrefurl=([^&]+)\0[^>]+> <img[^>]++(src=/images\?q\=tbn:[^:]+:([^ >]+)\2)\1*</a>"
"$SET(9=<a href="$UESC(\0)" target="_blank">imgref</a> / <a href="\2" target="_blank">img</a><br>"
"<img ondblclick="this.src='';this.style.display='none'" onclick="if(this.a){this.src=this.a;this.a=0}else{this.a=this.src;this.src='\2'}"\1</a>)"
Replace = "\9"
923:名無しさん@お腹いっぱい。
06/11/03 12:33:11 P23w4aje0
>>921
ありがとうございました。
924:908
06/11/04 17:53:30 BDG40CNw0
遅くなりましたが、どうもありがとうございます。
望むフィルタを書くことができました。
>909
$NESTを使いこなすといろいろ便利そうですね。
テクニックのひとつとして覚えておきます。
>918
Boundsを積極的に使おうという風に頭が働いてしまうので、
そのように考えることができませんでした。
必要ならばBoundsを使わないようにするということも頭に入れておきます。
私はフィルタ作成時にtitle属性をよく使いますが、
フィルタがマッチする前にどう書かれていたのかをわかりやすくするために利用しています。
>908の場合だと、本来HTMLを書いた人がcols=$AV([#51:*])\1としたかったのを
書き換えるわけで、書き換える前のcolsの値がすぐにわかります。
>908でtitle属性で格納したい対象は、colsの値です。
書き換えたことが一目でわかるとアクセス性の向上などにつながると思いますし、
デバッグの際にも役立ちます。
925:名無しさん@お腹いっぱい。
06/11/04 19:49:29 BDG40CNw0
Bounds = "<pre*<pre>"
Limit = 1024
Match = "(\#(\r\n|\r|\n)+{5,*})+"
Replace = "\@"
pre要素の中に改行が連続していると縦にページが長くなるため、
改行が5つ以上あった場合<br>と見なして削除するフィルタです。
(こういう場合は論理目的でpre要素を使っていないものと判断します)
\#と\@の練習も兼ねています。
改行コードだけ削除してくれればよいのですが、いまのところ動作しないようです。
たぶんMatchがまずいのだろうと思うのですが、何が間違っているのでしょうか?
926:think ◆MM0nnAOCiQ
06/11/04 21:14:59 qgIOVES+0
またやってしまいました…。
>918を取り込んでいたら、以下に差し替えてください。
Replace = "\0"50" title="resized cols \1 -> 50""
>>924
> デバッグの際にも役立ちます。
確かに便利ですよね。置換内容がすぐに判る仕組みを作っておくと早期バグ発見に貢献すると思います。
>>925
目の付け所はよいと思いますが、ケアレスミスで失敗しているようです。
1. Boundsの終了タグを </pre> にする
2. 検索表現の最後に \# を加える
3. (\r\n|\r|\n) を (\r\n|[\r\n]) にする (どっちでも良いのですけど、文字クラス化した方がすっきりします)
これで、期待通りに動作すると思います。
特に、2. が躓きやすいところかもしれません。
(...)+ で再帰的に処理させる場合は、その表現でどこまで消費されるかをシミュレーションしてください。
この場合、「5回以上の改行」まで消費されますが、そのままでは </pre> が残るためマッチしない、ということになります。
927:名無しさん@お腹いっぱい。
06/11/04 22:56:39 BDG40CNw0
>926
どうもありがとうございます。ものすごいケアレスミスをしていますね……。
\#を使う前に*あたりで実験してもみたのですが、
preの閉じ忘れに気づかなかったことで全部台無しです。
928:名無しさん@お腹いっぱい。
06/11/04 23:06:57 wS+Fn6Tk0
>>925のが動かないときはまず
Bounds = "<pre*<pre>"
Limit = 1024
Match = "*"
Replace = "Match!"
みたいに簡単なフィルターを書いて試すといいよ、これは動かないのでこの中に原因があると分かる。
929:名無しさん@お腹いっぱい。
06/11/05 16:53:08 H3/sRPVo0
MyYahooのFLASHと[PR]を消してください・・・
URLリンク(my.yahoo.co.jp)
930:名無しさん@お腹いっぱい。
06/11/05 21:50:02 OFSGT4Qa0
>>929
アプロダにあるKoukoku Eraserっつうのに入ってるフィルタで消えるよ
[Patterns]
Name = "Yahoo AD Killer"
Active = TRUE
URL = "(^serch|blogs)[^/]++.yahoo.co.jp/"
Limit = 5000
Match = "$NEST(<!-- (-|) (Ad(Space|\ [^>]++ (^(^(-|)-->)))\1|YBB( module|_UnderBanner)|// AD\([a-z/]+\)|SPECIAL CONTENTS MODULE START)"
",<!-- (-|) (/(Ad$TST(\1)|YBB( module|_UnderBanner)) [a-z]+|(//|) /AD\([a-z/]+\)|SPECIAL CONTENTS MODULE END) (-|)-->)|"
"$NEST(<div align=$AV(center)>,</div>)"
"( <img src="URLリンク([^.]+.yimg.jp) width=1 height=6 border=0><br>|(^(^<script language=javascript> if\(window.yzq_d==null\))))|"
"<table\s[^>]+> <tr(\s[^>]+|)><td\s[^>]+>(<[^>]+>|)"
"<b>([%C3][%ED][%CC][%DC][%A4][%CE][%BE][%F0][%CA][%F3]|(\ |)PR)</b>($INEST(<table,</table>)|*)</table>|"
"(\[PR\] |)$NEST(<a\s[^>]++href=$AV(URLリンク(ard.yahoo.co.jp)(M|SIG)=*),</a>)|"
"$NEST(<script,*://ard.yahoo.co.jp/M=*,</script>)|"
"<img\s[^>]++src=$AV(URLリンク(ai.yimg.jp))*>"
931:名無しさん@お腹いっぱい。
06/11/07 21:07:58 zk6RxHlg0
忍者ツールズが最近サーバを増やしたらしく、チェックから漏れまくり。
<!--shinobi
でマッチさせると、(あえて?)コメント入れてない所があったりするし
サーバ名でマッチさせると、数が多くてちと記述が長くなる
なんかいい方法無いもんかな。
932:think ◆MM0nnAOCiQ
06/11/07 21:10:42 QfZmH8E30
>>931
マッチしづらいURLを幾つか挙げていただければ、見てみます。
933:名無しさん@お腹いっぱい。
06/11/07 23:25:18 //YtqP3v0
>>931
忍者ツールズは170種類のセカンドレベルドメインを所有してる。
URLリンク(www.shinobi.jp)
このページのドメイン一覧を見てブロックリスト作ればだいぶマシになると思うよ。
全部網羅してるわけじゃないみたいだけどね。
たとえばninja-systems.comはこの一覧には載ってない。
934:名無しさん@お腹いっぱい。
06/11/08 00:49:38 1qPMa+PR0
>>932-933
今んところアク解等で利用されたのはこんだけ
(ninja-systems|hattori|shinobi|gokenin|tsuchigumo|tuzikaze|hatagashira)
tsuchigumo以降は、つい最近ブラウザ上部で手裏剣が回っていたので気が付いて追加した。
これは外部ファイルでも使ったほうが綺麗に書けるのかな。
935:名無しさん@お腹いっぱい。
06/11/08 01:31:49 aLwjqkcq0
hanamizake
936:think ◆MM0nnAOCiQ
06/11/08 20:48:55 yZYXSmjO0
>>934
> (ninja-systems|hattori|shinobi|gokenin|tsuchigumo|tuzikaze|hatagashira)
これはURLの一部なんでしょうか?
おそらく幾つかのマッチ方法があると思われるので、実際に広告が置かれているWebページのURLを紹介していただけると有り難いです。
どんな広告が挿入されるか実際に見てみるのと判りやすいので…。
例えば、以下のURLの場合は
URLリンク(www.ninja-systems.com)
URLリンク(faccia0soldi.hanamizake.com)
<!--shinobi1-->〜<!--shinobi2--> の範囲に広告があるので、URLを意識せずともコメントにマッチさせれば広告を除去できます。
これで取り逃がした分をURLでマッチさせるのがスマートかなと思っています。
937:think ◆MM0nnAOCiQ
06/11/08 20:50:37 yZYXSmjO0
以下、私が shinobi の広告を除去している方法です。
コメントは "Kill nest ad [2006/03/27]" より、
# shinobi
shinobi(ct|ctrl|)\21$SET(Nest1=shinobi\22)
URLは "Kill href/src ad [2006/06/04]" より、
# shinobi
x0.shinobi.jp/
x1.shinobi.jp/
x2.shinobi.jp/
x3.shinobi.jp/
x4.shinobi.jp/
x5.shinobi.jp/
x6.shinobi.jp/
x7.shinobi.jp/
x8.shinobi.jp/
x9.shinobi.jp/
nad2a.shinobi.jp/
shinobi.jp/
938:名無しさん@お腹いっぱい。
06/11/08 23:25:54 a+JIC0sP0
やわらか戦車おもすれ〜
939:名無しさん@お腹いっぱい。
06/11/09 04:59:38 9d1Hg5u/0
ちょいとみなさん。
googleで検索するときって""やら|やらsite:やらを駆使すると思うんですが、
手でこれを打つのも面倒だしフォームがごちゃごちゃになって見辛いですよね。
そこでproxomitronをつかって独自拡張してみようと思うのですが何か良いアイディアはありませんか?
ベースとしては独自拡張した手法でフォームから送信するとproxoimitronがそれをキャッチして
googleの認識できる形に整形してリダイレクトして、
検索フォームに表示する文字列はグローバル変数で保存しておいたものを表示するという感じです。
例えばよくあるのは"hogehoge"|"hoge hoge"|"hoge-hoge"のように表記ユレに対応するやり方ですね。
これはとてもよく使うのですがやたらに幅を取る場合があるのでどうにかして短くしてしまいたい。
また、site:google.comもs:google.comのほうが少しだけ短くてお得感があります。
他にも色々とあるかと思うので是非みなさんのアイディアを参考にさせて頂きたく書き込みます。
940:名無しさん@お腹いっぱい。
06/11/09 05:15:47 dCfrqCLd0
>939
おもしろそう。
site: は実現可能かもしれないけど、""は難しいんでないのかな。
個人的には site: の検索がもう少し楽になればそれで満足かな。
site:URL の形式で入力しても検索結果がゼロになることがよくあって、
正しく入力したのか不安になることがよくある。
ただ、自分は Firefox の検索バーをよく使っているから、
仮にフィルタが完成したとしても、
フィルタが有効になるページに一度移動しなければならない。
それを面倒だと感じないほど便利なフィルタでなければ意味がないかもしれない。
941:名無しさん@お腹いっぱい。
06/11/09 15:53:32 XnVq1cu90
- - - - - - - - - - - - - INCS.txt - - - - - - - - - - - -
# NoAddURL
([0-9]++)\7
([0-8])\9
(^[0-9])
$TST(\9=$LST(INC))
|
9(^[0-9])$SET(7=)$SET(vinc=10)
|
([0-9]++)\7
([0-9])\9
(9+{1,*})\8
(^[0-9])
$TST(\9=$LST(INC))
$TST(\8=(9$SET(vinc=$GET(vinc)0))+)
&
$SET(vinc=\7$GET(vinc))
- - - - - - - - - - - - - INCS.txt - - - - - - - - - - - -
- - - - - - - - - - - - - INC.txt - - - - - - - - - - - -
# NoAddURL
0$SET(vinc=1)
1$SET(vinc=2)
2$SET(vinc=3)
3$SET(vinc=4)
4$SET(vinc=5)
5$SET(vinc=6)
6$SET(vinc=7)
7$SET(vinc=8)
8$SET(vinc=9)
9$SET(vinc=10)
- - - - - - - - - - - - - INC.txt - - - - - - - - - - - -
942:名無しさん@お腹いっぱい。
06/11/09 16:19:04 XnVq1cu90
テスト用フィルター。 テストウインドウに "数字_数字_数字" という書式でテキストを書いてテスト。 例、 10_19_9
[Patterns]
Name = "INCS"
Active = TRUE
Limit = 256
Match = "$LST(INCS)$SET(A=$GET(vinc))_"
"$LST(INCS)$SET(B=$GET(vinc))_"
"$LST(INCS)$SET(C=$GET(vinc))"
Replace = "<--[$GET(A)] [$GET(B)] [$GET(C)]-->"
vinc … 変数を表すv + inc、グローバル変数。
INCリスト … 1桁の数字を+1する場合に使用。 結果はvincに代入される。
INCSリスト … 1桁以上の数字を+1する場合に使用。 結果はvincに代入される。 内部でINCリストを使う。
vincに代入された値を取り出すときは基本的に上のフィルターのように別のグローバル変数を用意して代入する。
1マッチで1回しか+1処理をしないフィルターの場合はローカル変数への代入も可。
943:名無しさん@お腹いっぱい。
06/11/09 16:52:26 XnVq1cu90
1つ書き忘れた。
INCSリストを使うと \7、\8、\9 は使えなくなるので \0〜\6 を使ってフィルターを書くこと。
944:名無しさん@お腹いっぱい。
06/11/09 21:26:01 XnVq1cu90
INCSリストは3行に分けるべきだけど開発用のため1行のままにしてます、念のため。
945:think ◆MM0nnAOCiQ
06/11/09 21:55:17 sbCt8m4S0
>>939
個人的には現状で満足してますが、アイデアとしては面白そうですね。
> 検索フォームに表示する文字列はグローバル変数で保存しておいたものを表示するという感じです。
いやいやいや。せっかくですが、それでは期待通りに動作しません…。
Googleは検索フォームの文字を見てるのではなくて、URLで渡された文字を見てるんです。
何より、Proxomitronでフォームの文字を置換したとしても、それはブラウザの見た目上、内容が書き換えられただけで検索結果に影響はありません。
> ベースとしては独自拡張した手法でフォームから送信するとproxoimitronがそれをキャッチして
んーと、少し考えただけなので穴があるかもしれませんが。
私なら、URLをチェックして加工してしまいます。
加工したい文字をパーセントエンコードし、条件に符合する場合にだけ加工後のURLにリダイレクトさせる…と。
問題点として、ie=shift_jis への対応が難しいことが挙げられます。
Shift_JISは漢字とASCII文字のコードがバッティングするため、s にマッチさせるつもりで漢字にマッチしてしまうことも考えられます。
ie=shift_jis に対応させるか否かが一つの鍵になると思います。
文字コードについて
URLリンク(ash.jp)
でも、自分専用にするなら、ie=utf8 を挿入して、仮のクエリ(&p_extension=on とか)を付けるだけで良いかもしれません。
それがユニークなクエリなら、自分専用の検索とわかりますし、検索バーからも使えるため、汎用性も高いと思います。
946:think ◆MM0nnAOCiQ
06/11/09 21:56:34 sbCt8m4S0
> 例えばよくあるのは"hogehoge"|"hoge hoge"|"hoge-hoge"のように表記ユレに対応するやり方ですね。
これは検索語を hoge:hoge とするだけで全てに対応できる気がします。
Googleでは、"hoge hoge" と "hoge-hoge" は同一として解釈されます。
Googleは一部の記号文字を解釈せず、空白と同じとして扱うためです。
ですので、":", "%", "@" は全て「空白と同じ」です。
更に、「空白がない場合」も考慮します。
# 例外的に、ハイフンは "-" として扱われる場合があります。
# CD-R はちゃんと単語として解釈されますが、"Windows-Media-Player" のハイフンは空白と同一です。
これは "Google: High Light" の備考にも書いたテクニックですが、Windows:XPで「WindowsXP」と「Windows XP」の両方に対応して検索できます。
先ほどの記号文字を解釈しない事を利用したテクニックです。
Google検索: Windows:XP
URLリンク(www.google.co.jp)
947:名無しさん@お腹いっぱい。
06/11/10 20:23:27 6TNHIzJl0
youtubeのファイル直リンクのアドレス作成方法が変わってるね。
だれか修正ぷりーず。
948:名無しさん@お腹いっぱい。
06/11/10 20:34:55 ewoqr5K40
>>947 普通に保存出来た。
949:名無しさん@お腹いっぱい。
06/11/10 21:45:42 fTuWWJDL0
普通に保存できるな
950:名無しさん@お腹いっぱい。
06/11/10 21:53:43 4jcy+3Ai0
普通にはできないか
951:名無しさん@お腹いっぱい。
06/11/10 21:59:26 YYErhcXR0
普通に保存できる
952:think ◆MM0nnAOCiQ
06/11/10 22:46:37 x7d7RZv/0
長らく放置していたインクリメント,デクリメントのフィルタが完成しました。
$LSTを使ったモジュール化も終わり、相対URLを絶対URLにするフィルタ("Kill without <a>")との組み合わせも正常動作しています。
説明が非常に長くなるので、興味のある方は私のサイトからDLして下さい。
URLリンク(vird2002.s8.xrea.com)
>>941-944
フィルタ作成お疲れ様です。
インクリメントは反響の大きな課題でしたね。
拝見しましたが、>941氏のフィルタと私のフィルタのアルゴリズムは大きく違うようです。
発展すれば別の形として完成しそうですね。
>>947
いつ頃と比べたのか判りませんけど、私が見た頃と比べれば変わってないみたいです。
URLリンク(www.youtube.com)
というURLで行けます。
私のサイトにあるフィルタ("YouTube: add download link")は一応有効です。
確か、Noriyaさん(パソコン遊戯)も同じようなフィルタを作っていたと思います。
953:名無しさん@お腹いっぱい。
06/11/10 23:22:43 6TNHIzJl0
うそーん。
ちなみにここね。
URLリンク(www.youtube.com)
[Patterns]
Name = "YouTube Add Download Link [060505]"
Active = TRUE
URL = "$TYPE(htm)(www.|)youtube.com/watch\?(|*\&)v="
Bounds = "$NEST(<script,</script>)"
Limit = 512
Match = "(*new\sSWFObject\(\"/player[0-9]+.swf\?(video_id=[^"]+)\0\"*)\1($KEYCHK(Y)"
"$SET(2=<meta http-equiv="Refresh" content="0;URL=URLリンク(youtube.com))|$SET(2=\1))"
Replace = "\2\n<div style="font-size: 20px; font-weight: bold; text-align: center;padding-bottom: 10px;">\n"
"<a href="URLリンク(youtube.com) Download ]]]</a>\n</div>\n$STOP()"
で、DLツールで出力したアドレスはこれ。
URLリンク(v21.youtube.com)
他のフィルタが悪さしてるのかなぁ。
954:think ◆MM0nnAOCiQ
06/11/10 23:45:57 x7d7RZv/0
>>953
大きなファイルですねぇ。
WebブラウザでDLを試行すると、なかなかダウンロードダイアログが出てこないので、Proxomitronで生成したURLをダウンローダに渡したらDL→再生できました。
紹介された「ダウンローダで抜き出したURL」からも何とかダウンローダでDLできました。
ただ単に「DLに時間がかかっているだけ」ということはありませんか?
955:名無しさん@お腹いっぱい。
06/11/11 00:08:53 czo44a500
>953
URLリンク(video.qooqle.jp)
YouTubeはあまり利用していないから、個人的にはここを使っている。
Video URLのところにURLを貼り付けるだけで目的のURIがでてくる。
これじゃだめ?
956:名無しさん@お腹いっぱい。
06/11/11 00:46:36 EzBmzQMj0
>>953
保存できたよ
957:941
06/11/11 00:48:45 6TJk6D750
>>952
乙カレちゃん。 あちきも今からDECを書くところです。
構想は仕上げてあるからあとはフィルターという形に具現化するだけの状態。
まだthink氏がうpされたものを拝見してはおりませぬが動作的には細かな所で
違う動作をするものになると思います。 あと本スレでは失礼しました。
958:941
06/11/11 01:21:55 6TJk6D750
一桁の数字を-1する時に使うリスト。
対象が 0 の場合は 0 のままとし、ログウインドウにエラーを表示する。
- - - - - - - - - - - - - DEC.txt - - - - - - - - - - - -
# NoAddURL
9$SET(vdec=8)
8$SET(vdec=7)
7$SET(vdec=6)
6$SET(vdec=5)
5$SET(vdec=4)
4$SET(vdec=3)
3$SET(vdec=2)
2$SET(vdec=1)
1$SET(vdec=0)
0$SET(vdec=0)$LOG(R[DEC LIST] Erorr : Under Zero)
- - - - - - - - - - - - - DEC.txt - - - - - - - - - - - -
959:941
06/11/11 01:29:21 6TJk6D750
1桁以上の数字を-1するときに使うリスト。
上のリストに同じく 0 は 0 のまま返し、ログウインドウにエラーを表示。
- - - - - - - - - - - - - DECS.txt - - - - - - - - - - - -
# NoAddURL
([0-9]++)\7
([1-9])\9
(^[0-9])
$TST(\9=$LST(DEC))
|
0(0+)\7(^[0-9])
$SET(vdec=0)
$LOG(R[DEC LIST] Erorr : Under Zero)
|
([0-9]++)\7
([1-9])\9
(0+{1,*})\8
(^[0-9])
$TST(\9=$LST(DEC))
$TST(\8=(0$SET(vdec=$GET(vdec)9))+)
&
$SET(vdec=\7$GET(vdec))
- - - - - - - - - - - - - DECS.txt - - - - - - - - - - - -
010 を -1 すると 09 にはならず 009 となる。( 十の位の 0 がそのまま残る )
10 は 09 となるので 9 のみを取り出したい場合は 0 を取り除く処理を自前で用意する必要がある。
グローバル変数 vdec は vinc と同じ名前にしても競合しないので1つにまとめる予定。
960:941
06/11/11 01:37:07 6TJk6D750
INCSとDECSの2つを使えば 0 をまたいだ+-処理も簡単に出来る。
8進数や16進数への対応もリストの少しの書き換えで出来るので色を変えるフィルターなどに応用出来る。
そこらへんは必要性を感じた人が作ればいいと思うので自分はここまでとする。
961:941
06/11/11 01:40:14 6TJk6D750
テスト用フィルター。 テストウインドウに "数字_数字_数字" という書式でテキストを書いてテスト。 例、 10_010_0
[Patterns]
Name = "DECS"
Active = TRUE
Limit = 256
Match = "$LST(DECS)$SET(A=$GET(vdec))_"
"$LST(DECS)$SET(B=$GET(vdec))_"
"$LST(DECS)$SET(C=$GET(vdec))"
Replace = "<--[$GET(A)] [$GET(B)] [$GET(C)]-->"
962:名無しさん@お腹いっぱい。
06/11/11 09:42:37 gxa2hPZC0
>>953
ワシはこうしてる。
[Patterns]
Name = "YouTube Dounload by VideoDownloader"
Active = TRUE
URL = "www.youtube.com/"
Limit = 256
Match = "</table> "
"</form> "
"</div> "
"<!-- end vidFacetsDiv -->"
Replace = "$STOP()"
"<tr><td class="label">File</td>\r\n"
"<td class="tags"><span id="vidTagsBegin"><a href="URLリンク(videodownloader.net)(\u)" target="_blank">VideoDownloader</a></span></td>\r\n"
"</table>\r\n"
"</form>\r\n"
"</div>\r\n"
"<!-- end vidFacetsDiv -->\r\n"
VideoDownloader(URLリンク(javimoya.com))へのリンクを作るフィルタ。
ワンクッション入るけど、保存とかあんまりしないからこれで十分。
963:名無しさん@お腹いっぱい。
06/11/11 13:21:00 6TJk6D750
>>953
youtubeは動画ページを開いてから時間が経つと動画をダウンロード出来なくする規制を入れてたはず。
一旦リロードしてからダウンロードリンクをクリックすればまたダウンロード出来るようになるはず。
今でもこの規制がそのままなのかは確認していない。
964:名無しさん@お腹いっぱい。
06/11/11 14:23:43 Zpwvpacy0
地図サイトのマピオンで例えば下のURLを表示すると
上にフラッシュの大きな広告が出ますが、これを消す方法を教えてください
よろしくお願いします
URLリンク(www.mapion.co.jp)
965:名無しさん@お腹いっぱい。
06/11/11 14:35:39 JWM0LDoz0
そろそろスレも終わりですが
スレに出ているものの中で
とりあえず初心者が入れておくといいというものはどれでしょうか?
余計な公告やウインドウが出なくなるもので無難なものを教えてください。
966:名無しさん@お腹いっぱい。
06/11/11 14:43:32 fTDnRBe30
このソフトほど人任せできないものはない
967:名無しさん@お腹いっぱい。
06/11/11 14:44:36 gFztkiap0
>>965
よさそうな物を入れときなさい。
968:名無しさん@お腹いっぱい。
06/11/11 14:46:22 6TJk6D750
>>964
ADLISTに www.mapion.co.jp/js/ad_ を追加。
>>965
mixiの広告が全部消えるフィルターとかは?
969:名無しさん@お腹いっぱい。
06/11/11 15:13:26 Zpwvpacy0
>>968
お返事ありがとうございます
さっそくListsのフォルダにAdList.txtを作って
www.mapion.co.jp/js/ad_
とだけ記入してみたのですが何も変わらずでした
Naoko 4.5 "June" に>>1の誤爆回避日本語化+RWIN32768回避を上書きして
設定はインスコから全く触っていないデフォの状態です
なにかこちらが根本的に勘違いをしてるのでしょうが、ご指摘いただけたらと思います
970:名無しさん@お腹いっぱい。
06/11/11 15:25:16 gFztkiap0
>>969
ブロックファイルの編集→ADListがあるじゃんか。
971:名無しさん@お腹いっぱい。
06/11/11 15:32:16 Zpwvpacy0
>>970
ああっ、出来ました
そこから設定出来るんですね、何も知らずにお恥ずかしいかぎりです
ありがとうございました!
972:名無しさん@お腹いっぱい。
06/11/11 16:22:32 bpU+zWWr0
URLリンク(music.yahoo.co.jp)
の歌詞表示がグレーになってクリックできないのですが
どのフィルターが引っかかってるのでしょうか?
ログウインドのMatchを貼れば教えてもらえるでしょうか?
973:名無しさん@お腹いっぱい。
06/11/11 19:59:42 Xp1rNJD10
>>972
IE使ってないとか言うオチでは無かろうな?
万が一それならユーザーエージェント書き換えで行ける。
974:think ◆MM0nnAOCiQ
06/11/12 00:22:29 n6YJfvU90
>>959
> 010 を -1 すると 09 にはならず 009 となる。( 十の位の 0 がそのまま残る )
綺麗な処理にしたいときには、ゼロサプレスにも気を遣いますね。
959氏の書き込みを見て、私のフィルタのデクリメントに致命的な不具合があることに気がつきました。(汗)
取り急ぎ、修正しました。
URLリンク(vird2002.s8.xrea.com)
975:972
06/11/12 09:49:57 pKw2ixkf0
>>973
おっしゃる通りでございます。
ありがとうございました。<m(__)m>
976:941
06/11/12 20:41:51 1F4773u60
自分もINC、DECリストをまとめてうpしました。
数字を +1、-1 するリスト群 : K-SAN
URLリンク(proxo.hp.infoseek.co.jp)
>>974
乙、うっかりはいくら注意してもあるから困りますね。
977:953
06/11/12 21:09:46 eYOhvuLO0
色々動作がおかしいフィルタが出始めてたので、これを機に一気にちぇっくしてみた。
レス遅れて申し訳ない。
結論はヘッダフィルタの方のが誤爆してたみたい。
つか、完全にそっちのこと失念してたよ・・・
と言う訳でチェックしてくれた方、手間かけさせてしまって申し訳ない。
これだけじゃなんなので、バグ報告。
>>922
"+'"http://'+unescape(proxvar)+'"}'"
を
"+'"'+unescape(proxvar)+'"}'"
にするべし。
ちなみに、このフィルタとttpをhttpにするフィルタも相性良くないので注意。
内の環境だと、イメージ検索の中央の検索結果部分だけが
すっぽり表示されなくなる場合があるみたい。
978:941
06/11/12 23:54:29 1F4773u60
説明テキストの +20 の例が未完成のままだったので後で修正します。
>>977
乙彼summer。
979:941
06/11/13 00:23:48 Vc2PoI1Z0
修正しました。
数字を +1、-1 するリスト群 : K-SAN
URLリンク(proxo.hp.infoseek.co.jp)
980:名無しさん@お腹いっぱい。
06/11/13 10:26:17 QEwcUTUw0
URLリンク(proxo.hp.infoseek.co.jp)
を使っているのですが 歌詞表示がUTF-8にならずに文字化けするのですが私だけでしょうか?
仕様が変わったのだったら 偉い人 修正お願いします。
981:941
06/11/13 15:58:43 Vc2PoI1Z0
う〜む、モジュール化という点でthink氏のリストに大きく劣っているようだ。
$TST型にすることは簡単出来るけど \7、 \8 が使えないままだし作るメリットが無い。
ユーザー視点から見ても同じ動作をするモジュールが複数あるとややこしい事態に
なりそうなのでthink氏のリストで一本化しようと思います。
アリゴリズム自体は初心者、中級者のみなさんにとってはとっつきやすさの点で
優れていると思うので何らかの形で残そうと思います。
>>980
これでどうかな?
[HTTP headers]
In = TRUE
Out = FALSE
Key = "Content-type: Yahoo! Music swf -> txt part2 (2006_11_13)"
URL = "music.yimg.jp/bin/sendlyricstext\?"
Replace = "text/html; charset=UTF-8"
歌詞ページ
URLリンク(music.yimg.jp)
982:名無しさん@お腹いっぱい。
06/11/13 16:01:40 Vc2PoI1Z0
×アリゴ ○アルゴ
983:名無しさん@お腹いっぱい。
06/11/13 16:54:11 QEwcUTUw0
>>981
ありがとうございます。
うまくいきました!!
984:名無しさん@お腹いっぱい。
06/11/13 16:59:06 oCAoIukD0
スレ立ててきます
985:名無しさん@お腹いっぱい。
06/11/13 17:05:27 QEwcUTUw0
>>981
しかし
URLリンク(music.yahoo.co.jp)
等が全てUTF-8になって文字化けするようになりました。
文字化けする所は Bypass List に入れたほうが簡単なのかなぁ?
もし 修正できるのなら宜しくお願いします。
986:名無しさん@お腹いっぱい。
06/11/13 17:07:03 oCAoIukD0
どうぞ
Proxomitron フィルター作成スレッド Part6
スレリンク(software板)
987:941
06/11/13 17:16:44 Vc2PoI1Z0
>>985
んん? >>981のフィルターではURL限定しているのでそんなことにはならないはずなんですが・・。
”ブラウザのエンコード設定が自動選択になっていない” ということはありませんか? 確認お願いします。
ちなみにこちらではフィルターを修正する前から文字化けは起きていませんでした。
>>986
乙。 HNがミスターサタン並にカックイイ..。
988:名無しさん@お腹いっぱい。
06/11/13 17:22:18 QEwcUTUw0
>>987
どうもunDonut使っているので 自動選択にならないのです。
設定を見直してみます。
お騒がせしました。
941さんありがとうございました。
989:941
06/11/13 17:31:32 Vc2PoI1Z0
>>988
なるほど、unDonutのエンコードはIEから設定しないと反映されない場合があるみたいですね。
確認どもでした。
990:941
06/11/13 17:45:04 Vc2PoI1Z0
埋め
think氏は先読みを使って直接リストにマッチさせたのか、なるほど。
この方法ならこちらのリストでも \7、\8 を使わないで書く事は出来そう。
アルゴリズムだけが違う同じ動作のリストが作れそうw (作りませんが)
991:think ◆MM0nnAOCiQ
06/11/13 18:03:01 w72sMec60
>>977
> ちなみに、このフィルタとttpをhttpにするフィルタも相性良くないので注意。
> 家の環境だと、イメージ検索の中央の検索結果部分だけがすっぽり表示されなくなる場合があるみたい。
不具合報告有り難うございます。「http Text to Link」の作者です。
恥ずかしい凡ミスでしたので、修正しておきました。m(_ _)m
# [2006/11/07] 以降のバグでした。
>>979
お疲れ様です。
後ほど、見てみますね。
>>988
検証していませんが、以下で直るかもしれません。
[IE5]日本語Webページが文字化けする場合(エンコードの推奨設定)
URLリンク(support.microsoft.com)
992:941
06/11/13 18:17:05 Vc2PoI1Z0
>>991
乙。
こちらがうpしたリストは使用例として提示したフィルターにも無駄な箇所が
複数見つかるなど、全体的にまだまだ改良の余地がありそうです。
ついでにunDonutのエンコードに関する話が載ってるページを貼っておきます。
URLリンク(y3kz.cocolog-nifty.com)
993:名無しさん@お腹いっぱい。
06/11/13 18:41:17 bSdezmVN0
>>976>>991
乙華麗!
994:名無しさん@お腹いっぱい。
06/11/13 21:17:13 ToF05dbI0
( ・∀・)
995:名無しさん@お腹いっぱい。
06/11/14 12:07:15 89JuPRle0
URLリンク(auctions.yahoo.co.jp)
のページが白紙になるのですが 何をうpすれば解決策を見つけてもらえるでしょうか?
ちなみに Bypass List.txt に "*.auctions.yahoo.co.jp/*" "auctions.yahoo.co.jp/*" を
追加しても白紙のままです。偉い人解決策を教えてください。
996:名無しさん@お腹いっぱい。
06/11/14 12:24:09 89JuPRle0
>>955です
何回も戻るをしたり進むをしたりすると 表示されたりされなかったりです。
もう私にはどうする事もできません。
宜しくお願いします。
997:名無しさん@お腹いっぱい。
06/11/14 12:24:51 89JuPRle0
>>955です ×
>>995です ○
998:名無しさん@お腹いっぱい。
06/11/14 12:32:23 o/zavw2M0
>>995
たぶんオミトロンのバグのせいじゃないかな。 オミトロンには、
> ブラウザから届いた接続要求を問答無用でカットしてしまう
というバグがあります。 このバグは毎回起きるものでなく何十回かに一度くらいの割合で起きます。
このせいでブラウザはサーバからWEBページをもらえず、真っ白のページが表示されるわけです。
今のところ、解決方法はブラウザをリロードしてもう一度接続要求を出す以外にありません。(^^;A)
999:名無しさん@お腹いっぱい。
06/11/14 12:58:49 89JuPRle0
>>998
マジですか!
この間まで普通に見れてたのに残念です。
ありがとうございます。
1000:名無しさん@お腹いっぱい。
06/11/14 13:00:34 9CNP2CSV0
千
1001:1001
Over 1000 Thread
このスレッドは1000を超えました。
もう書けないので、新しいスレッドを立ててくださいです。。。
最新レス表示スレッドの検索類似スレ一覧話題のニュースおまかせリスト▼オプションを表示暇つぶし2ch
5354日前に更新/373 KB
担当:undef