1 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/12/02(日) 03:02:52 ID:1l6Tk/UJ0] このスレは作成依頼されたフィルタを有志により作るスレッドPart8です Proxmine - Uploader wind.prohosting.com/proxmine/cgi-bin/uploader/ Proxomitron専用Uploader proxo.hp.infoseek.co.jp/cgi-bin/sn_uploader/upload.html Proxomitron等に関するWiki abc.s65.xrea.com/prox/wiki/ Thinking Archive(仮) vird2002.s8.xrea.com/ >>2-10 にいろいろと
267 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/14(月) 15:54:58 ID:B06MGZqq0] Yahooトップの運勢を常に100点にしてくれませんか? 80点とかうざいんですけど
268 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/14(月) 17:34:50 ID:HwazxBhv0] >>267 [Patterns] Name = "New HTML filter" Active = TRUE URL = "www.yahoo.co.jp/" Limit = 128 Match = "fortune.yahoo.co.jp/fortune/12astro/\0/aries.html ">[1-9][0-9]" Replace = "fortune.yahoo.co.jp/fortune/12astro/\0/aries.html ">100" [Patterns] Name = "New HTML filter" Active = TRUE URL = "fortune.yahoo.co.jp/fortune/12astro/" Limit = 128 Match = "<td valign=middle width="100%">*<b>[1-9][0-9]" Replace = "<td valign=middle width="100%"><b>100"
269 名前:think ◆MM0nnAOCiQ mailto:sage [2008/01/14(月) 18:32:44 ID:0IFeRB2c0] >>190 そのフィルタの作者です。 Yahooは内部構成がよく変わるので、他に作る方がいるなら対応したくない気持ちです。 # 以前から感じていたことですが、Yahooはコンテンツをブロックレベルで分割して、各ブロックを担当者が編集しているような印象を持っています。 # どこのサイトでも担当区分はあると思いますが、Yahooの場合はバラバラに作りすぎる嫌いがあるような気が。 # 年明けのリニューアルでは、tableで分割していたのをdivに変更しただけ。 # 必要ないところまで、divで括ってしまう体質は何も変わっていません。 そういう事情から、Yahooは前方互換性のあるフィルタが書きづらく、また、私自身がYahooを(検索以外で)利用していないので、対応意欲が沸かないのです…。 ごめんなさい。 >>268 お疲れ様です。 ほぼ問題ないですが、一つだけ。 100点が1000点になってしまいますね。 以下、0-99点の範囲でマッチさせてみました。 [Patterns] Name = "Yahoo: Have a nice day! [2008/01/14] test3" Active = TRUE URL = "www.yahoo.co.jp/" Limit = 128 Match = "(<a\s[^>]++href=$AV(r/pbox/fortune/today/\*-*)[^>]+>)\0[#0:99]+(^[0-9])$STOP()" Replace = "\0100"
270 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/14(月) 19:18:05 ID:feNC2fKh0] わざと1000点にしたんじゃね?
271 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/14(月) 19:59:44 ID:Bd66QwLH0] んなわけないか
272 名前:267 mailto:sage [2008/01/15(火) 00:40:13 ID:gxNfkb360] >>268-269 ありがとー 100点でも1000点でもいいや。 占いは信じないだけに目障りだったんだよね。 これからは信じてみるよ。 Have a nice day!!
273 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/15(火) 01:11:56 ID:YUvJTZOQ0] ウィッキーさんかよ
274 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/15(火) 14:12:26 ID:BYphEyLt0] >>269 添削ありがとです。勉強になります。
275 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/15(火) 19:51:00 ID:9nSpFClr0] yourfilehostの広告消すフィルターありませんかね?
276 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/16(水) 11:05:58 ID:ECOr6i1q0] アメブロで画像が×になって表示されないってのが自己解決したので一応報告。 結論から言うとCounter Killerが「stat」って部分に誤爆していた。 ググっても情報がまったくないから、不思議に思ってたんだけど、 Counter Killerって作者非推奨なんだね。納得。
277 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/16(水) 11:46:36 ID:KsInFmXG0] デフォのフィルタは精度低いよ。 最後に更新されたのが2003年だしね。
278 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/16(水) 18:55:47 ID:DmId6mA30] >>124 に含まれている「Location: title.ext」と「URL: title.ext」について悩んでます。 任意のファイル名でファイルをDLするためには、 fake.domain/filename.ext?http://true.domain/true?fileuri ファイル名指定用偽URI ←||→ 本物のURI といった形式のリンクを作成しておき、 1. URL:(out)で $RDIR(true.domain/true?fileuri ) とする。 2. GETで要求したURLとRESPで返されるLocationが一致しない場合は Location:(in)を用いて再度ブラウザを騙す。 という手順を踏めば、「filename.ext」として保存できる。 …というところまで理解できました。ただ、 ・なぜ「URL: title.ext (both)」なのか?(outだけで動作しているように見える) ・同じ方式を用いても何故ニコニコでは403を返され失敗するのか? が、どうにもわかりません…。 どなたかお手隙でしたら、よろしくお願いします。
279 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/16(水) 19:35:25 ID:lmxw6vR10] >>275 デフォルトのBanner Blaster (full text)をオンにして keyword list.txt(Adkeys)の# Basic Adv keyword regexpに */ads/* Killfile.txt(Adlist)に (click|affiliate).dtiserv.com/ www.mmaaxx.com/index*.html\?affid\= adtology.com/yourfilehost/120x600nsfw.htm www.juicybucks.com/promo/cw/cwbanner*.gif banners.virtuagirlhd.com/customdata/banner/*.gif というのはどうでしょう
280 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/16(水) 19:44:13 ID:KsInFmXG0] >>278 outだけで動くのならoutでいいのでは。 Wikiを編集してる方の中にはoutで良いはずのフィルタをbothで書く人がいます。 これはProxomitronのメインウインドウにある送信するヘッダフィルタ・受信するヘッダフィルタのどちらかの チェックが外れていた場合でもフィルタが動作するようにとの意図があるようです。 メインウインドウで両方ともチェックを入れるように注意書きをした上でフィルタをoutにしたほうが 無駄な処理をせすに済むので私はこちらを推奨します。
281 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/16(水) 21:24:30 ID:UseXhF6v0] その注意書きは一々突っ込んでくる人が板から書いたまでだよ
282 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/18(金) 10:32:43 ID:hqOBtbHg0] aoix.hp.infoseek.co.jp/proxomitron.html ↑みたいなページの上下に出るinfoseek広告のニュース部分を完全に削除するフィルターをくださいませ 上が消えても下が残っていたりして、完全なものがありません よろしくお願いします。
283 名前:282 mailto:sage [2008/01/18(金) 10:48:31 ID:hqOBtbHg0] aoix.hp.infoseek.co.jp/proxomitron.html これは何とか消えたけど 今度は↓が消えない proxomitron.at.infoseek.co.jp/ よろしくお願いします。
284 名前:278 mailto:sage [2008/01/18(金) 11:28:21 ID:euBuZYRl0] >>280-281 すみません、質問したのにチェックすっかり忘れてました。 outだけでいいんですね…。俺の6時間はなんだtt
285 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/18(金) 12:56:43 ID:GVsf4n1k0] >>283 消せたフィルタと消せないフィルタを貼れ
286 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/18(金) 13:16:16 ID:hqOBtbHg0] >>285 [Patterns] Name = "infoseek.co.jp ad killer" Active = TRUE URL = "*.infoseek.co.jp/" Limit = 3000 Match = "(<body*>|</html >)\0 <!-- isweb auto-insert * --> $NEST(<div *>,</div >)" aoix.hp.infoseek.co.jp/proxomitron.html は消えました。 [Patterns] Name = "infoseek.co.jp ad killer" Active = TRUE URL = "[^/]++.(hp|at|image).infoseek.co.jp/ $TYPE(htm|gif)" Limit = 2000 Match = "(<body*>|</html >)\0 <!-- isweb auto-insert * --> $NEST(<div *>,</div >)" Replace = "\0<!-- proxomitron -->" これで 他のはある程度消えました。 でも proxomitron.at.infoseek.co.jp/ は消えません。 正規表現がわからないので 上に書き込みしてあるのを 前からあるのに合体させました。 まるで くれくれ君or教えて君ですが よろしくお願いします。
287 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/18(金) 13:29:38 ID:mdG5P+TQ0] Limit = 40 Match = "<!-- isweb auto-insert[^>]+> <div" Replace = "<div style="display:none""
288 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/18(金) 13:37:19 ID:cSwyp85d0] >>286 (<body*>|</html >)\0 を省けばいいだけ。 でも省いたらどんな弊害があるのか自分にはわからない
289 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/18(金) 13:49:28 ID:hqOBtbHg0] >>288 ありがとうございます。 きれいに消えました。
290 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/18(金) 16:15:59 ID:qgI0VR6h0] ニコニコスレではoutで書くべきフィルタをinにしてた人がいたなぁ。 複数の人にoutにするべきと指摘受けてたけどよく分からないという理由でそのままだった。 ヘッダフィルタで "URL:" に対してbothにしてるフィルタはほぼ間違いなくoutでも動く。 今見直してみたら自分のとこにも3つbothのフィルタが入ってたw
291 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/18(金) 18:34:24 ID:yMJnulz80] $TYPE(htm|gif) こんなのない
292 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/18(金) 20:24:20 ID:ejvv202N0] >>290 あれはどこかで配布されてる設定済みオミトロンがinのみ有効になってたから
293 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/19(土) 00:03:08 ID:Clz1wC9K0] >>292 目的と手段が逆になってますな。
294 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/19(土) 05:36:22 ID:4h2S9Hy10] 質問です 以前ここで作られたような覚えがあったんでこっちにきました 今使ってるのはthink氏のフィルター群からです Google: High Light で # Google: High Light 1 <br>\r\n--- debug ---<br>\r\n 略 をリプレイス用のリストに入れるとワードがいくつでも一つ目がハイライトされずボールドのままになります 8つ以上のワードを入れるとずっしり重く デバッグ用とありますし、いれなければまったく問題ないんですが なぜこうなるのか(特に前者が)気になります というか、このデバッグはどのようにみるのか お手すきでしたらご教授ください
295 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/19(土) 10:04:45 ID:Cvlm7iiO0] >>294 blogs.wankuma.com/jeanne/archive/2005/11/24/19566.aspx www.tt.rim.or.jp/~rudyard/torii009.html
296 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/19(土) 13:13:10 ID:M9zZJCnz0] クレクレで申し訳ありませんが、mixiの右側に表示されている広告を消すフィルターってありませんか?
297 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/19(土) 15:00:16 ID:NGsfVWvx0] >>296 >>1
298 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/19(土) 16:03:45 ID:Clz1wC9K0] >>294 何故作者に直接聞かないの? 確かthink氏のサイトにはお手製のSQL仕様の掲示板があったはず。
299 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/19(土) 16:17:01 ID:zQ/jNX/K0] 出入りしてるんだから、ここで聞いてもいいんじゃね?
300 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/19(土) 16:40:11 ID:M9zZJCnz0] >>297 すでにあったとは。失礼いたしました。 ありがとうございました。
301 名前:think ◆MM0nnAOCiQ mailto:sage [2008/01/19(土) 22:07:40 ID:e7Fe5pVH0] >>294 「デバッグ用 (Match or Replace)」以下の記述は、テストウインドウで単体テストするときのために作りました。 Proxomitronで用意している「テスト」は複数のフィルタをまたいで働かないので、代替手段としての位置づけです。 両方のデバッグテキストをReplace欄に入れて、実際のWebページでテストするとおかしな動作になると思います。 デバッグするときには、以下の形でテストしてみてください。 ■「Google: High Light」でデバッグ処理を活用する 1. 「Google: High Light」で8つの検索ワードを認識させたい 2. 「Google: High Light 1」のデバッグテキストを使って、Key8のグローバル変数が正しく代入されていることを確認する 3. 「Google: High Light 2」のデバッグテキストを使って、8つの検索ワードがテストウインドウに入力されたHTMLソース上で正しくマッチすることを確認する 4. それぞれのデバッグテキストを外し、GoogleのWebページでテストする >>298 掲示板は閉鎖中なので、こちらに来たのだと思います…。 今もURL直打ちで行けますが、.htaccessの影響で文字化けしちゃってます) あの掲示板を作り始めたときには、ユーザー登録型の掲示板を想定していました。 が、登録型だと一部のコアなユーザーによる囲い込みができてしまい、Proxomitronユーザーが増える方向には向かないように思えて、 半登録型(登録ユーザーと未登録ユーザーが混在する形)の掲示板に作り替えようと当時は考えていました。 その後、いろいろと目移りして、現在は掲示板の開発はストップしています。 時間がないのは言い訳に過ぎませんが、やる気をある方向へ誘導させていくのは難しいとよく思います。
302 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/19(土) 22:22:40 ID:Whc/FDM70] mixiで役に立つフィルダなんかあります?
303 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/20(日) 00:55:55 ID:uUCDE/R50] 懐かしい選手だな
304 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/20(日) 01:16:42 ID:NXXYzna50] mixi自分用フィルタ。いろいろ消えます。たぶん必要なものまで消えます。 二つ目のフィルタは動画ページやミュージックページで一番上が残るので無理やり縮めてます。 初心者なのでひどい表現が多々あると思います。 [Patterns] Name = "mixi: AD all killer" Active = TRUE URL = "$TYPE(htm)[^/]++mixi.jp/" Limit = 8192 Match = "$NEST(<h1 id="pagetop" name="pagetop">,</h1>)" "| $NEST(<p class="(adBanner|beginnersContents)">,</p>)" "| $NEST(<div class="(adBanner|contents02|prContents)">,</div>)" "| $NEST(<div ,class="searchForm01 homeSearchBox">*,</div>)" "| $NEST(<div id="adBanner">,</div>)" "| $NEST(<div ,id="(keywordRanking|prSepecial)" class="bodySubSection">*,</div>)" "| $NEST(<ul class="footerNavigation*",</ul>)" [Patterns] Name = "mixi: header height Adjuster" Active = TRUE URL = "$TYPE(htm)[^/]++mixi.jp/" Limit = 16 Match = "<head>" "$STOP()" Replace = "<head>\n" "<style type="text/css">div#headerArea { height:48px;}</style>"
305 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/20(日) 03:05:37 ID:3mg1h36q0] >>304 自分もページ上部に隙間が出来てて気になってたけど 2つ目の入れたらキレイに縮まった GJ!!
306 名前:294 mailto:sage [2008/01/20(日) 05:43:14 ID:dVoPjjj00] 前にフィルタの元がここで作られてたの見てたのでなんとなくここに書いてしまいました。すみません >>301 デバッグテキストの使い方は大体わかりました このままで十分なので外して利用したいと思います > 一つ目がハイライトされず こっちがまだわからないのですが、もう少し考えてみます 丁寧な説明をありがとうございました >>295 気がついたものの突っ込みはないだろうと考えてたので余計恥ずかしい…
307 名前:think ◆MM0nnAOCiQ mailto:sage [2008/01/20(日) 13:49:48 ID:0es1eb2n0] >>306 > > 一つ目がハイライトされず > こっちがまだわからないのですが、もう少し考えてみます 実は、こちらの状況は私もわかってないので、問題ないと思われる方法を示唆する回答に留めました。 「両方のデバッグテキストをReplace欄に入れて」という状況ならおかしな動作になるだろう、という想像だったのですが、どうも違ったみたいですね。 ・「ハイライト」という表現を使うところをみると、Webページ上でテストしたのでしょうか?(テストウインドウ上ではなく) ・デバッグテキストは両方とも有効にしたのか? ・片方だけ有効にしたのなら、High Light1、High Light2のどちらにデバッグテキストを挿入したのか? など、状況がわかれば、私の方でも検証したいところです。 差し支えない範囲で、もう少し詳しく状況を教えていただけないでしょうか?
308 名前:think ◆MM0nnAOCiQ mailto:sage [2008/01/20(日) 13:58:19 ID:0es1eb2n0] > > 一つ目がハイライトされず 外しているかもしれませんが、「Google: High Light 1」のデバッグテキストのKey1で日本語を代入しているのなら、一つ目がハイライトされないかもしれません。 Proxomitronの置換表現に書いた日本語はShift_JISで出力されますが、Googleの文字コードはUTF-8がデフォルトなので、文字コードの不一致から起きる問題かも。 GoogleのURLに &oe=shift_jis を加えれば、Googleで出力される文字コードがShift_JISに変わりますが、 「Google: High Light」で「Shift_JIS, ISO-2022-JP のダメ文字問題」を解消できなくなります。 変数の代入させる方式のテストをするときには、日本語を使わない方がいいと思います。
309 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/20(日) 15:30:36 ID:vM3t6yeO0] >>301 >>306 閉鎖されてたのか、すまんかった。
310 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/21(月) 02:33:12 ID:EbwxmJWY0] こういうやり取りも情報だし悪くないな。 専用ブラウザだとログの検索も簡単だし。
311 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/21(月) 14:23:15 ID:nU9bYkTM0] jpeg画像内に"<?xml version="1.0" encoding="UTF-8"?>"で始まる記述が ツラツラと埋め込まれたものについて、この記述部分を無効にするフィルタは あるでしょうか?(古いブラウザなので、この種の画像を読み込むと不具合に)
312 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/21(月) 18:54:13 ID:wnreh1x+0] firefoxでは、 www.example.com/hoge\hoge\page1.html のような\マークでパスを指定しているURLが読めません。 hoge\hoge\page1.html を hoge/hoge/page1.htm lに変換する やり方を教えて下さい。よろしくお願いします。
313 名前:think ◆MM0nnAOCiQ mailto:sage [2008/01/21(月) 19:29:21 ID:MKKBMFJs0] >>311 差し支えない範囲で、古いブラウザの名称を開示できないでしょうか?(ブラウザがわかれば、検証できるかもしれません) 「Fix MIME type」でブラウザにファイル内容を jpg と判定させれば、xml宣言は無効化されると思います。 ただし、IEなら、[拡張子ではなく、内容によってファイルを開く] もOFFにする必要があります。 (多くの場合、このオプションを無効化しても問題ないです) Google検索: 拡張子ではなく、内容によってファイルを開く ttp://www.google.co.jp/search?lr=lang_ja&ie=utf-8&q=%E6%8B%A1%E5%BC%B5%E5%AD%90%E3%81%A7%E3%81%AF%E3%81%AA%E3%81%8F%E3%80%81%E5%86%85%E5%AE%B9%E3%81%AB%E3%82%88%E3%81%A3%E3%81%A6%E3%83%95%E3%82%A1%E3%82%A4%E3%83%AB%E3%82%92%E9%96%8B%E3%81%8F&client=
314 名前:think ◆MM0nnAOCiQ mailto:sage [2008/01/21(月) 19:47:08 ID:MKKBMFJs0] >>312 > hoge\hoge\page1.html を hoge/hoge/page1.htm lに変換する 変換自体は簡単で、下記フィルタでOKです。 [Patterns] Name = "Replace Link \ -> / [2008/01/21] test2" Active = TRUE URL = "$TYPE(htm)" Limit = 256 Match = "(<a\s[^>]++href=)\#$AVQ((("|)http(s|):/)\#(([^\\]+)\#\\$SET(#=/))+([^\\]+)\#)(^(^[ >]))" Replace = "\@" Firefoxでは、円記号はURLエスケープされた文字「%5C」に置き換わります。 URLエスケープされると、元々エスケープされていた文字なのか、区切り文字として宣言された円記号なのか、わからなくなってしまうため、タグに打ち込まれている文字から置換しました。
315 名前:think ◆MM0nnAOCiQ mailto:sage [2008/01/21(月) 19:48:37 ID:MKKBMFJs0] ところで、>314は多くの状況で問題ない動作なのでしょうか? Firefox v2.1.11 でもfileスキームでは、\(円記号) が / に変換されました。 これはWindowsのファイル名で \ が使えないことを踏まえれば、納得のいく動作です。 httpスキームの場合は、\ はURLエスケープする動作 (\ -> %5C) が正しいと思うので、「\ -> /」の変換を既定の動作にしてしまうと、 本来は正しく動作するページで誤動作を引き起こしてしまう可能性があるように思えます。 (その場合、IE未対応となるので、事実上あり得ないかもしれませんが) どちらかといえば、IEの動作が間違っていると思いますが、IEがデファクトスタンダードということを踏まえて、 多くのサイトがそういう仕様にしている現状がある、と想定するべきなんですかね? URLに円記号を使っているWebページは見たことがないので、差し支えなければ参考事例を掲示していただけると参考になります。 # 円記号に関しては、「http Text to Link」フィルタでも悩んだところです。 # 結局、参考例を全く見つけられなかったので、円記号をURLに使える文字という動作にはしませんでした。
316 名前:think ◆MM0nnAOCiQ mailto:sage [2008/01/21(月) 20:18:21 ID:MKKBMFJs0] >314のフィルタは、\ を含まないリンクにもマッチしていたので、\ を含むリンクのみにマッチするよう、修正しました。 (動作としては問題ありませんが、元と同じ文字列に置換するので、無意味でした) [Patterns] Name = "Replace Link \ -> / [2008/01/21] test3" Active = TRUE URL = "$TYPE(htm)" Limit = 256 Match = "(<a\s[^>]++href=)\#$AVQ((("|)http(s|):/)\#(([^\\]+)\#\\$SET(#=/))+{1,*}([^\\]+)\#)(^(^[ >]))" Replace = "\@"
317 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/21(月) 22:00:19 ID:7eaUqUdt0] ttp://www.ietf.org/rfc/rfc1738.txt URLに使用可能な文字を列挙したサイトを探しても見つからないから、 RFCを当たってみるしかないのかな。 httpurl = "http://" hostport [ "/" hpath [ "?" search ]] hpath = hsegment *[ "/" hsegment ] hsegment = *[ uchar | ";" | ":" | "@" | "&" | "=" ] uchar = unreserved | escape unreserved = alpha | digit | safe | extra alpha = lowalpha | hialpha lowalpha = "a" | "b" | "c" | "d" | "e" | "f" | "g" | "h" | "i" | "j" | "k" | "l" | "m" | "n" | "o" | "p" | "q" | "r" | "s" | "t" | "u" | "v" | "w" | "x" | "y" | "z" hialpha = "A" | "B" | "C" | "D" | "E" | "F" | "G" | "H" | "I" | "J" | "K" | "L" | "M" | "N" | "O" | "P" | "Q" | "R" | "S" | "T" | "U" | "V" | "W" | "X" | "Y" | "Z" digit = "0" | "1" | "2" | "3" | "4" | "5" | "6" | "7" | "8" | "9" safe = "$" | "-" | "_" | "." | "+" extra = "!" | "*" | "'" | "(" | ")" | "," hostportの部分を飛ばして、パスのところだけ抜き出してみた。 これの意味を正確に把握するだけの知識はないけど、 見る限りだと円記号をパスに使うことはできない。 IEがRFCを無視して余計な世話をしているだけかと。
318 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/21(月) 22:05:52 ID:7eaUqUdt0] escape = "%" hex hex hex = digit | "A" | "B" | "C" | "D" | "E" | "F" | "a" | "b" | "c" | "d" | "e" | "f" 抜けていたところを付け足し。
319 名前:312 mailto:sage [2008/01/21(月) 22:39:51 ID:wnreh1x+0] >>313-315 丁寧な説明ありがとうございました。 参考事例はこのサイトになります。 ttp://www.geocities.jp/ever_sakura/novel.html ここのいくつかのリンクが \ 表記になっています。 このサイトで作成していただいたフィルタを試してみたのですが、 動作していないみたいです。 ソースを見てみたら a href="novel\sakura\sakura04.html" のようなパス以下を記述する書き方をしていたので、 これがまずいのでしょうか? (hrefに http を含んだ記述で試してみたらうまくいきました)
320 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/21(月) 23:23:08 ID:7eaUqUdt0] thinl氏のは絶対URIのみ対象になるのかな。 >319 前にフィルタを書いていたので載せてみる。リンク先でテストもしてみたよ。 あまりテストしてないので、そのへんはご勘弁を。 URL = "$OHDR(User-Agent: *Gecko*)&$TYPE(htm)" Limit = 128 Match = "(background|href|src)\1=$AV((([^\\]+)\#(\\)$SET(\#=/))+{1,*}\#)" Replace = "\1="\@""
321 名前:think ◆MM0nnAOCiQ mailto:sage [2008/01/21(月) 23:34:52 ID:MKKBMFJs0] >>317-318 まとめ感謝です。 やはり、RFC的には円記号をパス (パス名コンポーネント分離符が正式名称かな) に使えないですよね。 そこまでは私も何となく(英語が苦手なので読み切れている自信がなかったw)把握していたのですが、ひょっとして私の知らないところでIEをデファクトスタンダードとして、円記号をパスに使う風潮があるのかな、と思ったのです。 XHTMLのソースでXML宣言を省くように、大多数がIE仕様に対応させようとしているなら、フィルタでもIEに合わせた方が問題が少ないと考えたのですが、それほど気にしなくていい些細な問題なのかもしれませんね…。 >>319 リンクは相対パスでしたか。 前述の通り、\ を置換するのに懸念が残っていたため、>316では置換対象をhttpスキームに限定していました。 ttp://www.geocities.jp/ever_sakura/ で動作するように、更新しました。 更新点 - 相対パスのリンクも置換するように - URLを www.geocities.jp/ever_sakura/ に限定した [Patterns] Name = "ever rest: Replace Link \ -> / [2008/01/21] test4" Active = TRUE URL = "$TYPE(htm)www.geocities.jp/ever_sakura/" Limit = 256 Match = "(<a\s[^>]++href=)\#$AVQ((("|)(http(s|)://|(^[0-9a-z]+:)))\#" "(([^\\]+)\#\\$SET(#=/))+{1,*}([^\\]+)\#" ")(^(^[ >]))" Replace = "\@" このフィルタは標準準拠ではない暫定措置のため、フィルタが有効になるURLを「ever rest」に限定しています。 今のところ、\をパスに使っているサイトは、>319で報告されたサイト一件しか見つけられていないので、 このフィルタの動作は例外的なものだと思ってください。
322 名前:think ◆MM0nnAOCiQ mailto:sage [2008/01/21(月) 23:37:28 ID:MKKBMFJs0] 重複してしまいました…。 >320氏のフィルタも書き方が違うだけで、同じ動作になると思います。 # 320氏のフィルタでは、backgroundにも対応されているみたいですね。
323 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/21(月) 23:42:57 ID:weL6DNMq0] >>319 すごいなこのサイト・・・IEで見たらリンク先が普通に表示されて挙動の気持ち悪さに噴いた。 IEで\がパスに勝手に変換されるのは、多分Winのパス記号が\だからだろう・・・多分。 ローカルで作成して動作確認したファイルをそのままうp→IEで問題なく動いてるから作者もそのまま放置、かな。 超例外的なサイトだと思う。
324 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/21(月) 23:51:25 ID:7eaUqUdt0] 名前typoで失礼しました。 パスの「/」が円記号になっているサイトはごくまれに見かける。 頻度はかなり少ない上に、ステータスバーを見れば円記号があることはわかるので、 $KEYCHKを好みで組み合わせて必要なときだけフィルタを有効化すればよいかなと。
325 名前:think ◆MM0nnAOCiQ mailto:sage [2008/01/21(月) 23:51:32 ID:MKKBMFJs0] これから書く内容はスレ違いだと思いますが、参考意見として一つ。 Webサイトの中に不適切な記述があってそれに気がついたときには、サイトの管理人に一報を入れると皆が幸せになれるのではないでしょうか。 そのサイトの管理人だけでなく、そのサイトに訪問する人すべてに感謝される行為だと思います。 (おまけに、フィルタを作る手間も省けます) 「ever rest」のメールフォームは小休止中とのことですが、日記をみると新旧2つのサイトを同時運営されているようです。 Googleでサイト名を検索してみると、旧サイトが引っかかり、そこからメールフォームをたどれます。 ttp://www10.ocn.ne.jp/~ever/access.html 今後、定常的に訪問されるようでしたら、管理人さんに不具合を報告する手も有りかなと私は思います。
326 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/21(月) 23:54:04 ID:DURa167t0] jsのスクリプト内でエスケープとしての\に誤爆しないか心配だな。
327 名前:think ◆MM0nnAOCiQ mailto:sage [2008/01/22(火) 00:08:38 ID:i5dK/6Tr0] あらら、また一歩違いです。 >>324 > 名前typoで失礼しました。 指摘されるまで気がつきませんでしたので、お気になさらず。 > パスの「/」が円記号になっているサイトはごくまれに見かける。 > 頻度はかなり少ない上に、ステータスバーを見れば円記号があることはわかるので、 > $KEYCHKを好みで組み合わせて必要なときだけフィルタを有効化すればよいかなと。 ごくまれに、ということなら「円記号の変換」を標準動作とする必要はなさそうですね。 $KEYCHKの方法を使わせていただきます。 以下、円記号(\)を入力したときだけ、「\ -> /」の置換を行います。 [Patterns] Name = "Replace Link \ -> / [2008/01/21] test5" Active = TRUE URL = "$TYPE(htm)$KEYCHK(^220)" Limit = 256 Match = "(<a\s[^>]++href=)\#$AVQ((("|)(http(s|)://|(^[0-9a-z]+:)))\#" "(([^\\]+)\#\\$SET(#=/))+{1,*}([^\\]+)\#" ")(^(^[ >]))" Replace = "\@"
328 名前:think ◆MM0nnAOCiQ mailto:sage [2008/01/22(火) 00:20:38 ID:i5dK/6Tr0] >>326 うーん…。 それに対応させるためには、script要素があったときに、グローバル変数でフラグを作るぐらいしかなさそうです。 [Patterns] Name = "Create flag script element [2008/01/22] test1" Active = TRUE URL = "$TYPE(htm)" Limit = 16 Match = "(^(^<(" "script[ >](^$TST(scriptFlg=1))$SET(scriptFlg=1)|" "/script>$TST(scriptFlg=1)$SET(scriptFlg=)" ")))" [Patterns] Name = "Replace Link \ -> / [2008/01/21] test6" Active = TRUE URL = "$TYPE(htm)$KEYCHK(^220)" Limit = 256 Match = "(<a\s[^>]++href=(^$TST(scriptFlg=1)))\#" "$AVQ((("|)(http(s|)://|(^[0-9a-z]+:)))\#" "(([^\\]+)\#\\$SET(#=/))+{1,*}([^\\]+)\#" ")(^(^[ >]))" Replace = "\@" 未テストですが、既存のフィルタを改変しただけなので期待通りに動作すると思います。
329 名前:312 mailto:sage [2008/01/22(火) 00:22:25 ID:na0xRl2c0] >>321 動作確認致しました。対応ありがとうございました! 検索してみたところ、URIに使用してはいけない文字は RFC2396に載っていました。 ttp://hp.vector.co.jp/authors/VA014833/rfc2396J.html unwise = "{" | "}" | "|" | "\" | "^" | "[" | "]" | "`" なのでfirefoxで表示しないのは正しい動作みたいです。 >>325 / が \ になっているサイトは >>324 さんと同様にたまに 遭遇する事がありました。 (そのサイトはブックマークしていないので紹介することが出来ませんが) 今後、同様のサイトを見つけたら管理人に連絡したいと思います。
330 名前:311 mailto:sage [2008/01/22(火) 12:43:37 ID:feVMxE290] >>313 ブラウザはIE5.5sp2です(Win98SE)。 「拡張子ではなく、内容によってファイルを開く」というオプションは 付いていません。 サンプルになるかどうかわかりませんが、たとえば ttp://www.flickr.com/photos/cdmilton/ のようなページで画像が表示されなくなります。 (左上の小さい画像(目のアップ)にxml〜の記述が入ってます) よろしくお願いします。
331 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/22(火) 12:47:24 ID:nXhrkmQ00] Opera使ったら? 98でも使えたと思う。
332 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/22(火) 13:37:45 ID:TawaGciU0] ttp://www.kanzaki.com/docs/sw/photo-rdf.html JPEG画像内にXML宣言なんて考えられないなと思って調べてみると、 どうやらそういうものがあるらしい。
333 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/22(火) 15:06:42 ID:CKsX5F7s0] >>330 win98SE+IE6で正常に表示されました。
334 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/22(火) 19:38:59 ID:TawaGciU0] >330の画像のソースを見ると、確かにXMLが埋め込まれている。 その中身がplistとかいうものらしい。 ttp://www.itmedia.co.jp/enterprise/articles/0705/30/news011.html IE5.5で>330を読み込んでみると、ページ内の画像はほとんど表示されなかった。 (接続中の状態がずっと続く) キャッシュを消してから、 XMLが埋め込まれた画像を直接表示させてみると問題ないこともある。 IE5.5は「拡張子ではなく、内容によってファイルを開く」をやっているから、 そういうサイトではIEを使わない方がよい。 >330の画像ではXMLの部分が8kバイトほどあるけど、 これを除くためだけにすべてのJPEGの中身をフィルタリングするというのはちょっと。 削れても別の問題が出るかもしれないし。
335 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/23(水) 14:54:04 ID:Fuw8M5+J0] Yahoo地図情報の右の広告部分は消せないでしょうか?
336 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/23(水) 16:54:28 ID:LgsLKUMl0] >>335 [Patterns] Name = "AdSpace" Active = TRUE URL = "$TYPE(htm)" Limit = 4096 Match = "<!--+\sadspace\s*-->*<!--*\s*AdSpace\s*-->" 自分の環境ではこれで消えてました。どうでしょう?
337 名前:330 mailto:sage [2008/01/23(水) 18:46:08 ID:vbM2T43K0] レス下さった方々、ありがとうございます。 とても古いPC環境なのでブラウザを最新にし辛く、5.5を使ってました。 あの種の画像はふいに遭遇して、そうなるとブラウザ再起動以外に 解消する手がありません。 今は試しにFirefoxを使ってますがかなりマシンへの負担が大きいです。 IE6やOpera等のブラウザを考えてみます。ありがとうございました。
338 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/23(水) 19:18:05 ID:chA6BZI60] そんなスペックのPCじゃやりたいこと全然出来ないんじゃ。 Dellで6万弱でいいPC買えますよ。 中古でなら3万とかで買えるものもあるけどスペックが低すぐるからおすすめ出来ない。
339 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/23(水) 19:21:26 ID:X++SDAyI0] 2000年製のPCをまだ使っているけど、 メモリを128MBから256MBに増やしたら快適になった。 アフォなMeは相変わらず落ちるが。 Firefoxでも問題ない。(起動するのが遅いのは仕様)
340 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/23(水) 19:54:06 ID:WOtaf+Zz0] 5から5.5にするくらいなら6にしろってどっかで聞いたような スレチすまん
341 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/24(木) 04:35:13 ID:B5WjuI+30] 数年前ならWin98やWin2kにIE6を入れるのはアホみたいな流れだったんだが、 ここ最近はIE5.5だと不便さが目立ってきたのでIE6に乗り換えた方が良い様な流れだと思う。
342 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/24(木) 05:23:16 ID:mvazhL1s0] 最近はWebもどんどんリッチになってきてるから いい加減スペック面が厳しいんじゃないかとも思うが… まぁ、スレチっすね
343 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/24(木) 13:14:04 ID:OaLlSPj00] >>341 残念ながら2月には7に強制的にバージョンうpだったりして
344 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/24(木) 14:33:44 ID:isC+KWrY0] >>336 ありがとう うちの環境(XPsp2,IE6)では消えませんでした。
345 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/24(木) 15:09:38 ID:D7aIlwYo0] <!-- Adspace (\w)\0 -->*<!-- /Adspace $TST(\0) -->
346 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/24(木) 20:30:05 ID:isC+KWrY0] >>345 それでも消えないです^^; 有難うございました。
347 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/24(木) 21:07:46 ID:YML2LCEk0] 限定的な、テキストリンクの広告を消すフィルタを作りました。 Name = "kill AdText" Active = TRUE URL = "^(www.infoseek.co.jp/ )*" Limit = 512 Match = "(<a\ |<a\ \n)href="http://(www.infoseek.co.jp/redirect\?|ard.yahoo.co.jp/SIG)*>*</a>" Replace = "<font size=1 color=red>[AdText]</font>" www.infoseek.co.jp/ だけを除外したいけれど動きません。 どこを修正すればよいのですか?
348 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/24(木) 21:32:33 ID:h6UtmmTm0] 野暮な質問だが、www.infoseek.co.jpだけを対象外にする意味は?
349 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/24(木) 21:36:39 ID:mvazhL1s0] ^www.infoseek.co.jp/
350 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/24(木) 21:50:13 ID:YML2LCEk0] >>349 ありがとう! >>348 普段はインフォーシークニュースしか見ないけど、このページの検索ボックス下のテキスト広告が ニュースと紛らわしくて許せなかったら。 そうしたらインフォーシークTOPから読むものが半分以下になったので除外しようかと。 会員用のログインリンクまで消えてたから、そりゃもう悲惨なページだった。
351 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/24(木) 22:43:42 ID:h6UtmmTm0] infoseekのトップページのことでいいんだよね? ニュースを読むだけなら、 コメントにマッチさせて広告部分をまるごと消すとか、 スタイルシートを使うとかした方がもっと見やすくなるよ。
352 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/24(木) 23:26:56 ID:YML2LCEk0] >>351 いや、いつもはnews.www.infoseek.co.jp/?svx=100302&svp=SEEK を見ています。 TOPページは巡回してません。自分が忘れた時に困らないよう除外したかっただけです。 ちょっと変更してみました。今のところ自分の見るサイトには不都合無いようです。 Name = "kill AdText" Active = TRUE URL = "^www.infoseek.co.jp/" Limit = 512 Match = "$NEST(<a\s[^>]++href=$AV($LST (AdText)*),</a>)" Replace = "<font size=1 color=red>[AdT]</font>" AdText www.infoseek.co.jp/redirect\? ard.yahoo.co.jp/SIG rd.rakuten.co.jp/ www.amazon.co.jp/exec/obidos/ASIN/
353 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/24(木) 23:33:26 ID:B5WjuI+30] >>343 IE7はXPとVistaのみだからWin98とWin2kは関係ない。 つーか今どきWin98なんてサポートされるわけがない。
354 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/25(金) 12:47:18 ID:Wyp5CV4m0] クリアタイプで表示出来ないフォントを指定してるページを何とかしたいんですが、どうすればいいんでしょうか。
355 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/25(金) 12:58:27 ID:cSJUdrcl0] >>354 インターネットオプション→ユーザー補助→Webページで指定されたフォント以下略
356 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/25(金) 16:03:58 ID:Pm47PQ990] ias.rakuten.co.jp topics.news.www.infoseek.co.jp/isweb/news prox_wahahaさんフィルタのブロックリストに 上の二つ入れてもinfoseek系バナーとテキスト広告は消せるよん。
357 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/26(土) 04:40:15 ID:Fd2QGgVO0] YouTubeのダウンロードリンクの今のを誰か持ってないですか? 今まで使ってたのが使えないので・・・。 クレクレ君ですいません。
358 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/26(土) 05:21:37 ID:gb4Jzc8Y0] 仕様変更あったみたいだね。 作ってあげたいんだが、入試直前なので誰か頼んだ
359 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/26(土) 05:54:04 ID:hFcKjlhR0] >>357 >>1 のうpろだのYouTubeまとめを更新しました。 Wikiのほうはオリジナルの作者さんにおまかせ。 >>358 ガンバレ
360 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/26(土) 10:04:46 ID:gb4Jzc8Y0] >>359 おお、ありがとう。助かりました。 せっかくなので、俺愛用の改造版を置いてきます。 ttp://f.hatena.ne.jp/images/fotolife/F/Falky/20080126/20080126093933.png こんな感じで、DLリンクを画像に変更。見た目を気にする貴方に、是非。 …と思ったら長すぎて書き込めなかったので、こちらからどうぞ。 ttp://d.hatena.ne.jp/Falky/20080126/1201309179 べっ、別に宣伝じゃないんだからね?勘違いしないでよね!
361 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/26(土) 15:00:21 ID:qZ0REJ860] ツンデレwww
362 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/26(土) 15:36:30 ID:6BTybhyA0] >>355 わがままで申し訳ないんですが、それ系だと英字が困ってしまうんです。 あ、当方operaです。 向こうで指定してるフォントは、出来るだけその通りに表示してあげたいんですが MSゴシックとかは勘弁して欲しいんですよ
363 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/26(土) 15:50:51 ID:7mdBl3KC0] >>360 なるほど、そうやって画像を埋め込む方法があったのか 気が付かなかった
364 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/26(土) 15:55:30 ID:7mdBl3KC0] >>362 力業でやるなら 問題になってるフォント名を、問題にならないフォント名に置き換えればよいだけでは? ただ、日本語表記のフォント名の場合、文字コード分の複数パターンが必要になるけど
365 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/26(土) 16:33:23 ID:r4xRsF2i0] >>362 一応確認 自分のブラウザのフォント指定にはMSゴシックを指定してないけれど相手側が指定している場合だよね。 自分はfirefox使ってるのでMSゴシックとMS Pゴシックを指定してくるサイトだけ追加してスタイルシート書き換えてるけど @namespace url(www.w3.org/1999/xhtml ); @-moz-document domain("mainichi.jp"),domain("hochi.yomiuri.co.jp"),domain("sankei.jp.msn.com"),domain("itmedia.co.jp"), url-prefix("www2s.biglobe.ne.jp/~takao777/versionupinfo/ ") { body { font-family: "MeiryoKe_PGothic" !important; } } @-moz-document domain("wikiwiki.jp") { td,th { font-family: "MeiryoKe_PGothic" !important; } } operaにそういうスタイルシート書き換えるような機能あればそっちのほうが簡単だと思う。 オミトロンでやるならそのサイトがcssかhtmlでMSゴシックが記述されてるところのフォント指定を書き換える感じ?
366 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/26(土) 16:37:17 ID:wkOu/P/l0] vipvipblogblog.blog119.fc2.com/ ここの画面上部に出る4個のウィンドウがジャマなので消したいのですが、 <!--▼ プラグイン3ここから ▼--> から <!--/プラグイン3ここまで--> までを消去したい場合はどのようにマッチさせればいいのでしょうか? 全角文字が使われているのでそのまま当てはめようとすると文字化けして認識してくれません・・・ お手数ですがご教授願います。
367 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/26(土) 16:55:46 ID:r4xRsF2i0] >>366 プラグイン3の中はentry_blockというクラス属性なのでこれを消すというのはどうでしょう? (^(^<div class=$AV(entry_block)))$NEST(<div,</div>) 自分の環境ではソースは以下のようになりました。 <!--▼ プラグイン3ここから ▼--> (ここの中が空白) <!--/プラグイン3ここまで-->