Proxomitron フィルタ ..
710:名無しさん@お腹いっぱい。
08/03/08 13:17:55 3sK0/3hD0
判定が難しい。
・フィルタ名で判断…自分でタイトル弄れなくなる
・全文解析…無茶
みんなで共同開発できなくなる。(固定の作者と固定の公開場所が必要になってくる)
→成長が止まる
711:名無しさん@お腹いっぱい。
08/03/08 14:34:13 3sK0/3hD0
YouTubeのDLフィルタ、&fmt=18でのmp4対応改造をしていて気付いたんですが、
flvと違ってContent-Dispositionでfilename=video.mp4が指定されてました。
当然title.extの意味が失われるので、無効化する新しいヘッダフィルタが必須です。
URL無視したやっつけですが
[HTTP headers]
In = TRUE
Out = FALSE
Key = "Content-Disposition: neutralize video.mp4 (In)"
Match = "attachment; filename=video.mp4"
こんな感じで。URLはたまに変わったりするんで、どうなんですかね…。
で、DLフィルタ本体なんですが、少々事情があって私のは公開できません。
どなたかやれる方いらっしゃったらお願いしますー。
712:名無しさん@お腹いっぱい。
08/03/08 17:12:32 gtkLSZJN0
判断が難しいのは同意だが、成長が止まるってのはどうだろう
>固定の作者と固定の公開場所が必要になってくる
固定の作者である必要はどこにも無いし、
固定の公開場所が居るのはFirefoxでも同じで、自動アップデートできるようにするなら当然な訳だが
713:名無しさん@お腹いっぱい。
08/03/08 17:32:57 7RVVF1cV0
autopagerizeのsiteinfoみたいにWiki式にするとか
714:名無しさん@お腹いっぱい。
08/03/08 17:38:22 3sK0/3hD0
>>712
固定の公開場所が必要なら、当然固定の作者が必要になるでしょう。
勝手に変な物に書き換えられて自動アップデートで強制配布されちゃ困る。
715:名無しさん@お腹いっぱい。
08/03/08 18:49:50 gtkLSZJN0
wikipediaのように誰が更新したのか署名が残るようになっていればいい
アップデートするかどうかはユーザー次第
リストに一致する人の更新であれば自動更新〜とか
716:名無しさん@お腹いっぱい。
08/03/08 18:57:03 b0roCwfd0
間を取って、更新情報だけ集積したRSSを配信すればいいんじゃない?
717:think ◆MM0nnAOCiQ
08/03/08 19:44:20 CJ4g5fmj0
>>710
> 固定の作者と固定の公開場所が必要になってくる
自動更新はともかく、固定の公開場所は実現すべく現在試行錯誤中です。
私自身が今の公開形態(複数フィルタをzipで固めて配布)を面倒に感じており、簡単に更新できるシステムが必要だと常々考えていました。
(ブログも想像したほど記事投稿が簡単ではありませんでした)
フォーラムを用意して、1スレッドにつき一つのフィルタというローカルルールを作れば一元管理できて便利ではないかと考えています。
■現在、頭の中で考えている掲示板仕様 (★ … 必須 / ※ … 検討中)
★親記事、子記事にタグを付けられる
★記事検索で「inname:名前」のような特殊構文が使える
★一部のはてな記法が使える(少なくとも、順不同リスト、序列リスト、定義リスト、表ぐらいはほしい)
★記事全体を作者が任意でバックアップ(XMLまたはテキストで出力)できる
★携帯で投稿できる(移動中に携帯からアイデア投稿したい)
※記録フォーマットはXMLかDB(XMLにするとエクスポートが楽。APIも使える。DB管理するとしても内部動作でXMLに変換するのも面白そう)
※半会員制(完全に会員制にすると投稿者が少なくなる。会員は署名を使える、名前の同一性が保証される、などのメリットを得られる。)
※スラッシュドットのスコア機能を付ける(評価されるとより注目される記事を書きたくなるわけで議論に期待できそう。どうせなら、タグにしきい値を付けた方が統一性があっていいかも)
※BBCodeが使える(はてな記法を使うことを考えると統一性がない)
※記事一つ一つにファイルアップロード可能(ファイル添付する形にするか、base64エンコードするか。前者はバックアップ時に有用。)
■課題点
- PHPによるXML実装でどの手法を使うか(DOM, SimpleXML, XMLReader, SOAP)
- はてな記法をどうやって実装するか
# 文字列置換だけならわりと簡単なんですが、Proxomitronの「文字列を消費する」概念(一度マッチした部分には二度とマッチしない)を取り入れようとしたら一気に難易度が跳ね上がりました。
# 表は「Excel→table」のJavaScriptからアルゴリズムを流用すれば実装できそうです。
今ははてな記法をXHTML変換するJavaScriptを書いているところです。(上手くいけばPHPに移植予定)
718:名無しさん@お腹いっぱい。
08/03/08 20:06:32 gtkLSZJN0
>自動更新はともかく、固定の公開場所は実現すべく
いやいや、自動更新が必要ないならWikiで十分だと思うけど
719:名無しさん@お腹いっぱい。
08/03/08 20:37:26 Xk9Ulf4G0
:9OZ+Stfe0だけどまとめじゃなくて、なるべくブラウザに負荷をかけずに
快適動作をさせるかが作成のポイントなんです 利便性は失われないようにして
720:名無しさん@お腹いっぱい。
08/03/08 20:54:37 zIkrEzhb0
>>719
君は下のスレに行った方が良いだろう
■■■■Proxomitron入門スレッド■■■■6
スレリンク(pcqa板)
721:名無しさん@お腹いっぱい。
08/03/08 21:31:02 Xk9Ulf4G0
リストの質問です
hoge.com ではヒットしないのに
[^/]++hoge.com だとヒットします
どういう理由なんですか?
722:名無しさん@お腹いっぱい。
08/03/08 21:38:21 Xk9Ulf4G0
あと
hoge.com
[^/]++hoge.com と
([^/]++.|)hoge.com と
[^/]++hoge.com/ と
[^/]++hoge.com*
はマッチパターン変わりますか?
723:名無しさん@お腹いっぱい。
08/03/08 21:42:04 Xk9Ulf4G0
こんなの見つけましたよ しかし、hoge.comがヒットしない理由がわからない
URLスタイル のハッシュ化が適用される条件は以下の通りです。
行頭がワイルドカード で始まる
ホスト名の最後を示す文字(/, :) が存在する
行頭のワイルドカードから「ホスト名の最後を示す文字」までの間に、ワイルドカードが存在しない
URLリンク(vird2002.s8.xrea.com)
724:名無しさん@お腹いっぱい。
08/03/08 21:46:13 gtkLSZJN0
>>721
どっちでもマッチするけど? その現象が発生するフィルタとリスト晒してよ
725:名無しさん@お腹いっぱい。
08/03/08 22:44:47 tUFyZgmv0
URLマッチの話か?
対象が URLリンク(www.hoge.com) とかなら
[^/]++hoge.com だとマッチするけど hoge.com じゃマッチしないだろうよ。
726:名無しさん@お腹いっぱい。
08/03/08 22:50:16 tUFyZgmv0
念のため言っとくがURLマッチは部分一致じゃなく前方一致だならな。
727:名無しさん@お腹いっぱい。
08/03/08 23:36:56 +qXF65o20
(jp.|www.|)youtube.com/
を最適化する場合
(jp.|www.|(^[jw]))youtube.com/
と
(jp.|www.|(^(^y)))youtube.com/
のどちらが処理が速い、あるいは書き方として妥当だろうか
要は否定先読みと肯定先読みのどっちが速い?って質問なんだけど
728:名無しさん@お腹いっぱい。
08/03/08 23:55:06 3sK0/3hD0
速度の話は荒れるからやめろとテンプレに…あったっけ?ないね。
所詮無視できる誤差の範囲内、有意な差はないから好きなの選んでください。
729:名無しさん@お腹いっぱい。
08/03/09 04:29:15 60oDJR9b0
>>727
実際にテストフィルタ書いて実測してみるのが一番かと
実測してもどちらが早いのか解らないなら、それはどちらを使っても同じと言う事だ
730:名無しさん@お腹いっぱい。
08/03/09 11:02:04 97Oq/7fL0
flashの画質を低で固定するフィルターって前出てた気がするんだけど教えてください。
731:名無しさん@お腹いっぱい。
08/03/09 12:10:24 QKLcgHfk0
大体は肯定のほうが速いような気がする
732:名無しさん@お腹いっぱい。
08/03/09 13:38:01 Fh8QY9J20
最適化とやらがなされていないことによってこの先ロスするであろう合計時間の
数億倍数兆倍の時間を割いて検証し最適化フィルタを書くことに
無駄を感じないようであれば、検証する価値はあると思うよ。
733:名無しさん@お腹いっぱい。
08/03/09 15:22:42 H7KCeNOF0
ローカルに落としてあるファイルに対して、処理時間を計測するプログラムを作るよ
たとえば
proxchk C:\html (ディレクトリ名)
と打てば処理時間を計測する
734:名無しさん@お腹いっぱい。
08/03/09 16:52:23 mjAM5YBG0
>>692
># 私のように未熟な腕で「Google: High Light」に挑戦するとたくさんの煽りをもらうことになるので、複雑なフィルタは後回しがいいです……。
Google: High Lightを作ってるときの話は知らないけど
腕が未熟かどうかとは関係ない理由*でも*批判されてたことにはご自分では気づいておりませんでしたか?
735:733
08/03/09 18:26:35 H7KCeNOF0
出来ました
URLリンク(fx10.web.fc2.com)
例
proxchk c:\html > log.txt
proxchk c:\html
736:名無しさん@お腹いっぱい。
08/03/09 18:35:20 aRFVqAhQ0
>>727
(jp.|www.|)youtube.com/ インデクス化(ハッシュ)可能。意味が分かりやすい。
(jp.|www.|(^[jw]))youtube.com/ インデクス化(ハッシュ)不可能。意味が分かりにくい。
(jp.|www.|(^(^y)))youtube.com/ インデクス化(ハッシュ)不可能。意味が分かりにくい。
結局、シンプルにするのが処理が速くて、書き方も妥当。
リストにおいては状況により (jp.|www.|)youtube.com/ の最適化の結果が
youtube.com/
jp.youtube.com/
www.youtube.com/
になることはありうる(見た目もそれほど分かりにくくなってない、むしろ分かりやすく感じる人もいるかも)。
737:名無しさん@お腹いっぱい。
08/03/09 18:49:30 H7KCeNOF0
スペースが無いか、あるかは(\s|)でいいですか?
738:名無しさん@お腹いっぱい。
08/03/09 20:01:40 rTtpFBoD0
そういえばJリーグ始まったな
739:名無しさん@お腹いっぱい。
08/03/09 20:07:44 gcqYpFBd0
>>735
おつ。
740:名無しさん@お腹いっぱい。
08/03/09 20:58:21 Fh8QY9J20
>>737
" "(半角スペース)でいい。
741:名無しさん@お腹いっぱい。
08/03/09 21:30:58 H7KCeNOF0
サンクス ほかの質問もきいてもらえますか?
上にはヒットしないのに下にヒットします なぜでしょうか?
pagead[0-9].googlesyndication.com
pagead2.googlesyndication.com
742:名無しさん@お腹いっぱい。
08/03/09 21:52:32 Fh8QY9J20
君は>>721なんだろうけど、
検索表現は何で検索対象文字列が何の場合にマッチした(しなかった)
というのを明確にした方がいい。
743:名無しさん@お腹いっぱい。
08/03/10 01:24:33 8B4S+KnE0
フィルター、リストの順序で速度変わるね
744:名無しさん@お腹いっぱい。
08/03/10 02:26:26 UOgajIAh0
どういう意味?
ブロックリストの各行を入れ替えるってこと?
体感出来るほどの差異が出るかどうかは甚だ疑問だが、
ブロックリストはリスト上位から順にテストしていって、
マッチしたところで抜けるんだから、
出現頻度が高いと思われる語句(に対する検索表現)を
リスト上位に置いた方が理屈の上では速くなるだろうね。
注意事項として、リストの行は順位を不用意に入れ替えると
マッチしていたものがマッチしなくなったりすることがある。
745:名無しさん@お腹いっぱい。
08/03/10 02:32:53 UOgajIAh0
> 注意事項として、リストの行は順位を不用意に入れ替えると
> マッチしていたものがマッチしなくなったりすることがある。
もともとマズい書き方をしていた場合に、ね。
ヘルプの"Creating blocklists"ページ内の"Limitations..."の項参照。
746:名無しさん@お腹いっぱい。
08/03/10 05:52:11 8B4S+KnE0
初めから作り直しましたよ かなりおすすめです
広告消しに特化しました 使ってみてください
URLリンク(proxo.hp.infoseek.co.jp)
747:名無しさん@お腹いっぱい。
08/03/10 05:53:07 8B4S+KnE0
>>746= >>686 です 本体とフィルターに詰め合わせです
748:名無しさん@お腹いっぱい。
08/03/10 05:54:53 g/jYlHCy0
>>746
otu
749:名無しさん@お腹いっぱい。
08/03/10 08:19:57 8B4S+KnE0
バージョンアップしましたよ 汎用フィルタはなるべく入れません
たとえば右クリックを追加すると時間が20%増加してしまいます
URLリンク(proxo.hp.infoseek.co.jp)
750:名無しさん@お腹いっぱい。
08/03/10 09:13:47 YK+4yLV00
さすがは隔離スレだ
751:名無しさん@お腹いっぱい。
08/03/10 10:36:14 FwMbNCfL0
>>734
気づいてたらそれを全部羅列しろとでもいうのか?メチャクチャ迷惑なんだけど。
752:名無しさん@お腹いっぱい。
08/03/10 10:51:25 Kw/4DtR50
「主たる批判内容はそんな話じゃなかったでそ?」と言っているのでわ?
全部挙げろってんじゃなく、
その最も批判を受けていた部分について自覚してくれないか?という話なのでわ?
多分根拠薄弱なフィルタスピード比較論の話のことだと思うけど
「デタラメ垂れ流さないでくれ」みたいな
「経験的にはこんなことがいえるような気がするのであくまで参考程度に」
くらい断ってあれば問題ないと思うけどね
断定的に書かれちゃうとさ、関連スレへの貢献度が高く
オミトロンに関する知識も一般のオミトロン使いよりはずっと深いので
初心者が鵜呑みにする危険性があるのよ
753:名無しさん@お腹いっぱい。
08/03/10 10:55:49 ii6kRKVI0
>>749
YOU、トリ付けちゃいなよ
754:名無しさん@お腹いっぱい。
08/03/10 11:02:28 C6qeuJeK0
749 「オミトロンスレでトリップ持ちになっちゃった・・・(#^.^#)ドキドキ」
753 「(やっとNG指定出来る)」
755:名無しさん@お腹いっぱい。
08/03/10 11:24:00 nTBisBNY0
>734に対して>751はひどい
同じ日本語話者とは思えない
756:名無しさん@お腹いっぱい。
08/03/10 11:31:50 g/jYlHCy0
下らない話題はよそでやってくれ。 あぼーんするのが大変なんだ。
それと>>734とかはthink氏をNGNameに入れておくといいよ。
757:名無しさん@お腹いっぱい。
08/03/10 11:34:16 g/jYlHCy0
ぶっちゃけ俺は入れてます。 >>734がレス付けなければ>>692の書き込みに
永遠に気付きませんでした。
758:名無しさん@お腹いっぱい。
08/03/10 11:34:16 ii6kRKVI0
>>754
お前…言っちゃったらトリつけてくれなくなるだろ!バカバカ!
759:名無しさん@お腹いっぱい。
08/03/10 11:48:10 JK5+4guA0
>>734にしてみればまたThink氏が妙な教義を唱えていたらダメ出しする為に
NGに入れるわけにはいかないんジャマイカ。
(実効性の不明な)スピード向上に関するパラノイア的こだわりの部分さえ読み流せば
結構参考になる部分が多いので俺は読んでるけど。
760:名無しさん@お腹いっぱい。
08/03/10 11:51:41 ksyKSJfn0
>>734はどう見ても場を荒らしたいだけに見えるが。
あんなもんに応える必要はない。
761:名無しさん@お腹いっぱい。
08/03/10 11:56:58 JK5+4guA0
同じ言うにしてももう少し言いようってものがあるだろうとは確かに思うが、
荒らそうと思ってやっているとは思えない。
762:名無しさん@お腹いっぱい。
08/03/10 11:57:38 g/jYlHCy0
もち>>734も速攻でNGに入れたw 基地外はいらね。
763:名無しさん@お腹いっぱい。
08/03/10 11:58:50 EoUgzqZ10
何この流れ…
764:名無しさん@お腹いっぱい。
08/03/10 13:39:55 8Ymd8hAW0
俺のNGを聞け!な流れ
765:名無しさん@お腹いっぱい。
08/03/10 14:58:01 81WAQSwQ0
さすが隔離スレ・・・
766:名無しさん@お腹いっぱい。
08/03/10 15:01:17 JK5+4guA0
隔離スレ住人≒本スレ住人 な件
767:名無しさん@お腹いっぱい。
08/03/10 15:53:49 ii6kRKVI0
みんなNGしてるから気付いてないのかも知れんが、
thinkさんは最近速度の話は全くと言っていいほどしてないよ。
ハッシュの件でほんの少し触れたぐらいか。
768:名無しさん@お腹いっぱい。
08/03/10 15:59:22 JK5+4guA0
いや、昨日はテレビの前で「Qちゃん失速した!」と叫んだはずだ。
769:名無しさん@お腹いっぱい。
08/03/10 17:46:05 J/Vu1LPD0
速度の話で噛み付いてる人は、あれだけ口では色々言っておきながら
google highlightでboldに色つけるだけでごまかして逃げた人だからスルー推奨。
770:名無しさん@お腹いっぱい。
08/03/10 18:02:15 g/jYlHCy0
便利さでは
firefoxの拡張 >>> google high light
だからfirefoxユーザーならこのフィルタはいらないのでは。
オミトロンじゃどう頑張ってもリンク先のページで着色したりページ内検索することは出来ない。
771:名無しさん@お腹いっぱい。
08/03/10 18:27:37 J/Vu1LPD0
何でいきなりFirefoxが出てくるのかわからないが、
もともとGoogleHighlightはOperaユーザが
色づけのJavascriptを移植してくれと依頼して出来たものだぞ。
たしかそのJavascriptの元になったのがGoogleToolbarだった。
Firefoxはいいブラウザだけど、ブラウザはそれだけじゃないし
必要ないなら切ればいいってだけだね。
このフィルタの利点は軽快さとブラウザを選ばない事。
proxomitoronさえ用意できればIEだろうがなんだろうが同じ環境で使えるのがいい。
あと、アイデアと実装のインパクトがすごかったな。
実際に腕に自信のあるひとが何人か挑戦したし、俺も感動した記憶がある。
そうえいばキャッシュページの着色は昔実装してる人が居たな。
あと、ページ内検索はJavascript追加でも出来るよ。
772:名無しさん@お腹いっぱい。
08/03/10 18:51:47 g/jYlHCy0
boldに色付けで終わったのはfirefox用のフィルタだったからでしょ?
それとキャッシュページは元々着色されてたはず。
>ページ内検索
google highlightでは出来ないという結論になったんですよ。
773:名無しさん@お腹いっぱい。
08/03/10 19:07:48 J/Vu1LPD0
・過去ログ読んで来い。全然違う。
・キャッシュのページは昔は色がついてなかった。
・無理にgoogle highlightでやる必要は無い。
774:名無しさん@お腹いっぱい。
08/03/10 19:08:35 qSiZd4bI0
フィルタ一つでそんなムキになるなおまえら
775:名無しさん@お腹いっぱい。
08/03/10 19:10:16 g/jYlHCy0
>>773
おまえが読んでこいよw 何言ってんだこいつ。
776:名無しさん@お腹いっぱい。
08/03/10 19:46:51 JK5+4guA0
そもそも速度の議論と Google Highlight フィルタの作成とはまるで別個の話なのに
両者を結び付けて「だからスルー推奨」とか意味不明な論理展開をしている時点で
ちょっと頭がアレな人かな?とオモタ。
777:名無しさん@お腹いっぱい。
08/03/10 19:53:15 J/Vu1LPD0
ログあさってきたから見てくるといいよ。
スレリンク(software板:395-番)
この一言につきる。
> 510 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2005/09/27(火) 12:36:00 ID:tSC0sS7y0
> 395氏のGoogleフィルターにはがっかり
> 散々エラそうな事を言っておきながら
>
> Match = "<b>"
> Replace = "<b style="color:red; background:#EEEEEE; font-size:large;">"
>
> と同等レベルとは
778:名無しさん@お腹いっぱい。
08/03/10 19:59:26 g/jYlHCy0
think信者は所詮この程度。 そろそろngidさんに頑張ってもらうか。
779:名無しさん@お腹いっぱい。
08/03/10 20:01:09 boWjx4f00
信者って言葉だしたな。あんたが悪意あってレスしてるのがよくわかったわ
780:名無しさん@お腹いっぱい。
08/03/10 20:07:31 J/Vu1LPD0
>>776
スレリンク(win板)
見といで。
言い回し、癖その他もろもろが一致してるから。
キャラのあくの強さからすぐわかるんだよな。
ある意味名物みたいな人なのかもしれない。
781:名無しさん@お腹いっぱい。
08/03/10 20:16:00 JK5+4guA0
“ここの>>734と過去スレの395氏とやらが同一人物であるか否かによらず”
速度の議論と Google Highlight フィルタの作成とはまるで別個の話、ってのは
いちいち言わないと分かんないかね。
782:名無しさん@お腹いっぱい。
08/03/10 20:21:42 J/Vu1LPD0
>>734と同一人物なんて言ってないよ?
速度の話で噛み付いてくる人がスルー推奨って言ってるだけで。
783:名無しさん@お腹いっぱい。
08/03/10 20:46:07 JK5+4guA0
おやおや。
>>769では【噛み付いて「(い)る」人】だったのが
>>782では巧妙に【噛み付いて「くる」人】に摩り替わっていますね。
文脈がまるで異なってきますが。やれやれ。
784:名無しさん@お腹いっぱい。
08/03/10 20:54:40 mv5qnIJg0
スクリプト、コメント、アプレットは全て削除してそのあと広告削除するのが良いかな
プログラムが必要ならばバイパスする
785:名無しさん@お腹いっぱい。
08/03/10 21:17:29 v34is3/Z0
このスレに有効なフィルタリングを考えようか
786:名無しさん@お腹いっぱい。
08/03/10 21:23:42 g/jYlHCy0
冷静に見ると>>692の釣りに>>734が豪快に釣られた格好だな。
>>779
信者じゃなかったらなんなんだよ。
>>783
基地外はもうほっとけw
787:名無しさん@お腹いっぱい。
08/03/10 21:23:43 oXfBdlGC0
同一IDが5回以上あるレスを削除
788:名無しさん@お腹いっぱい。
08/03/10 21:28:34 DrLIAYND0
もう何がなんだか分からなくなったw
789:名無しさん@お腹いっぱい。
08/03/10 21:31:48 JK5+4guA0
考えるな、感じるんだ!
790:名無しさん@お腹いっぱい。
08/03/10 21:53:43 j9xn8h7P0
>>786
>>692が釣りとか、お前の存在自体が釣りなんじゃねーの
791:名無しさん@お腹いっぱい。
08/03/10 21:57:36 g/jYlHCy0
そういえば遠慮のないもの言いがどうのこうのって2ちゃん批判してる奴が
なんでコテまで付けて2ちゃんに常駐してるんだろう。
もう来なければいいのに。
792:名無しさん@お腹いっぱい。
08/03/10 22:04:10 Wlhf/hE10
ええと
793:名無しさん@お腹いっぱい。
08/03/10 22:06:26 Wlhf/hE10
すんません><
2ch dat Converter (2007/9/3)で#5と言ったようにレス番指定したときに、
>>1を表示しないには、どうすれば良いですか?
794:名無しさん@お腹いっぱい。
08/03/10 22:07:48 Wlhf/hE10
間違えました(><)
#5じゃなくて、#l5です。
795:名無しさん@お腹いっぱい。
08/03/10 23:22:54 TARpZdGw0
↓知ってるがお前の態度が気に入らないのAA
796:名無しさん@お腹いっぱい。
08/03/10 23:30:20 g/jYlHCy0
( ゚д゚)
_(__つ/ ̄ ̄ ̄/_
\/ /
 ̄ ̄ ̄
( ゚д゚ ) !!
_(__つ/ ̄ ̄ ̄/_
\/ /
 ̄ ̄ ̄ ̄
797:名無しさん@お腹いっぱい。
08/03/10 23:32:32 J/Vu1LPD0
ID:g/jYlHCy0はやっぱり神聖か。
798:名無しさん@お腹いっぱい。
08/03/10 23:53:11 GHYAfAMC0
ID:g/jYlHCy0
このスレではコテ付けてください
799:名無しさん@お腹いっぱい。
08/03/10 23:54:32 Wlhf/hE10
, - ,----、
(U( )
| |∨T∨ <お願いします
(__)_)
800:名無しさん@お腹いっぱい。
08/03/11 00:28:23 b6p4os+U0
>>799
作者がこのスレ見てるって書いてるからそのうち作ってくれるかもよ。
801:名無しさん@お腹いっぱい。
08/03/11 00:37:06 OHfURG1J0
下らないことで荒れてんじゃないよ
802:名無しさん@お腹いっぱい。
08/03/11 00:39:56 b6p4os+U0
そんなことよりpart19の1000間際のレスとか面白いぜ
803:名無しさん@お腹いっぱい。
08/03/11 00:56:43 JiAtip1P0
しかし、巡回タイミングが事が終わった後な為にログをまとめて見る状態になると
誰が必死なのか一目で解るのは面白いな
804:名無しさん@お腹いっぱい。
08/03/11 01:05:11 CB8XcJ6C0
>>800
じゃあ待ってみます。>>1が巨大だと邪魔で…。
ISPが規制されると、datを取得して読み書きできる2ch dat Converterは
人大杉も回避できるし色々と便利なんです。
805:名無しさん@お腹いっぱい。
08/03/11 01:10:17 5fFGat130
>ISPが規制されると
2chって参照自体を規制することもあるのか?
それともまさか、そのフィルタ使うと書き込み規制も回避できる…わけないか
806:名無しさん@お腹いっぱい。
08/03/11 01:18:21 b6p4os+U0
人大杉を知らない奴がいるとは。。
807:名無しさん@お腹いっぱい。
08/03/11 01:20:14 YWnYWp8m0
専ブラ使えば(ry
ってのはこのスレ的にはなしなのかな
808:名無しさん@お腹いっぱい。
08/03/11 01:26:58 5fFGat130
人大杉とISPの規制は違うだろ…
809:名無しさん@お腹いっぱい。
08/03/11 01:28:42 iD4WjoM50
>>808
な。俺も何言ってるか全然わかんね
810:名無しさん@お腹いっぱい。
08/03/11 01:29:54 b6p4os+U0
ああ、確かにごっちゃにしてるな。 ISP規制されたらオミトロン使っても書けないし。
串刺すとかすれば別だが。
811:名無しさん@お腹いっぱい。
08/03/11 01:47:15 0GAjhws90
ISPが板別や全サーバで規制されるとする。
2ch専用ブラウザはCGIプロキシを利用できない。
Webブラウザだと利用可能だが、今度は人大杉を回避できない。
2ch dat Converterなら全ておk。
知らない板で結構規制されてたりする。(行かないから気付かない)
URLリンク(qb6.2ch.net)
812:↑
08/03/11 01:48:14 0GAjhws90
勿論閲覧ではなく、書き込みの話ね。
813:名無しさん@お腹いっぱい。
08/03/11 04:46:32 CBNBty6z0
ホスト名調査に失敗の状態を取得してキャッシュへのリンクを張るにはどうすればいいですか
404とかではないです
814:名無しさん@お腹いっぱい。
08/03/12 23:51:07 j2dx5y5k0
どなたかAmazonトラップを防止するフィルタ作っていただけないでしょうか
815:名無しさん@お腹いっぱい。
08/03/12 23:56:14 DtF/4fyx0
買物時以外はサインアウトする
816:名無しさん@お腹いっぱい。
08/03/13 00:07:05 4maFG1Ve0
すみません>>814ですが、mixiトラップ用のフィルタを流用しどうにか作成出来ました
817:名無しさん@お腹いっぱい。
08/03/13 13:15:16 IuSGhDLM0
>>816
mixiトラップとは何ですか?
818:名無しさん@お腹いっぱい。
08/03/13 13:27:13 9Z2p3YPs0
画像にmixiのアドレスを.htaccessとかで指定して、
知らないうちに足跡に残すようにするスパイウェア紛いの行為。
今はもう繋がらないみたいだけど過去の例。
ここはたしかCSSに画像を仕込んでわかりづらくしてた。
> 129 名前:名無しさん@お腹いっぱい。 [sage] 投稿日:2007/01/02(火) 17:13:36 ID:Ny7Bu6X50
> 前フィルター投下してくれた人、ありがとう。
> 今日初めてmixiの足跡殺せたよ。
> フィルター入れといて良かった。
>
> ↓アクセスする時は気をつけてくれ。
> www.nishishi.com/blog/2006/05/perl_use_strict.html
> www.nishishi.com/pt/sp/mr.gif
819:名無しさん@お腹いっぱい。
08/03/13 13:27:14 zkFPukf/0
てかフィルタ書くまでもなくAmazon側でトラップ無効化されてると思うけど。
820:名無しさん@お腹いっぱい。
08/03/13 21:56:24 vQtOASWB0
これでgoo右上のフラッシュ広告が消えるんだけど段を詰めてくれないんだけど、どうしたらいい?
m(_ _)m
[Patterns]
Name = "goo AD killer"
Active = TRUE
URL = "[^.]+.goo.ne.jp/"
Limit = 7000
Match = "$NEST(<!-- ((h02|banner02|osusume|top_text|ad|ad_focus|pr)\0|Sniffer Code for Flash version=60) -->,<!-- /($TST(\0)|html.ng/cat=*) -->)"
821:名無しさん@お腹いっぱい。
08/03/14 01:38:26 oxncJDZY0
>>820
[Patterns]
Name = "New HTML filter"
Active = TRUE
URL = "www.goo.ne.jp/css/top_15.css"
Limit = 256
Match = ".banner{margin:0 0 8px 0;display:block;}"
Replace = ".banner{display:none;}"
タイトルとかURLとか細かい検証は任せる
822:名無しさん@お腹いっぱい。
08/03/14 03:21:03 l57OAAGe0
それだとcssファイルのパスが変わったりcssの書き方が変わっただけでマッチしなくなってしまうから
フラッシュを表示させるためのタグのstyle属性をいじるか、html内にcssを埋め込んでimportantするほうが
仕様変更に強いフィルタになるとかならないとか。
823:名無しさん@お腹いっぱい。
08/03/14 11:42:37 YpMtG1EW0
>>821
>>822
サンクス!いろいろ試してみる。
824:名無しさん@お腹いっぱい。
08/03/15 02:40:46 FVjzi/9U0
ここのGamedayってところ新しい窓じゃなくてタブで開けれるようにできますでしょうか?orz
URLリンク(mlb.mlb.com)
825:名無しさん@お腹いっぱい。
08/03/15 16:59:11 V7KyWXr60
オークファンの検索結果に連動広告がどんどん増えてきて邪魔・・・
どなたかフィルターを作っていただけないでしょうか。
よろしくお願いします
URLリンク(aucfan.com)
826:名無しさん@お腹いっぱい。
08/03/15 17:49:08 IIYvvmtu0
「mixiの絵文字パレットを完全に読み込まなくする」のではなく
「絵文字挿入ボタンが押されるまで読み込まなくする」というのを
Proxomitron のフィルタで実現できるでしょうか。 ↓ のは参考です。
mixiを高速化したよ - yukobaの日記
URLリンク(d.hatena.ne.jp)
827:名無しさん@お腹いっぱい。
08/03/15 18:21:10 +NTyjWBS0
DMMのTOPページはOKなんだが
作品の詳細サイトに行くと
必ず文字化けするんだが
おまいらどうよ?
828:名無しさん@お腹いっぱい。
08/03/15 18:55:32 7t8H1HOA0
>>827
どこのページのことかよくわからなかったけど
一通り見ても化けない。
そのページをどのブラウザでどのフィルタ適用なのか書かないと
まともなレス付かないよ。
829:名無しさん@お腹いっぱい。
08/03/16 18:12:25 GR9PUa/K0
>>824
ポップアップで開く部分を全部
window.open(url, name, 〜);
↓
window.open(url, null);
みたいに変更したけど別窓で開いてしまうんだよなぁ。
行数制限が異様に厳しいので続く。
830:829
08/03/16 18:12:52 GR9PUa/K0
制御の流れは以下の感じで、大体追えたと思うんだけど。
javascriptの知識そんなに無いから、これ以上はよく分からない。
<a href="javascript:void(0)" onclick="launchGameday('" + gameID + "')">
↓
URLリンク(mlb.mlb.com)
function launchGameday(params) {
:
popWin(/*baseURL+*/gamedayURL,'GamedayWin',gd_w,gd_h,'location=no,menubar=no,scrollbars=no,status=no,toolbar=no,resizable=yes');
↓
URLリンク(mlb.mlb.com)
function popWin(url,n,w,h,o) {
:
_pw_z=window.open(url,n,'width='+w+',height='+h+',left='+_pw_l+',top='+_pw_t+','+o);
}
831:名無しさん@お腹いっぱい。
08/03/16 18:16:07 GR9PUa/K0
>>825
Name = "aucfan"
Active = TRUE
URL = "(ap.|www.|)aucfan.com/"
Limit = 360
Match = "<iframe*</iframe>"
"|$NEST(<script, *(overture|urchin)*, </script>)"
"|</head>$SET(#=<style>\n<!--\n"
"#top_header_1, #CATEGORY_AD_FRAME { display: none; }\n-->\n</style>\n</head>)"
"|(<title>)\1*[%a1][%d7]-\2(</title>)\3$SET(#=\1\2\3)"
"|(class=$AV(keyword_input_box))\1$SET(#=\1 accesskey="q")"
"|(class=$AV(l_price_input_box))\1$SET(#=\1 accesskey="1")"
Replace = "\@"
ついでにタイトルを短めにして、ALT+Q と ALT+1 で検索と値段のとこにアクセスキーを設定してみた。
832:名無しさん@お腹いっぱい。
08/03/16 22:54:29 gI7o6bEo0
連番ウォーカー
proxo.hp.infoseek.co.jp/cgi-bin/sn_uploader/src/pr0051.txt
面白く、有用なフィルターありがとうございます
「$LST(***)」でなく、「URLリンク($LST)(***)」に対応するようにしたいです
生半可の知識で全く歯が立ちません。よろしくお願いします
833:名無しさん@お腹いっぱい。
08/03/17 07:35:53 8saex8z00
>>831
動作しない
834:名無しさん@お腹いっぱい。
08/03/17 14:55:43 133Hoy0o0
>>832
$JUMP( → $JUMP(http://
(4箇所)
$RDIR( → $RDIR(http://
(2箇所)
で動きました。
835:名無しさん@お腹いっぱい。
08/03/17 19:18:00 OrmS5cD30
>>834
ありがとうございます。上手く動作しました。感謝です
\0とかまったく別のとこみてた…
836:名無しさん@お腹いっぱい。
08/03/18 09:37:24 A+626kv60
画像とか背景、CSSにわざわざhttps://を使っていて
毎回IEがSSLのダイアログをだすうざいサイトがたまにあるんですが
ソースコード内のhttps://の記述を一括でhttp://に置換えする
フィルタをお願いします。
httpでは403吐くところもあるんですがそれは気にしないので。。。
837:名無しさん@お腹いっぱい。
08/03/18 09:54:37 w0HDnC8w0
$TYPE(css)
https://
http://
838:名無しさん@お腹いっぱい。
08/03/18 10:43:27 A+626kv60
>>837
レスありがとうございます
早速試してみたんですがうまくいかないみたいです。。
たとえばこんなサイトです
URLリンク(61.211.231.130)
すいませんあと、できればインポータブルな形式で記述していただけますと。。。
ワガママでほんと申し訳ありません。
839:名無しさん@お腹いっぱい。
08/03/18 11:07:14 qiZvkiRJ0
>>838
インターネットオプション
接続
LANの設定
詳細設定
すべてのプロトコルに〜 のチェックを外す
Secure、FTP、Socks の各項目を真白にする
OK x 3回
じゃダメ?
840:名無しさん@お腹いっぱい。
08/03/18 11:34:14 0Ee2R/td0
<link([^>]++rel=$AV(stylesheet)&[^>]++href=$AV(URLリンク(*$URL)<)(http://))[^>]+>
<[a-z]+[^>]++bgcolor=$AV(URLリンク(*$URL)(http://))[^>]+>
841:名無しさん@お腹いっぱい。
08/03/18 11:35:28 A+626kv60
>>839
レスありがとうございます。
proxomitronの使い方などはわかっているつもりなので
そのあたりは問題ないです。
firefoxでもダイアログが出てしまいます。
ただ、フィルタの編集とかは不得手というか正規表現などの知識がないので、
単純に>>837さんのレスをうまくフィルタに反映できていないかもしれません。。
cfgに直接書き込みできる形式でお願いできませんでしょうか
842:名無しさん@お腹いっぱい。
08/03/18 11:38:12 0Ee2R/td0
bgcolorじゃなくてbackgroundだった、まあそんな感じで
843:名無しさん@お腹いっぱい。
08/03/18 12:52:18 pPXvBy9b0
\0が2の時と3の時で置き換えを変える事が出来ますか?
844:↑
08/03/18 12:52:51 pPXvBy9b0
条件分岐という意味です。
845:名無しさん@お腹いっぱい。
08/03/18 13:02:30 wsTHKde10
>836
IEを窓から投げ捨てる。それがベスト。
846:名無しさん@お腹いっぱい。
08/03/18 13:16:01 qiZvkiRJ0
>>841
そっか、ごめん。 >>840さんの使って書いてみた。
[Patterns]
Name = "New HTML filter"
Active = TRUE
Multi = TRUE
URL = "$TYPE(htm)$URL(http://)"
Limit = 512
Match = "("
"<link\s(^(^[^>]++rel=$AV(stylesheet)))[^>]++href="
"|<img\s[^>]++src="
"|<[a-z]+\s[^>]++background="
")\0"
"$AV(URLリンク(\1)<)" "
>>843
出来ますよ〜。 マッチングコマンドの$TSTの説明を参照して下さい。
(
$TST(\0=2)$SET(9=中身は2です)
|
$TST(\0=3)$SET(9=中身は3です)
)
847:843
08/03/18 14:15:40 pPXvBy9b0
>>846
ありがとうございます!
848:名無しさん@お腹いっぱい。
08/03/18 17:01:22 7tc1F1e80
みんなUser-Agentなんにしてるの?
849:名無しさん@お腹いっぱい。
08/03/18 17:13:45 TjO0Rc440
>>848
色々だよ
850:名無しさん@お腹いっぱい。
08/03/18 18:31:55 MLDVv7/j0
>>848
Opera/9.30 (Nintendo Wii; U; ; 2047-7; ja)
851:名無しさん@お腹いっぱい。
08/03/18 20:43:48 vfFKYSDo0
>>848
Googlebot/2.1
852:名無しさん@お腹いっぱい。
08/03/18 22:12:34 1F3qwVJX0
DoCoMo/2.0 P2102V(c100;TB)
853:名無しさん@お腹いっぱい。
08/03/19 00:16:18 7pQMiiA00
>848
SuperFamicon(SNES)
854:名無しさん@お腹いっぱい。
08/03/19 11:50:38 eLecFv960
>>848
Mozilla/4.0 (compatible; MSIE 4.0; MSN 2.5; Windows 95)
855:pQJDWyIJOeLSyRqIPKC
08/03/19 16:46:39 xqdfE1ka0
Nice site!
856:名無しさん@お腹いっぱい。
08/03/19 21:41:06 dJXtNMco0
投稿者では無いのだが、Proxomitron入門スレッド 6で以下の質問に
付いてもめてます。此方の方の回答も参考にしたいのですが、
因みに俺は[^/]++microsoft.com/ [^/]++google.(com|co.jp)/ で
良いのではと
45ひよこ名無しさんsage2008/03/15(土) 03:20:10 ???P
MicrosoftとGoogleの全てのサイトをBypassにしたいのですがURLの
数が厖大で極力少ない適切な記述方法を教えて頂けないでしょうか
さしあたりMicrosoft UpdateとGoogleのメール、カレンダーの表示
障害で困って下ります。どうか宜しく御願いします。
857:名無しさん@お腹いっぱい。
08/03/19 21:44:32 h8tfBuxM0
virusmicrosoft.com/
usogoogle.com/
858:名無しさん@お腹いっぱい。
08/03/19 21:48:35 h8tfBuxM0
ドメイン名がいろいろあるから無理ぽがFAだと思います。 ホスト名ではなくIPアドレスで書かれた
場合のことも考慮しなきゃいけないし。 同じ質問はよくFWのスレでも見かけます。
859:名無しさん@お腹いっぱい。
08/03/20 00:25:32 xAtr1s+h0
GmailではSSLが使えるから、自分はSSLの方を利用する。
SSLに対してフィルタリングさせない設定だったらまったく問題ない。
ログウィンドウの中身をテキストにでも保存して、
ドメインを調査してみるという方法もありそうだがいかがか。
正規表現で書くよりも誤爆・誤動作の類は減ると思われる。
860:名無しさん@お腹いっぱい。
08/03/20 01:07:29 7MGWdgkZ0
>>855
爆撃レスも褒めててちょっとワラタ
861:名無しさん@お腹いっぱい。
08/03/20 10:48:14 TXoSDyZx0
入門スレ荒れててわろたw 入門者同士のやり取りに一人上級者が入って浮いてるw
■■■■Proxomitron入門スレッド■■■■6
スレリンク(pcqa板)
862:名無しさん@お腹いっぱい。
08/03/20 11:06:14 YmIfVqIU0
ちょっとタイミング逃したネタだが、
他の人も言っているようにThink氏のパラノイア的こだわりは
「フィルタ速度の話以外」においては結果的にいい効果をもたらすことが多い。
ここ数ヶ月のThink氏を見る限りちゃんと速度ネタは自重していると思う。
だから今後も自分はThink氏を「信じる」ことにするからよろしく。
863:名無しさん@お腹いっぱい。
08/03/20 11:41:56 TXoSDyZx0
信者うざす
864:名無しさん@お腹いっぱい。
08/03/20 11:53:31 YmIfVqIU0
便器の横の張り紙の
「いつもきれいに使っていただいてありがとうございます」
みたいなもんだ。わかるかなこのネタ。
今後もThink氏が自己の中でのみ留めておくべき探求心を
外へ垂れ流さないことを信じてるよ。
865:名無しさん@お腹いっぱい。
08/03/20 13:18:58 st1PfBrg0
またお前か。
866:名無しさん@お腹いっぱい。
08/03/20 13:57:21 TXoSDyZx0
ちんこの高速化ネタ禁止な。
867:名無しさん@お腹いっぱい。
08/03/20 14:31:52 YIqIV1q+0
オチンチンを高速でしごくんだ!
868:名無しさん@お腹いっぱい。
08/03/20 17:53:08 kd9KI4rN0
アンチうぜえ
869:名無しさん@お腹いっぱい。
08/03/20 23:42:01 E4HRA4SR0
tes
870:名無しさん@お腹いっぱい。
08/03/21 13:37:26 mr3hZsqy0
>>856
live.com とかも必要ではないかと思うのだけれど。
871:名無しさん@お腹いっぱい。
08/03/22 11:09:10 FM8cqCDa0
URLリンク(www.uploader.jp)
このあぷろだの広告除去フィルタを希望します
サンプルも置いておきます
よろしくお願いします
URLリンク(www.uploader.jp)
URLリンク(www.uploader.jp)
872:名無しさん@お腹いっぱい。
08/03/22 15:48:20 Lk8WRKeE0
テストしてないけど、どちらかお好きな方をどうぞ。
body#bhome img { display: none !important; }
body#bhome div.photo,
body#bhome a[href^="http://sys.uploader.jp/campaign/"] { display: none !important; }
873:UVUxWBVcIdLhvwRI
08/03/22 23:28:25 TJZqUCvG0
<a href=URLリンク(nuvistor.cn) >pills</a>
URLリンク(mythically.cn)
<a href=URLリンク(mythically.cn) >online</a>
URLリンク(nutsch.cn)
<a href=URLリンク(nutsch.cn) >online</a>
URLリンク(nutsche.cn)
<a href=URLリンク(nutsche.cn) >online</a>
<a href=URLリンク(meds10top.com) >online prescription viagra</a>
<a href=URLリンク(meds10top.com) >tramadol and acetaminophen</a>
874:名無しさん@お腹いっぱい。
08/03/23 12:27:21 k1SXF9lB0
>>871
こんなのはどうでしょ?
[Patterns]
Name = "uploader.jp"
Active = TRUE
URL = "www.uploader.jp"
Limit = 16
Match = "<!--aa-->"
Replace = "\k$STOP()"
875:名無しさん@お腹いっぱい。
08/03/23 18:33:51 k1SXF9lB0
>>871
訂正
[Patterns]
Name = "uploader.jp"
Active = TRUE
URL = "www.uploader.jp"
Limit = 240
Match = "<div\salign="center">$SET(0=<div style="display:none">)|"
"<!--c(sr|an)-->*<!--/c(sr|an)-->|"
"<div\sid="footer">$SET(0=\k$STOP())"
Replace = "\0"
876:871
08/03/23 20:02:57 rnklNppY0
ありがとうございます
>>872
すみません。色々試してみたんですけどよく分かりませんでした。
>>875
このフィルタでURLリンク(www.uploader.jp)のページの広告などを綺麗に消えましたが、
URLリンク(www.uploader.jp)のページの広告は消えませんでした
それとこのあぷろだは今のところ
URLリンク(www3.uploader.jp)
から
URLリンク(www11.uploader.jp)
までサーバーがあるようですので考慮していただけると嬉しいです
877:名無しさん@お腹いっぱい。
08/03/23 20:44:06 NcL/zBuT0
*.images-amazon.com/
sys.uploader.jp/
878:名無しさん@お腹いっぱい。
08/03/23 20:59:09 k1SXF9lB0
>>876
[Patterns]
Name = "uploader.jp"
Active = TRUE
URL = "www(|[0-9]+).uploader.jp/"
Limit = 64
Match = "*.images-amazon.com/|"
"sys.uploader.jp/"
又は
Name = "uploader.jp"
Active = TRUE
URL = "www(|[0-9]+).uploader.jp/"
Limit = 240
Match = "<div\salign="center">$SET(0=<div style="display:none">)|"
"<!--c(sr|an)-->*<!--/c(sr|an)-->|"
"<div\sid="footer">$SET(0=\k$STOP())|"
"<!--aa-->$SET(0=\k$STOP())"
Replace = "\0"
のどちらかで如何でしょうか?
879:871
08/03/23 21:31:21 rnklNppY0
>>878
上のフィルタのMatchだと残ったゴミにhttp Text to Linkなどが誤爆して使いづらかったです
下のフィルタだと残念ながら肝心の「ダウンロード」リンクまで消えてしまいました
880:名無しさん@お腹いっぱい。
08/03/23 21:31:33 k1SXF9lB0
>>878
ご免なさい、また訂正。下側のフィルタは下記のように
[Patterns]
Name = "uploader.jp"
Active = TRUE
URL = "www(|[0-9]+).uploader.jp/"
Limit = 240
Match = "(</h1>|</table> )\1<div\salign="center">$SET(0=\1<div style="display:none">)|"
"<!--c(sr|an)-->*<!--/c(sr|an)-->|"
"<div\sid="footer">$SET(0=\k$STOP())|"
"<!--aa-->$SET(0=\k$STOP())"
Replace = "\0"
881:871
08/03/23 22:23:33 rnklNppY0
>>880
綺麗に消えました
ありがとうございました
882:名無しさん@お腹いっぱい。
08/03/23 23:21:50 Ct0APsuk0
www[0-9]+.uploader.jp/ で十分。
ところで、
(</h1>|</table> )\1<div\salign="center">
のようなものにマッチさせる場合、
(^(^</h1>|</table> ))
先頭をこのようにしているとマッチしない。
ずっと前から疑問に思っているんだけど、これはなぜだろう。
883:名無しさん@お腹いっぱい。
08/03/23 23:42:44 u63ovOYo0
これからも疑問に思っていなさい。
884:名無しさん@お腹いっぱい。
08/03/24 00:13:59 xKdi8PQZ0
Scott 曰く...
だって「/」と「d」が同時に同じ場所に存在するなんてありえませんからね ;-) 。
885:名無しさん@お腹いっぱい。
08/03/24 03:33:25 Z2sKZxFT0
URLリンク(msdn2.microsoft.com)(VS.80).aspx
(?!pattern)
否定先読み検索を実行する部分式です。
pattern に一致しない文字列が始まる位置にある検索文字列と一致します。
一致した文字列は記憶されず、後で使用することはできません。
たとえば "Windows (?!95|98|NT|2000)" は、
"Windows 3.1" の "Windows" には一致しますが、
"Windows 2000" の "Windows" には一致しません。
先読み処理では、読み進まれた文字は処理済みとは見なされません。
一致の検出後、次の検索処理は先読みされた文字列の後からではなく、
一致文字列のすぐ後から開始されます。
>884
どうもありがとうございます。なんとなくですが理解できたような気がします。
肯定先読みという言葉は見たことがあるものの、
どういう概念なのかは知りませんでした。
否定先読みの方だけは、そういう言葉すら知らないうちから使っていたのですが…。
以下テスト用。
Match = "(^(^</h1> )) <"
<h1> </h1> <div>
にマッチさせてみる。
886:名無しさん@お腹いっぱい。
08/03/24 03:36:35 Z2sKZxFT0
転載する場所を間違えたのでやり直し。
(?=pattern)
肯定先読みを実行する部分式です。
pattern に一致する文字列が始まる位置にある検索文字列と一致します。
一致した文字列は記憶されず、後で使用することはできません。
たとえば "Windows (?=95|98|NT|2000)" は、
"Windows 2000" の "Windows" には一致しますが、
"Windows 3.1" の "Windows" には一致しません。
先読み処理では、読み進まれた文字は処理済みとは見なされません。
一致の検出後、次の検索処理は先読みされた文字列の後からではなく、
一致文字列のすぐ後から開始されます。
887:think ◆MM0nnAOCiQ
08/03/24 03:48:42 0gHMU6EQ0
先読みと前読みをはき違えているような気がします…。(Proxomitronは先読みしかできません)
Google検索: 先読み 前読み
URLリンク(www.google.co.jp)
>882を例にとると、以下の表現ならマッチするはずです。この違いがわかるでしょうか?
(</h1>|</table> )(^(^<div\salign="center">))
>>885
> Match = "(^(^</h1> )) <"
この書き方では、</h1> だけでもマッチしてしまいますよ…。
先読み後に消費すると、同じ文字列を2度検索することになります。
888:名無しさん@お腹いっぱい。
08/03/24 04:32:12 gGfErR5e0
「文字列を消費しない」という意味を
「マッチはしたけど取り込まない、置換対象としない」なんて理解(誤解)しているから
こういうことになるんだろうな。
要するにゼロ幅の位置指定子なんだが。
889:名無しさん@お腹いっぱい。
08/03/24 05:41:07 gGfErR5e0
理解を助ける為に、例えば文字列 "foobarbaz" について、
"|f|o|o|b|a|r|b|a|z|" という具合に、各文字間に仕切り線(これは文字ではない。
あくまで便宜的に表示したもの。この文字列の長さは9である)があるものと思うことにしよう。
この場合、肯定先読み "(?=baz)" ってのは
「"baz" にマッチする(けど、"baz" は取り込みや置換の対象とはしない)」
のではなく、
「その仕切り線に "baz" が続く、そのような仕切り線」にマッチする。
つまり上の例で言えば、7本目の仕切り線にマッチする。
肯定/否定先読みがマッチするのは、「(幅を持った)文字」ではなくて
「(ゼロ幅の)位置(便宜的に"|"で書き表したもの)」なのである。
前読みとか戻り読みとか呼ばれるのも同じ。
肯定戻り読み "(?<=foo)" ってのは、
「"foo" にマッチする(けど、"foo" は取り込みや置換の対象とはしない)」
のではなく、「"foo" に続く仕切り線」にマッチする。
つまり上の例で言えば、4本目の仕切り線にマッチする。
要するにだ、正規表現 "(?=foo)bar"(Proxomitron でいうところの "(^(^foo))bar")ってのは、
「その仕切り線に "foo" が続く、そのような仕切り線と、更にその仕切り線から続く "bar"」
を検索していることになる。
同時に同じ場所に "foo" と "bar" とが存在するわけなどなく、これは絶対にマッチしない。
次ページ最新レス表示スレッドの検索類似スレ一覧話題のニュースおまかせリスト▼オプションを表示暇つぶし2ch
4219日前に更新/334 KB
担当:undef