[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 2chのread.cgiへ]
Update time : 08/23 17:51 / Filesize : 236 KB / Number-of Response : 901
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

Proxomitron フィルター作成スレッド Part14



1 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/01/17(火) 20:41:21.52 ID:5bYaTkqS0]
Proxomitron等に関するWiki
abc.s65.xrea.com/prox/wiki/

Proxomitron専用Uploader
www42.tok2.com/home/proxo/

Thinking Archive(仮)
vird2002.s8.xrea.com/

【前スレ】
Proxomitron フィルター作成スレッド Part13
anago.2ch.net/test/read.cgi/software/1287997298/

---- 関連スレ ----
Proxomitron Part 30
toro.2ch.net/test/read.cgi/win/1218905098/

■■■■Proxomitron入門スレッド■■■■6
kohada.2ch.net/test/read.cgi/pcqa/1201242934/

ニコニコ動画専用オミトロンソフト板 Part28
anago.2ch.net/test/read.cgi/software/1299494256/

175 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/04/07(土) 03:30:07.47 ID:fJZcRaNHP]
訂正 Match = "((F|he)+?)++ad(_|s)*"

176 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/04/07(土) 03:57:24.45 ID:m9PA7SqU0]
個人的には
Bounds = "<script *(^(Fads|head))*</script>"
ってしちゃうかな
速度的には不利かも知れないけど

177 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/04/07(土) 06:06:29.79 ID:I75MEUnS0]
tk誤爆大杉で実用は厳しいと思うよそれ>>169
どうせその内疲れてリスト作るだろうから最初からリストにしといた方がいいと思う
あるいは *["'.{$\s+_-]ad(s|)[0-9\s.;{+_-]* このくらいに制限しとくとか

178 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/04/07(土) 07:49:34.84 ID:cvDfDJ7C0]
>>175
なるほど、最初見たとき間違いかと思ったけど、開始位置を固定すればこれでいいんだね
この ((〜)?)++ ってパターンは応用範囲広いなあ

179 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/04/08(日) 16:37:31.57 ID:/4dhZ4Sx0]
(゚〜゚)?

180 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/04/14(土) 22:00:10.43 ID:j50UEd8Z0]
今開いているページのURLが格納されている変数はないのでしょうか?

181 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/04/14(土) 23:08:14.45 ID:j50UEd8Z0]
って\uでいいのか

182 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/04/16(月) 01:30:59.58 ID:bvKFTntl0]
よく考えたらマスターユニットは脱力出来ないな
支援でファンネル使えないし

183 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/04/16(月) 01:31:55.06 ID:bvKFTntl0]
誤爆



184 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/04/19(木) 21:54:01.82 ID:EEwMouO10]
ttp://neverdying.deviantart.com/gallery/?catpath=/
このサイトの左側に表示されている「Gallery Folders」という縦長の欄を消したいのですがどうも上手くいきません

Name = "Gallery Folders remove in deviantART"
Active = TRUE
URL = "$TYPE(htm)"
Limit = 128
Match = "<div(^(^\s[^>]++class=$AV(gr)))"
Replace = "<div style='display: none'"

すみませんが教えてください。よろしくおねがいします

185 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/04/19(木) 22:35:35.51 ID:aiGQvF2d0]
.gruze-sidebar {display:none;}?
消す場所が違う。
非表示似た要素の親で横幅指定されてる。
chromeの要素を検証とかでhtml構造見ると良いよ。

186 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/04/27(金) 00:16:08.00 ID:qfjDc8uM0]
「<b>から</b>で囲まれた語句」に対し、「この語句」に、「この語句でgoogle検索した結果へのリンク」を挿入して手動で検索する手間を省きたいです。

<b>\0</b>でマッチさせればいいとしてRelpaceはどう書けば良いのでしょうか?

187 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/04/27(金) 10:33:11.20 ID:7EKQXv/aP]
日本語でおk

<a href="www.google.co.jp/search?q=この語句">この語句でうんたらかんたら</a>
って書けばいいんじゃないの?
この語句ってなんだよ。どの語句だよ。\0か?マジで何言ってるかわからん。
あと日本語をReplaceに直接書いても通らないからちゃんとエンコードするか英語で書くようにアレして。

188 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/04/27(金) 12:55:15.04 ID:VmMTA1FY0]
はてなとかのキーワードリンクみたいに該当語句にリンクを貼りたいものの
該当語句が日本語の場合にURLエンコードで躓いたか
もしくはRelpaceに「この語句でry」をそのまま日本語で書こうとしたとエスパー

189 名前:名無しさん@お腹いっぱい。 [2012/04/28(土) 02:03:50.32 ID:wkBvN/iG0]
age

190 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/04/28(土) 18:38:39.59 ID:NNwqj3bV0]
「今開いてるページのURL」をRelpaceに含めたいんですが
そういうコマンドってないんですか?

191 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/04/28(土) 18:41:19.94 ID:rVqVJqJJ0]
proxomitron.sakura.ne.jp/help/Matching_Character_Reference.html

192 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/04/28(土) 23:46:29.89 ID:6oHAc1/Z0]
>>188
その通りです。

<b>この語句</b>

このようなページに対し、

Match
<b>\0</b>

Replace
<a href="www.google.co.jp/search?q=UTF8変換した\0">\0</a>

としたいのです。

193 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/04/29(日) 01:36:35.89 ID:dtJBE8+E0]
文字コード変換したいなら自分で変換テーブル(つーかリスト)書くしかないね
俺なら文字コード指定付けてそのままサーチエンジンに渡すけどな
あ、$ESC()も忘れるなよ



194 名前:190 mailto:sage [2012/04/29(日) 12:06:27.43 ID:TV2xj7Ie0]
>>191
ありがとうございます。
コマンドじゃなくエスケープなんですね

195 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/04/29(日) 20:29:25.54 ID:Z8ugcHsN0]
>>193
情報有り難うございます。

webos-goodies.jp/archives/50785287.html
ここを参考にして以下の記述で上手くいきました。


Match
<b>\0</b>
Replace
<a href="www.google.com/search?&hl=ja&ie=euc-jp&q=$ESC(\0)" target="_blank"><b>\0</b></a>


URL
www.google.com/search\?\&hl=ja\&ie=euc-jp\
Match
<h? class="r"><a href="\0>
Replace
<a><meta http-equiv="Refresh" content="0;URL=\0">\k



196 名前:195 mailto:sage [2012/04/29(日) 20:34:51.40 ID:Z8ugcHsN0]
本当はI'm feeling luckyも組み込みたかったのですが挫折したためフィルタを2つに分けました・・・

197 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/04/29(日) 22:27:35.56 ID:Z8ugcHsN0]
検索精度が悪かったので少し修正

Match
<b>\0</b>
Replace
<a href="www.google.com/search?&hl=ja&ie=euc-jp&sitesearch=用語集サイトURL&q=$ESC(\0)" target="_blank"><b>\0</b></a>


URL
www.google.com/search\?\&hl=ja\&ie=euc-jp\&sitesearch=用語集サイトURL
Match
<h? class="r"><a href="\0>
Replace
<a><meta http-equiv="Refresh" content="0;URL=\0">\k

198 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/04/30(月) 11:08:40.20 ID:m+S09b0Y0]
HTTP/1.0 304 Not Modified

200や304の値を編集して404にしたいのですが不可能でしょうか?
\kは使いません

199 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/04/30(月) 19:25:43.59 ID:E9FE4MMP0]
$NEST((<form)\#,(\s[^>]++id=$AV(tsf)[^>]+>)\#(*(<input\s[^>]+>)\#$SET(\#=&#8194;))+*,</form>)

上記のフィルタで元のHTML(www.google.comの検索結果)に以下のようなinput要素が含まれているとマッチしません。
<input class="lst lst-tbb" value="GLib-CRITICAL **: g_variant_new_string: assertion `string != NULL' failed" title="検索" size="41" type="text" autocomplete="off" id="lst-ib" name="q" maxlength="2048"/>

NULLの後のシングルクォートを無くすとマッチするので原因は分かったのですが、なぜこうなるのかさっぱりです。
こうなる理由とこういう場合にどう対処するのが定石なのかご存知でした教えていただけませんか?

200 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/04/30(月) 20:53:16.26 ID:JDBTn4AJ0]
マッチングコマンドやメタキャラクタの存在自体を質問したりする奴もそうなんだけどさ
ヘルプ>>6読めよ。全部書いてあるから

201 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/04/30(月) 22:05:37.31 ID:E9FE4MMP0]
>200
一通り読んで見つけたのは「"のあとの'がネストに対応している」ですが、だからと言って<input\s[^>]+>というマッチには関係ないと思うのですが……。
他に該当箇所があって見落としてしまっているのでしょうか?

202 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/04/30(月) 22:32:33.85 ID:bg8UOweB0]
<form id="tsf">
<input class="lst lst-tbb" value="GLib-CRITICAL **: g_variant_new_string: assertion `string != NULL' failed" title="検索" size="41" type="text" autocomplete="off" id="lst-ib" name="q" maxlength="2048"/>
</form>
を対象にテストするとしっかりマッチするんだけど?

1,NEST必要?formってネストしていいんだっけ?
2,</form>が\#に収められてない。
3,再現できない。リミットは?

203 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/01(火) 02:00:33.13 ID:7y6xromR0]
俺もlimitが臭いと思うね

>>202
formはネストできないことになってるし、違反しているサイトもまずないが
単に対になるタグを探す方法としても$NESTはほぼ最速かつ簡潔な書き方ができるので、よく使われる



204 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/01(火) 18:40:37.74 ID:woOVog2W0]
広告ブロックで
文字列指定でブロックできるフィルタってないですか?

例えばlistにplusone.jsとかga.jsと書いておけばブロックしてくれる感じです

205 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/01(火) 18:49:45.88 ID:T0PbaHHp0]
自分で作れ
その方が手っ取り早い

206 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/01(火) 18:51:13.98 ID:7y6xromR0]
ファイル名を指定したいなら、AdListにデフォで
# Specific pathname components (after the first "/")
こんなのがあると思うが

スクリプト内の文字列にマッチしたいならKill JavaScript Bannersあたりを改造すればいいが
ページフィルタで1文字進むごとにリストを引くのは非常に遅いので注意だ

207 名前:204 mailto:sage [2012/05/01(火) 23:32:55.13 ID:woOVog2W0]
ありがとうございます
参考になります

208 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/02(水) 01:28:46.75 ID:tF0DF1WA0]
*[_"'.{$\s+-/]ad(s|)(^l)[_0-9\s.;{+-]*

これに

.adsl.ppp.infoweb.ne.jp

がマッチしてしまうのはなぜでしょうか・・・

209 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/02(水) 01:55:21.09 ID:l6k0wK4U0]
[\s]
\とsにmatch

210 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/02(水) 02:12:42.10 ID:8MJ/wjy40]
sとSにマッチ

〜(^adsl)(ad|ads)〜 みたいに書いた方が分かりやすいかもね。

211 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/02(水) 03:19:24.52 ID:AJhEZ54B0]
(s|) の部分、最初にsの方が選ばれるけど後続パターンが失敗するから、結局空マッチの方が選ばれて
つまり ad だけが消費されて、その後ろは l じゃないから否定をすり抜けちゃうわけだ

否定マッチの位置を手前にずらす必要がある
ad(^sl)(s|) とかあるいは>>210みたいに

212 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/02(水) 21:19:45.99 ID:tF0DF1WA0]
解説ありがとうございました

213 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/02(水) 23:19:54.02 ID:ueIL9J5/0]
みんな広告除去ってどんなフィルタ使ってるの?
AD Killerに同梱のリストはほぼ使い物にならないものなのかなぁ
あれだけあるとどれが不要なのかわからん



214 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/03(木) 02:31:47.86 ID:xUwbtT0y0]
「除去」といっても対象によって手段がいくつかある。
・リクエスト遮断。\kを使う。
・IP詐称。.hostsを使う。
・不可視化。CSSを使う。
.hostsはProxomitronと関係ない。CSSはProxomitronと連携可能。

215 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/03(木) 07:19:32.85 ID:M9xxiUTp0]
完全に手製
誤爆上等だけど何が誤爆してるのかすぐわかるから問題ない

216 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/03(木) 07:35:58.05 ID:vo+Hf28d0]
自分にとって便利なように凝れば凝るほど他人にオススメできる物じゃなくなるよな

217 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/03(木) 07:44:10.11 ID:o02FgzNI0]
対象の仕様変更に弱くなるからな

218 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/03(木) 07:54:22.85 ID:a89Co9XpP]
ブラウザで管理、編集ができたら最強なのに

219 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/03(木) 08:03:59.56 ID:1rW0C1pU0]
ブラウザ側からはいじれないし覗けないってのが理想だろう

220 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/04(金) 10:40:16.60 ID:51Bbm1jC0]
お手製が一番便利だけど、最近じゃJavascriptので記述してdocument.writeとか
もろもろで追加する感じのが多いからな。
全て殺すならいいんだけど、一部だけ殺したい場合とかもあるし、
殺さないといけない部分が一部で残りは動作必要な記述だったりとかもあるし。

.scriptタグの中を調べるように記述すると、googleとかみたいにやたらscriptタグの中身が多いサイトだと、
フリーズしたかのようにCPU使用率が暫く跳ね上がって読み込みが時間かかるようになるんだけど、
軽く書ける方法あるんだろうか。
今はホワイトリストで除外してるんだけど。

221 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/04(金) 18:27:25.12 ID:6ACCgJxL0]
殺す殺さないの判定が、メソッドの引数でできるなら、メソッド自体を書き換えるスクリプトを挿入するフィルタ。
グローバルで定義するなら、1文書に1回の適用で済む。
ただし、IE9はグローバルでdocumentが定数だから、エラーになるかも試練、確認してないけど。
ローカルスコープでは問題ないらしいから、全ての "function\(\) \{" の直後に挿入するのも考えられるけど、それだとメリットはない。

222 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/06(日) 22:20:21.65 ID:xwa9QuFi0]
proxomitronのリストで管理してるからそれだと無理そうかな。
そっちの方が軽さとか考えるといいけど、汎用性も持たせると難しそうだ。

223 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/07(月) 23:02:49.71 ID:/dsrFxpt0]
[Patterns]
Name = "Google | Ajax killer test-20110528"
Active = TRUE
URL = "(^$KEYCHK(^C))www.google.co(.jp|m)/(search\? $TYPE(htm)|extern_js/f/ $TYPE(js)(^$OHDR(Referer: *\&tbm=(isch|mbl)*)))"
Limit = 300
Match = "$TYPE(js)$STOP()\k|"
"(/extern_js/f/[^.]+.js)\#$SET(#=?prox-$DTM(tc))|"
"(<a [^>]++ class=$AV(gbmt|gbzt *) [^>]++)\# onclick=$AV(*)"
"|"
"(^$URL(*\&tbo=1*))$SET(#=<script>document.location="\u&tbo=1";</script>)$STOP()|"
"(^$URL(*\&prmdo=1*))$SET(#=<script>document.location="\u&prmdo=1";</script>)$STOP()|"
"$NEST(<a [^>]++ id=$AV(showmodes|tbpi),</a>)"
Replace = "\@"


こいつが検索結果2ページ目以降では動かなくて困っています
対応版をどなたか作成して頂けないでしょうか?



224 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/09(水) 15:31:34.70 ID:c6WYdMmp0]
あるサイトでadblockが入ってると警告が出て
無効にしてから出直して来いと出るサイトがあるのですが(言うとおり無効にしても見れないっていう・・・)
そういうのを回避できるフィルタお願いします

225 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/09(水) 15:42:21.25 ID:UzgW2PsZ0]
どのサイト?URLぐらい晒しなさいよ
こういうのならある
ttp://shinshu.fm/MHz/14.30/archives/0000264243.html

226 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/09(水) 16:26:05.13 ID:QdDznKqh0]
そういうサイトってあちこちにあるもんなのか?
今まで1回しか見たこと無いからわざわざソース見るのも面倒なんで
そこだけ別のブラウザで見たが

227 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/09(水) 16:30:58.26 ID:c6WYdMmp0]
サイト名はiLix.inで
urlはttp://urlink.at/*****という形のとこです
いわゆるリンクプロテクションサイトです

226のお言うとおり今まではIEで凌いでたんですが
広告やらポップアップがひどくてかなりイライラさせられるんで・・・

228 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/09(水) 16:48:19.80 ID:c6WYdMmp0]
ついクセでurl部分隠してしまった、ごめん
ttp://urlink.at/1fdKN

229 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/09(水) 18:48:51.14 ID:WRRWgwW30]
多分adsense2.jsを読み込んだか弾いたかで判断してるだけと思う
ソースしか見てないから試してないけど
Match = "<script\stype=$AV(text/javascript)>\s+var\ adblock\s+=\s+true\s+;\s+</script>"
Replace = "<script type="text/javascript">var adblock = false;</script>"
これじゃだめかな

230 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/09(水) 19:44:52.96 ID:c6WYdMmp0]
>>229
ありがとう
でも変化なしです

231 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/09(水) 19:49:57.47 ID:WRRWgwW30]
>>230
そうかー。だったら://188.143.233.13/adz/adsense2.jsを許可してもだめ?

232 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/09(水) 20:07:30.17 ID:5ZUqoOwD0]
めんどくさいからその割り込み画面作ってるscriptを潰したほうが早い
document.write(gui);を消せば十分か、試してないけど

233 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/09(水) 21:30:09.86 ID:c6WYdMmp0]
>>231
許可というのはbypassListへ188.143.233.13/adz/adsense2.jsを追加しろということですか?
もしそうなら試しましたが変化なしでした
>>232
フィルタ作成についての知識は皆無で
もう少し具体的に教えてもらえないですか
すいません・・・



234 名前:223 mailto:sage [2012/05/10(木) 20:53:48.44 ID:ma9Z8AHt0]
>>232のアドバイス通りに書くとこんな感じでいいのか?

[Patterns]
Name = "urlink.at"
Active = TRUE
URL = "urlink.at/"
Bounds = "<script type="text/javascript">*</script>"
Limit = 3000
Match = "*document.write\(gui\);*"

235 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/10(木) 23:30:07.63 ID:TvrmaVbF0]
>>234
ありがとう
割り込み画面回避できました

236 名前:223 mailto:sage [2012/05/11(金) 02:25:48.55 ID:PKmVbqP80]
うまく動いて何より

237 名前:名無しさん@お腹いっぱい。 [2012/05/12(土) 19:17:42.14 ID:Q1Ijauz00]
置換後文字列の文字数って限界があるの?
置換後文字列を3500バイトぐらいのフィルタ作ったら末尾数バイトが消えるんだけど

238 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/12(土) 21:37:47.93 ID:Jz7lzIvB0]
俺エスパーじゃないからなぁ

239 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/12(土) 23:46:40.39 ID:RHCDG1jx0]
>>237
自分で遭遇したり確認したことはないけど、wikiによれば限界はあるようです。

240 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/17(木) 11:00:14.22 ID:2aNj0yiL0]
blog.livedoor.jp/kinisoku/archives/3393452.html
みたいなyoutube動画が大量に埋め込んであるページを貧弱なPCで踏んじゃっても
大丈夫なフィルターはないでしょうか?chrome使いです。

241 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/17(木) 12:38:45.87 ID:NemCjse60]
>>240
サムネイル付けてyoutube該当動画へのリンクにしてしまえば?

URL = "(^[^.]+.youtube.com/)"
Limit = 640
Match = "$NEST(<object,*\s(src|value)=$AV(www.youtube.com/v/([^?&]+)\1*)*,</object>)"
Replace = "<a href="www.youtube.com/watch?v=\1" target="_blank">"
"<img src="i2.ytimg.com/vi/\1/default.jpg" style="border:1px solid #333;"></a>"

242 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/17(木) 13:05:30.79 ID:8T2MBFdm0]
>>241
これはいい
横からだけどいただいた

243 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/17(木) 15:22:41.37 ID:2aNj0yiL0]
>>241
ありがとうございます。非常に快適ですw



244 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/18(金) 20:37:53.68 ID:o31yPinv0]
tr.twipple.jp/gazou/

これのソースを見ても画像タイトル名がソースに記述されていないのですが
画像タイトルでフィルタリングするにはどうすればいいのでしょうか?

具体的にはハングル語が含まれる画像が不快なので消して非表示にしたいのですが

245 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/19(土) 00:44:14.37 ID:RyTqjblK0]
復帰

246 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/19(土) 07:50:15.05 ID:OL7hxvO60]
タイトルってimg要素のalt属性のこと?

247 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/19(土) 13:45:54.29 ID:4xkOzFND0]
firefoxだが、ページのソースを見ると確かに無いのに画像付近を範囲選択して「選択した部分のソースを見る」で
見てみるとIMGタグもalt属性もしっかりある。javascriptで動的に追加されてるのかな?

248 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/19(土) 14:16:28.38 ID:R/H/IIt60]
>>244
とりあえず、どこにタイトルなどのデータが記述されているかは
ログウィンドウでアクセスしているURLを見ていれば分かると思う。

249 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/19(土) 18:21:06.10 ID:yJfT3aaE0]
httpのアクセス傍受してりゃどっかのファイルに記述されてる
あとはそこに手を加えるだけ

250 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/19(土) 23:54:18.11 ID:HA/Z9+7l0]
ログを見てもどこにも記述されていないのですが・・・

251 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/20(日) 00:03:07.23 ID:OL7hxvO60]
tr.twipple.jp/gazou/js/gazou_script2.js

252 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/20(日) 00:37:23.99 ID:/6CJP9T10]
/data/url_ranking/image/recent.js
そろそろ解答

253 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/20(日) 01:17:06.27 ID:WbpFKQow0]
[Patterns]
Name = "No Korean"
Active = TRUE
URL = "tr.twipple.jp/data/url_ranking/image/recent.js"
Bounds = "{"thumbnailUrl*},"
Limit = 1000
Match = "*([%e1][%84-%85][%80-%9f]|[%e1][%85-%86][%a0-%a2]|[%e1][%86-%87][%a8-%b9])*"

これで上手くいきました。

今度はこれを応用してメインページ側(twipple.jp/)にも適用しようと調査しているのですが、
画像自体は
s1-04.twitpicproxy.com/photos/thumb/数字.jpg?key=数字
に格納されているようなのですが本文を格納していると思われる.jsが存在していないようです

これはまた別の手法で文章表示させているのでしょうか?



254 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/21(月) 11:44:48.88 ID:MmOazDBH0]
htmlの中で、上の方のJava Scriptの定義やらなんやらをバッサリ消して、
途中の部分だけ抜き出し、そこから先をまたバッサリ削る。と言う場合、
ウェブページフィルタ は、どのような構造の物になりますでしょうか?
単一フィルターでは無理で、それぞれに分けないといけませんか?

255 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/22(火) 01:24:16.44 ID:Gy02adZy0]
はちまは前は見てたけど
もう見てないな

256 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/22(火) 01:25:04.91 ID:Gy02adZy0]
誤爆

257 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/22(火) 03:11:32.44 ID:59XO9Iu7P]
>>254
特定の部分だけを残して他を消す程度ならフィルタ1つでいけるんじゃないかな
どんなフィルタかは元のhtml次第だから具体例があった方がいい

258 名前:254 mailto:sage [2012/05/22(火) 17:19:22.93 ID:FU/yoAxd0]
>>257
ニュースサイトのニュースの部分です

ここ↓の、
mainichi.jp/sponichi/news/20120522spn00m050005000c.html

<div class="NewsBody clr">
から、
</div> <!-- NewsBody:END -->
以外の部分をバッサリと削りたいです。
<html>や、<head>は、後付けでも構いません。

よろしくお願いします。

259 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/22(火) 18:28:48.15 ID:PTP7qZGu0]
$NEST(<script,</script>)
とか指定して必要ないやつを片っ端から消していけばいい

260 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/22(火) 20:48:35.71 ID:9JiTwaGJ0]
>>258
何も考えずに作ればこれだな

Limit = 60000
Match = "(<body [^>]+>)\0*(<div class="NewsBody clr">)\1|(</div> <!-- NewsBody:END -->)\0*(</body> </html>)\1"
Replace = "\0 \1"


261 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/22(火) 20:51:33.57 ID:pi20hzK60]
頭から普通にマッチして、ケツは\kで切るのが基本

>>259
その$NESTはまずいね
</script> は普通スクリプトの中には現れないが
<script は document.write("<script〜") とかされることがよくあるので相方が見つからなくなる

262 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/22(火) 21:30:45.79 ID:3f+pRW8P0]
昔のIEは、文字列で '<script ...' 食わせるとエラ〜吐いたから、'<scr' + 'ipt ...' とかしてた筈だが、今は平気なのか?
JavaSは読み込んだその時点で実行だから、document.writeに渡した時点で、閉じタグを書き出さない限りコードは終わらないと思うが。

263 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/22(火) 22:09:06.08 ID:3f+pRW8P0]
近くのサイトのソース見たら、'<script ...<\/script>' だった、なるほど。
>>262 はスルーしてくれ。



264 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/23(水) 01:28:03.35 ID:qSfUOUmg0]
ちっとわかりにくい書き方だったね
"</scr" + "ipt>" みたいなのは、閉じタグの方にだけ行われることが多いっつーことね
なぜかというと、生の閉じタグが現れたらそこでスクリプトが終わっちゃうから
一方、開始タグには目だった害はないので、たいてい直書き

265 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/23(水) 01:48:29.93 ID:oT/GvnuB0]
ちなみに>>261のパターンってどんなの?
いまいちテストで引っかかるパターンが作れない

266 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/23(水) 02:19:38.60 ID:49S/pk/F0]
$NEST() はクオートの中は開始タグ・終了タグとして検査しないはずだから
document.write("<scirpt>");
document.write("</script>");
document.write("<scr"+"ipt>");
document.write("<"+"/script>");
とかは全部無視されると思われ。

267 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/23(水) 10:23:38.65 ID:M9UoTRzz0]
ほんとだ、>>266全部大丈夫だった。

268 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/23(水) 12:22:08.14 ID:8mb6e0we0]
>>266
おお、その挙動は知らなかった
しかしこういうケースでハマった経験が何度かあるのも事実なんだよね

多分、クォートを解釈する部分がいつもうまく動くとは限らないんじゃないかな
<script>/* I'm a comment */ document.write('<script></scr'+'ipt');</script>
こんな風にコメントの中にクォートの始まりのように見えるものがある場合とか

269 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/23(水) 12:49:51.28 ID:49S/pk/F0]
>>268
じゃあ$NEST()使わずにフィルタ書いてればいいと思うよ。

270 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/23(水) 15:34:33.10 ID:WDLgiZY50]
\"にも対応してるんだっけ?\\"があったらどうなるんだっけ、もう使ってないから忘れた。

271 名前:254 mailto:sage [2012/05/24(木) 00:30:05.47 ID:6trnY91n0]
>>260
ありがとうございました。
うまくいきました。

>>259 さんのは、そのままではだめだと言う事のようですが、
他の方々の御意見はちょっと難しくてわかりませんでした。

272 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/24(木) 14:20:27.20 ID:7R7vMDy40]
>>241
netamesi.blog.fc2.com/blog-entry-330.html
このページにも対応できないでしょうか?

273 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/24(木) 14:43:43.24 ID:IO55djKT0]
Match = "$NEST(<object,*\s(src|value)=$AV(www.youtube.com/v/([^?&]+)\1*)*,</object>)"
"|<iframe\s[^>]++src=$AV(www.youtube.com/(embed|v)/([^?&]+)\1*)[^>]+>*</iframe>"



274 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/25(金) 16:17:48.83 ID:ryq2sdn50]
ネットのチラシを集めたサイトがあって、このうちよく行く店だけを表示させたくてこういうフィルタを作ったんですが。

Name = "chirashi de setsuyaku"
Active = TRUE
URL = "$TYPE(htm)chirashi.valueinfosearch.net/area/kanagawa/fujisawa/"
Limit = 1024
Match = "((<tr><td class=$AV(name)*</tr>(<tr><td class=$AV(comment)>*</tr>)+{1,3}) && *("
"・・・ ここに消したい店の名前をUTF8エンコードして入れる ・・・"
")*)"
Replace = "\n"

name属性の tdタグに店名、それに続いて comment属性の tdタグにはチラシの詳細などが 1〜3行あって一まとまりに
なってるんですが、一まとまりにしている単位が変(構造化されてない)だからCSS改変ではやりづらい。
ちなみに店舗の順番は固定ではなく、チラシが更新された店舗が上に来るフロート式です。
(続く)


275 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/05/25(金) 16:19:04.82 ID:ryq2sdn50]
たとえば「相鉄ローゼン」のうち、湘南台店・みろく寺店 以外を消そうと考えて  ローゼン(^湘|み)  と書き、

Match = "((<tr><td class=$AV(name)*</tr>(<tr><td class=$AV(comment)>*</tr>)+{1,3}) && *("
"%e3%83%ad%e3%83%bc%e3%82%bc%e3%83%b3(^%e6%b9%98|%e3%81%bf)"
")*)"

これは意図通りに上手くいきました。

(続く)







[ 続きを読む ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<236KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef