- 1 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/04/30(金) 02:13:12 ]
- 前スレ4年間のご愛顧ありがとうございました。
昨今はe-hentai、imagefap等の強敵が現れ、ひとりHのネタ集めには世知辛い世の中であります。 そこで皆様のノウハウを今一度ここに結集させていただきたく三度、スレを立てさせてもらいました。 前スレ 連番のH画像/動画を一気にダウンロードする2 pc12.2ch.net/test/read.cgi/unix/1135533382/ 前々スレ 連番のH画像を一気にダウンロードする pc8.2ch.net/test/read.cgi/unix/979106537/
- 222 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/20(金) 21:08:55 ]
- >>221
関数を差し替えるだけ 具体的には、その部分に上書きするようにコピペ
- 223 名前:219 mailto:sage [2010/08/20(金) 21:17:07 ]
- >219 のソースは上書き。
>220 のソースは219の下に挿入か、ソース末尾に追加。 オリジナルファイル名が時々ランダムファイル名になるのは何でかね。
- 224 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/20(金) 21:26:41 ]
- 色々いじったら一つ飛ばしになった
- 225 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/21(土) 01:27:40 ]
- シェルスクリプトでよければクッソ汚い自作コード公開するけど需要ある?
- 226 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/21(土) 01:57:11 ]
- >>214
画像の方は、大体5〜9GBくらいのデータが1日で上がるぞ。
- 227 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/21(土) 19:47:32 ]
- 一部リンクがおかしいのか画像表示されないのがあるな。
ehg.plだとエラー出て終了しちゃう。 なんとかエラーでもスキップさせて継続できないかな。
- 228 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/21(土) 20:29:40 ]
- >>227
ページソース取り直してるとそのうち正しい画像リンク取れるよ。 一括でリンク集めるより、正しい画像を取得できてから次のページってした方がいいと思う。 なるべく人がデータを拾うようなフローにした方がいい。 フォーマット判定とか適当だけど、下で今のとこ平気だった(Windows cですんません) unsigned char szFormatCheck[16]; unsigned char jpegID[2] = { 0xFF, 0xD8 }; unsigned char pngID[8] = { 0x89, 0x50, 0x4E, 0x47, 0x0D, 0x0A, 0x1A, 0x0A };// { '\211', 'P', 'N', 'G', '\r', '\n', '\032', '\n' }; unsigned char gifID[3] = { 0x47, 0x49, 0x46 };// { 'G', 'I', 'F' }; ::ZeroMemory( szFormatCheck, 16 ); fpDownloadFile = _wfopen( szImageFilePath, L"rb" ); fread( szFormatCheck, 1, 8, fpDownloadFile ); fclose( fpDownloadFile ); if ( memcmp( szFormatCheck, jpegID, 2 ) != 0 ) { if ( memcmp( szFormatCheck, pngID, 8 ) != 0 ) { if ( memcmp( szFormatCheck, gifID, 3 ) != 0 ) { result = enum_RECV_IMG_FILEFORMAT_ERROR; // Jpegでもpngでもgifでも無かった } } }
- 229 名前:228 mailto:sage [2010/08/21(土) 20:36:36 ]
- >>227
ごめんなさい。ホントに画像リンクが消えてる場合あるね。 その時は、1枚の取得に1時間以上トライしてたら次ページ行くようにしてます。
- 230 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/21(土) 23:41:37 ]
- ルーターの再接続をDOSコマンドで実行できたら楽なのに。
- 231 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/22(日) 01:27:50 ]
- "C78"の検索結果がいい感じに増えてきたなぁ
- 232 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/22(日) 04:03:22 ]
- gで無い時は、lofiの/3/いけば意外とあるけど、exで画像リンク切れしてたら諦めてスキップしてます。
- 233 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/22(日) 08:13:44 ]
- ないというか、おそろしく反応がにぶい鯖があるよね。
そういうときはタイムアウトさせてlofiからとってるわ
- 234 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/22(日) 08:25:07 ]
- >>233
基本php規制が来るのは、ソースページの時だけだからプロキシはソースページ取得時だけで 画像取得は自分のIPでいいんだけど。 その状態の画像サーバーが現れる場合は、画像取得も海外の串経由で落とした方が早く落とせるよ。 重い画像サーバーのIPポートを記憶して(定期的に変わるので)、そのIPの時は串経由で落とすように実装した方がいい。
- 235 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/22(日) 11:32:50 ]
- >>230
だいたいブラウザから操作できるようになってんだろ。 hentaiにスクリプトでアクセスするのと変わらんと思うが?
- 236 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/22(日) 13:40:30 ]
- Perlの知識とかが無い俺には使い方が全く分からないです。
誰か解説を・・・(;´∀`)
- 237 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/22(日) 13:46:43 ]
- >>236
ここUNIX板なんだけど、UNIX使ってるのにperl全く使ったことないの?
- 238 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/22(日) 13:48:10 ]
- よし、ポートを開いてIPアドレスと共にログイン名とパスワードを書いてくれたまえ。
- 239 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/22(日) 14:07:07 ]
- >>232
俺は通信がらみのエラーは2分置きに3回リトライし、それでだめなら &nl=1 で取る。
- 240 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/22(日) 14:11:17 ]
- ?nl=1とかいつの間にできたんだろうな
これに気付いてから取得成功率100%になった
- 241 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/22(日) 14:23:41 ]
- >>240
ずいぶん過去。過去過ぎて過去ログ。
- 242 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/22(日) 14:35:39 ]
- >>241
俺が気づかなかっただけか… >547 名前:名無しさん@お腹いっぱい。 [sage]: 2010/03/22(月) 00:16:01 >?nl=1 > >704 名前:名無しさん@お腹いっぱい。 [sage]: 2010/03/28(日) 23:46:49 >?nl=1 は10枚程度で速攻規制かかるよね 画像URLを引き直すって言うよりはメイン鯖(gu.e-hentai.orgなど)の画像に明示的に繋げるURLだよね 串なら気にせず踏んでいいけど生IP派はできるだけ避けたほうがいい
- 243 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/22(日) 14:56:53 ]
- >235
ある程度落としたところで自動的にIP変更して規制回避出来るやん自宅警備員。
- 244 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/22(日) 15:29:52 ]
- 週末パートの自宅近衛兵だがIP変更した位で規制回避できるならこんな板立たないだろ。
- 245 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/22(日) 17:21:16 ]
- >IP変更した位で規制回避できるならこんな板立たないだろ。
BATファイル+ehg.plでDL 509エラーでmenu_right.gifを落とし始める。 ルーター再接続でIP変更 DL続行 こんな感じで作業してるけど。 ページ途中からDLできるように改造中。
- 246 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/22(日) 19:17:23 ]
- >509エラーでmenu_right.gifを落とし始める。
これって画像URL取り出しの段階で防げないっけ
- 247 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/22(日) 20:06:53 ]
- ehg.plのgetImageURLで$imageURL調べて"menu_right.gif"だったら
IP変更促してpause&再取得させれば楽になるかな?
- 248 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/22(日) 20:27:40 ]
- 改善は根本的なところから始めるべき。庇の上に建て増しても良い事無いよ。
- 249 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/22(日) 20:41:33 ]
- >>248
根本的なところって例えばどういうの?
- 250 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/22(日) 20:41:54 ]
- ehg.pl使ってないから改善のアドバイス出来ないけど
そもそも画像のファイル名かjpg.jpgとかで抽出すればmenu_right.gifは絶対出てこないはず あと確かにIP変更すれば一応その場は再DLできるけど何回もやってるとISPごと焼かれる
- 251 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/22(日) 20:47:57 ]
- >そもそも画像のファイル名かjpg.jpgとかで抽出すればmenu_right.gifは絶対出てこないはず
∧∧ ヽ(・ω・)/ ズコー \(.\ ノ 、ハ,,、
- 252 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/22(日) 20:58:10 ]
- >>251
>>13
- 253 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/22(日) 21:00:18 ]
- "menu_right.gif" などで比較しても向こうの胸先三寸でころころ変えられちゃったら面倒でしょ?
そもそも何で "menu_right.gif" を拾っちゃうのか、拾わねばならんのかその原因を突き止めて その上で全体の問題点に気づかないと手に負えなくなっちゃうよって意味で根本的と言ったのよ。 はっきり言うが自分で設計して作らんとそこから先には進めん。
- 254 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/22(日) 21:25:45 ]
- *.gifでうpしてる人もいるけどな。
- 255 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/22(日) 21:37:30 ]
- >>254
古いエロゲーのimage setで試してみたけど>>13の処理で普通に取れるけど
- 256 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/22(日) 21:51:09 ]
- >>248,253だが、DBの根幹部だろうからそうそう弄れまいと思って前スレで "[0-9a-f]{40}-" で見るべきと書いたのが私。
ちなみに"最上位のdivセクション"も私。あの後この組み合わせで引っかかってしまったのは"&"の時だけ。 固定の文字列比較は愚の骨頂だし"例外"を用意するのは美しくないと思う。
- 257 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/22(日) 22:00:52 ]
- 509はどうしたら回避できるの?
- 258 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/22(日) 22:11:11 ]
- うん、根本的かつ哲学的な質問だね。
それに対する答えは現代医学ではまだ判らないんだ。
- 259 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/22(日) 22:17:37 ]
- プログラム講座はもういいからツールくれ。
- 260 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/22(日) 22:17:51 ]
- >>256
最上位のdivセクションにこだわる理由はよくわからんが抽出方法は参考にさせてもらうわ ありがとう
- 261 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/22(日) 22:24:08 ]
- 評価するのが高々1個の<a-/a>で済むのだ。
- 262 名前:13,153 mailto:sage [2010/08/23(月) 04:39:53 ]
- >>255
あれ? lofiの仕様は変わらないけど・・・exとgは変わったよね? 今ソース見たらstyle属性見てjpg,jpeg,png,gifの拡張子チェックしてるだけな感じなんだけど。 jpg.jpgとか書いてない。 各自適当だろうから取れてるならいいけど。
- 263 名前:255 mailto:sage [2010/08/23(月) 05:11:12 ]
- >>262
今のgは"return sl("以降を見ればすぐ取れるから画像のURLを見る必要はないね exの方はそれが用意されてないので文字列のマッチで画像のURLを適当に抽出してる このやり方だとファイル名+(jpe*g.jpe*g|png.png|gif.gif)を使ったほうが楽 (大文字表記の拡張子や".jpeg"は一件も遭遇していないが念のため入れてる) ちなみにもうexしか使ってない
- 264 名前:255 mailto:sage [2010/08/23(月) 05:19:35 ]
- 書き込んでから間違いまくってることに気付いたので訂正
gの方のファイルはろくにメンテしてないので今更気付いたが"return sl("以降の画像URLだとメイン鯖叩くことになるからだめだ 画像URLの抽出もstyle="が含まれるタグ内で抽出かけた方が早いから確かに>>13の処理はもう必要ないわ…
- 265 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/23(月) 16:44:38 ]
- my $mech = WWW::Mechanize->new() ;
$mech->agent_alias( 'Windows Mozilla' ); #added こうすると幸せになれるかも(´・ω・`)
- 266 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/23(月) 18:13:27 ]
- eh鯖落ち>94.23.191.10
- 267 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/24(火) 19:41:32 ]
- 俺ここ半年以上User-Agentには
Mozilla/5.0 (PET 2001; Commodore; U; en-US) を送ってるな。
- 268 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/25(水) 01:29:06 ]
- 再現性がわからないんだがあるページで4x4で102バイトのpngが落ちてくる状況が頻発したから再取得の条件に入れといた
- 269 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/25(水) 21:54:35 ]
- 509エラー出たら15分休憩、それでも出たらさらに15分って処理いれて(2回程度で解除された)
DL止まらないようにしたけど、24時間かかって300Mぐらい。 やっぱIP更新させんとキツイか。
- 270 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/26(木) 00:07:46 ]
- ルータをネット経由で操作云々寄りは串でやった方が楽だと思うよ…
- 271 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/26(木) 01:03:59 ]
- ehg.plで串の刺し方教えてくださいませ
- 272 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/26(木) 01:38:55 ]
- >>271
>WWW::Mechanizeでプロキシは使えますか? >使えます。 >あらかじめ環境変数「HTTP_PROXY」、「HTTPS_PROXY」などにプロキシを設定しておくと、これが利用されます。 >内部ではコンストラクタ(newメソッド)内で、$self->env_proxyが呼び出されています >(これの働きはもちろん、親クラスであるLWP::UserAgentのenv_proxyメソッドと同じです)。 >最初にこれが確認されるだけで、リアルタイムで現在の環境変数を見ているわけではないことには注意してください。
- 273 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/26(木) 02:33:30 ]
- ありがとう
調べてみたけど、さっぱりわからない; 自分にはまだ早かったようです。。。
- 274 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/26(木) 10:35:36 ]
- バッチファイルに
set HTTP_PROXY=串1 ehg.pl URL1 Dir1 set HTTP_PROXY=串2 ehg.pl URL2 Dir2 って書いとけばいいんじゃないの? 1URLに100ファイル以上あると効果薄いだろうけど。
- 275 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/26(木) 14:27:29 ]
- ehg.plって初めて中身見たけど初代get.plと比べるとずいぶんコンパクトになったな
- 276 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/26(木) 14:43:08 ]
- 正に裏ってカンジね
- 277 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/26(木) 23:47:59 ]
- バッチて...TOSBAC,HITAC,AOCS...懐かしい...
- 278 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/27(金) 17:54:50 ]
- なんかしらんが今日は落ちまくってるな
- 279 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/28(土) 00:19:29 ]
- マイナーチェンジきたっぽい
うざいなぁ
- 280 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/28(土) 07:58:57 ]
- SayMove!も自動で落とせそうだけど、ネタ動画の判定無理っぽいから
メールとかで必要なインデックスだけ投げて目視で判定するしかないのか
- 281 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/28(土) 12:20:18 ]
- 難儀なことせんでも直接プロキシに接続して "GET exhentai.org/.... HTTP/1.1" すりゃ良いじゃん
と首をかしげるのは俺がphpだから?
- 282 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/29(日) 00:50:04 ]
- 生でやってたらどれくらいでアク禁になるの?
- 283 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/08/30(月) 19:00:40 ]
- NEWの位置が変わったな
- 284 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/09/01(水) 21:12:18 ]
- ehg.plかってに改造
1.>219 >220 適応 2.URLを "g.e-hentai.org/s/9cafc82564/81678-1"のタイプにも適応 3.hentaiverse.netと他のサーバーでスリープ時間変更 4.509エラー時に長期スリープ 5.DLエラー時にログファイルに記録し、次のページから続行 こんだけ改造したらソースがスパゲティーにorz 誰か要る?
- 285 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/09/01(水) 21:25:09 ]
- 一日かけてどれくらい取れるの?
生だとスリープ変えても帯域制限に引っかかるから結局遅くなると思うんだけど
- 286 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/09/01(水) 21:27:55 ]
- >>284
欲しいです!
- 287 名前:284 mailto:sage [2010/09/01(水) 22:00:17 ]
- ehg.pl改造版
ttp://www1.axfc.net/uploader/Sc/so/149212.zip バグや改善点見つけたら報告お願いします。 >一日かけてどれくらい取れるの? IP更新してスグで百数十ファイル落とすと509エラーになった。 その後は1時間に40〜80ファイルとバラバラ。 画面見て509エラーになってたらIP変更やって(日中は仕事)1000ファイルで19時間かかってた。
- 288 名前:284 mailto:sage [2010/09/01(水) 22:19:21 ]
- 追伸.
perl弄り始めて数週間なので改造部分のソースは汚いです。すいません。 スリープ時間やログファイル名等はソースのコメントを見ながら各自でいじって調整してください。
- 289 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/09/01(水) 23:32:28 ]
- あーびっくり。一瞬前スレ開いたのかと思った。
- 290 名前:名無しさん@お腹いっぱい。 [2010/09/04(土) 03:25:21 ]
- >>288
とりあえず動作確認 これ-p使える?浦島なんだが以前のplじゃプロクシ噛ませられたよな
- 291 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/09/04(土) 15:54:29 ]
- >290
使えない >271-272
- 292 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/09/04(土) 19:52:47 ]
- そか
ミジンコだからワケワカメというか 一言でいうとメンドイ感じになってしまったんだな プロクシtxt読むの便利だったのに
- 293 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/09/04(土) 20:59:23 ]
- 何言ってるのかよく判んないけど「多分僕はやればできる子」でOK?
- 294 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/09/04(土) 22:06:01 ]
- 前のehg.plではプロクシをテキストで保存したリストを読み込んで画像を落とせてたんだよ
- 295 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/09/04(土) 23:20:32 ]
- ソースあるなら自分で書き換えたらどうだ?
- 296 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/09/04(土) 23:32:15 ]
- いやいや自分では作らないからこそ自分の意思を明確に伝える努力が大切だよ。
- 297 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/09/04(土) 23:54:10 ]
- なら金払って買ってこい。
- 298 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/09/04(土) 23:56:35 ]
- ダウソ厨の考えは理解できません
ttp://sankei.jp.msn.com/affairs/crime/100831/crm1008311536016-n1.htm
- 299 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/09/05(日) 00:01:31 ]
- まあ待て。
A) そうでしたか。 私も自分で調べようと考えたのですが他愛のない技術しか持ち合わせておらず 一言で言うと調べるのが面倒臭くなったのですよ。 前のehg.plではプロクシの一覧をテキストで読む機能が便利でした。 B) そうでしたか。 作者はまだ初心者なのでオリジナルのコードを深く理解することができず 一言で言うと機能を取り込むことが面倒臭くなったのでしょう。 前のehg.plではプロクシの一覧をテキストで読む機能が便利でした。 いずれにせよ遠回しに「対応して下さい」と言ってるに違いない。 大体日本人の多くは発注下手なんだよ。
- 300 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/09/05(日) 12:36:18 ]
- >>299
ちょっと違うな。 C) 作者はWWW:Mechanizeでもproxy使えると思ってた
- 301 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/09/05(日) 20:29:40 ]
- まとめると現状でも動作は大丈夫だったが希望としては将来的にそういった機能を盛り込んでもらえると楽
一気にダウンロードするスレ的に歓迎される
- 302 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/09/05(日) 21:00:51 ]
- そだな。
技術的に面倒なことはなんもないというか この機会にsocketも覚えるんだな。 httpはrfcを読んでおくといい。
- 303 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/09/05(日) 21:18:35 ]
- みんながんばってね。
- 304 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/09/05(日) 22:00:45 ]
- 画像のURLを収集する処理と実際に画像をダウンロードする処理を別プロセスにするんだ。
収集側はギャラリー毎にスレッドを分けて共有テーブルから応答時間を基準にしたラウンド ロビンで選んだプロクシ経由で接続してURLをキューイングし、ダウンロード側はホストに 応じてスレッドを振り分けるんだ。 すげぇ効率良いぞ。 排他忘れんな。 歯磨けよ。
- 305 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/09/05(日) 22:08:01 ]
- >>304
windowsのperlでforkできんだっけ?
- 306 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/09/05(日) 22:42:10 ]
- 後の移植を考えるとプロセス間通信絡みのI/Fは自分でライブラリを書くんだ。書けるよな。
- 307 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/09/06(月) 08:46:09 ]
- 移植も何もPerlなんだしthreadsでいいじゃん。
- 308 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/09/06(月) 09:53:37 ]
- ithread ってまともに動くようになったの?
- 309 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/09/06(月) 16:09:49 ]
- 厳密にスレッド制御するならともかく
ダウンロード用にスレッド分けるくらいならithreadsで問題ない
- 310 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/09/06(月) 18:10:33 ]
- そもそもこの板の住人的にわざわざperlでやる必要あるのか?
curl+最初から入ってるコマンドの組み合わせで全部事足りるはずだけど
- 311 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/09/06(月) 18:23:02 ]
- 目についたタイトル片っ端から放り込んで3時間で1Gとかやってみたけどぶっちゃけそこまでやると目を通せないんだよね
見終わったエロ漫画とか最初の数ページ見ていいと思った奴を取得リストに貯めといて寝てる間に取っとく程度でいい
- 312 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/09/06(月) 19:02:23 ]
- >>310
perlの布教と達成感と自己満足
- 313 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/09/06(月) 19:42:40 ]
- >>310
そう単純に行かないサイトがあるからやってんじゃん?
- 314 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/09/06(月) 19:54:54 ]
- perl以外がおとなしいって言うかperlが我がもの顔をしたがるのか
いずれにせよ全力で兎を追うのが狩りの醍醐味。しかもエロバニーだ
- 315 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/09/06(月) 19:57:44 ]
- 別にrubyとかpythonとかでもいいんじゃね
- 316 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/09/06(月) 20:04:15 ]
- 文字操作に関してperlは、早々からライブラリが充実してたからな。
俺は他人のスクリプトルールで詰まったり調べるのめんどいからCでやってるけど。
- 317 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/09/06(月) 20:31:35 ]
- 今のe-hentaiは登場した当初と違ってそれほど中身は凝ってない
単に画像のURLを取り出してアクセスするよりも規制をどう回避するかに注力した方がいい
- 318 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/09/06(月) 20:51:42 ]
- >>317
そこはもう自分の中でクリアしちゃったからもんだから今暇なんだ。
- 319 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/09/06(月) 21:12:06 ]
- 元のhtmlだけ串経由で取って画像は生で取る
hentaiverseが割り当てられてるか?nl=1で取得し直した画像は串で取得(バックグラウンド実行にしていい) たったこれだけの話なのにperlで書くからややこしくなる
- 320 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/09/06(月) 21:12:15 ]
- >>311,317
自動化すると見なくなるよな。 とりあえず、タグ配置変更きたらメール飛ばして知らせるような仕組みでも追加してれば。
- 321 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/09/06(月) 21:28:54 ]
- >>319
それではややこしくない方法をご教授ください
- 322 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/09/06(月) 21:31:49 ]
- >>319
思い込み。hentaiverseでも画像だけ取りにいく分には規制のカウント外。 心配せずに直に取りにいってOK。プロクシのオーバーヘッドだけ損してるぞ。 nl=1で取りに行くのは本文なのでプロクシ経由が吉。 だからといって全部nl=1で取りに行くなよ。メインサーバが重くなるので 嫌われる。
|

|