連番のH画像/動画を一気にダウンロードする3 at UNIX
[2ch|▼Menu]
[前50を表示]
200:名無しさん@お腹いっぱい。
10/08/17 07:45:55
>>196
画像で気にするのはURLがhentaiverse.netのimage.phpの場合だけで良い。
他は帯域制限の集計に入ってないので長く待つ必要はない。一度画像の
URLを記録しながらトライしてみれ。

201:名無しさん@お腹いっぱい。
10/08/17 14:34:06
もうプログラムで落とすのが目的だからねえ。
画像なんて見ないよ。


202:名無しさん@お腹いっぱい。
10/08/17 21:30:06
とりあえずthat is itを何十冊上げれば気がすむのかと

203:名無しさん@お腹いっぱい。
10/08/19 06:19:22
一定時間毎に串を切り替えるよう組んでるせいか帯域制限は来ない
その代わり低確率で取得失敗するからチェックしないといけないけど

それより元ファイル名で保存しようとするとたまにかぶってるのがうざい…
同人CG集とかでディレクトリごとに分かれてるはずのファイルが全部トップディレクトリにぶちまけられてる状態でうpられてる

204:名無しさん@お腹いっぱい。
10/08/19 09:20:55
串ができるならリネームも15分くらいでできんじゃね?

205:名無しさん@お腹いっぱい。
10/08/19 09:34:55
>>204
とりあえずリネームはしてるんだけど元ファイル名いじると何か釈然としなくてな…
今はページ番号をファイル名の前に付けてる(1-○○とか01-○○とか)

206:名無しさん@お腹いっぱい。
10/08/19 16:57:18
しかしe-hentai(exhentai)はどんどん攻略が楽になってくな
wgetでアクセスしたら変な落書きが落ちてきて頭抱えた時代が懐かしい

207:名無しさん@お腹いっぱい。
10/08/19 18:14:49
裏e-hentaiってロリとかショタが見られるようになるだけで
それ以外は全て同じなの?
最近グラドル系の画像がほとんど消えてしまったので
もしかして裏に回ったのかなと思ってるのだが。。

208:名無しさん@お腹いっぱい。
10/08/19 19:10:43
詳しくは分からんけど運営費用がかさんで
サーバーを縮小したかららしいよ
いくつかサーバがなくなってる
和訳してググレ



209:名無しさん@お腹いっぱい。
10/08/19 20:53:33
exがいつまでザル仕様かもわからんしまた新たな規制が入るかも知れないし急ぐべきかもしれんな

210:名無しさん@お腹いっぱい。
10/08/19 20:58:53
ver.2.1にアップしないの?



211:名無しさん@お腹いっぱい。
10/08/20 15:59:03
連番でH画像をダウンロード出来るサイトを紹介するスレじゃないのかよ

212:名無しさん@お腹いっぱい。
10/08/20 17:55:29
違います

213:名無しさん@お腹いっぱい。
10/08/20 18:13:22
目的も設定せずに手段にだけ傾倒するなんて
実にオタクらしいやり方だ

214:名無しさん@お腹いっぱい。
10/08/20 18:19:08
一日でどれだけDLできるかなーと1GB以上ダウンロードした後700MB分くらいはzipで見つかるんじゃないかと気付いた

215:名無しさん@お腹いっぱい。
10/08/20 18:26:04
目的は個々人の中にあるんだよ。

216:名無しさん@お腹いっぱい。
10/08/20 18:38:11
攻略するのが目的であって、画像DLは二の次だ。


217:名無しさん@お腹いっぱい。
10/08/20 18:41:08
>>211
半角へどうぞ

218:名無しさん@お腹いっぱい。
10/08/20 20:20:44
あたらしいな

219:名無しさん@お腹いっぱい。
10/08/20 20:56:41
Perlの勉強の為に。
ファイル名を”連番.オリジナルファイル名"で保存、同名ファイルスキップ。

sub getImage
{
my $imageURL = shift or die $! ;
my $pageNow = shift or die $! ;
my $saveDir = shift or die $! ;
my $na = getImageName($imageURL);
my $name = sprintf ( "%03d.$na" , $pageNow ) ; # note: extension
print "OutPut FileName : $name \n";
chdir ("./$saveDir") ;
if( -f $name) {
print "exist $name \n";
} else {
my $mech = WWW::Mechanize->new() ;
$mech->get( $imageURL ) ;
open ( my $out , "> $name" ) or die $! ;
binmode $out ;
print $out $mech->content() ;
close ( $out ) ;
}
chdir ("..") ;
return 1 ;
}


220:219
10/08/20 20:57:33
sub getImageName
{
my $ImageUrl = shift or die $! ;
my $num = rindex($ImageUrl, '=');
my $ImageTemp = substr($ImageUrl,$num+1);
$num = rindex($ImageTemp, '/');
my $ImageName = substr($ImageTemp,$num+1);
return ($ImageName);
}
これ導入後、エラーが増えた気も…orz

221:名無しさん@お腹いっぱい。
10/08/20 21:03:49
Perlのファイルあるのは嬉しいけど、具体的な使い方の解説を頼む

222:名無しさん@お腹いっぱい。
10/08/20 21:08:55
>>221
関数を差し替えるだけ
具体的には、その部分に上書きするようにコピペ


223:219
10/08/20 21:17:07
>219 のソースは上書き。
>220 のソースは219の下に挿入か、ソース末尾に追加。

オリジナルファイル名が時々ランダムファイル名になるのは何でかね。

224:名無しさん@お腹いっぱい。
10/08/20 21:26:41
色々いじったら一つ飛ばしになった

225:名無しさん@お腹いっぱい。
10/08/21 01:27:40
シェルスクリプトでよければクッソ汚い自作コード公開するけど需要ある?

226:名無しさん@お腹いっぱい。
10/08/21 01:57:11
>>214
画像の方は、大体5〜9GBくらいのデータが1日で上がるぞ。

227:名無しさん@お腹いっぱい。
10/08/21 19:47:32
一部リンクがおかしいのか画像表示されないのがあるな。
ehg.plだとエラー出て終了しちゃう。
なんとかエラーでもスキップさせて継続できないかな。

228:名無しさん@お腹いっぱい。
10/08/21 20:29:40
>>227
ページソース取り直してるとそのうち正しい画像リンク取れるよ。
一括でリンク集めるより、正しい画像を取得できてから次のページってした方がいいと思う。
なるべく人がデータを拾うようなフローにした方がいい。

フォーマット判定とか適当だけど、下で今のとこ平気だった(Windows cですんません)

unsigned char szFormatCheck[16];
unsigned char jpegID[2] = { 0xFF, 0xD8 };
unsigned char pngID[8] = { 0x89, 0x50, 0x4E, 0x47, 0x0D, 0x0A, 0x1A, 0x0A };// { '\211', 'P', 'N', 'G', '\r', '\n', '\032', '\n' };
unsigned char gifID[3] = { 0x47, 0x49, 0x46 };// { 'G', 'I', 'F' };

::ZeroMemory( szFormatCheck, 16 );

fpDownloadFile = _wfopen( szImageFilePath, L"rb" );
fread( szFormatCheck, 1, 8, fpDownloadFile );
fclose( fpDownloadFile );

if ( memcmp( szFormatCheck, jpegID, 2 ) != 0 )
{
  if ( memcmp( szFormatCheck, pngID, 8 ) != 0 )
  {
    if ( memcmp( szFormatCheck, gifID, 3 ) != 0 )
    {
      result = enum_RECV_IMG_FILEFORMAT_ERROR; // Jpegでもpngでもgifでも無かった
    }
  }
}

229:228
10/08/21 20:36:36
>>227
ごめんなさい。ホントに画像リンクが消えてる場合あるね。
その時は、1枚の取得に1時間以上トライしてたら次ページ行くようにしてます。

230:名無しさん@お腹いっぱい。
10/08/21 23:41:37
ルーターの再接続をDOSコマンドで実行できたら楽なのに。

231:名無しさん@お腹いっぱい。
10/08/22 01:27:50
"C78"の検索結果がいい感じに増えてきたなぁ

232:名無しさん@お腹いっぱい。
10/08/22 04:03:22
gで無い時は、lofiの/3/いけば意外とあるけど、exで画像リンク切れしてたら諦めてスキップしてます。

233:名無しさん@お腹いっぱい。
10/08/22 08:13:44
ないというか、おそろしく反応がにぶい鯖があるよね。
そういうときはタイムアウトさせてlofiからとってるわ

234:名無しさん@お腹いっぱい。
10/08/22 08:25:07
>>233
基本php規制が来るのは、ソースページの時だけだからプロキシはソースページ取得時だけで
画像取得は自分のIPでいいんだけど。
その状態の画像サーバーが現れる場合は、画像取得も海外の串経由で落とした方が早く落とせるよ。
重い画像サーバーのIPポートを記憶して(定期的に変わるので)、そのIPの時は串経由で落とすように実装した方がいい。

235:名無しさん@お腹いっぱい。
10/08/22 11:32:50
>>230
だいたいブラウザから操作できるようになってんだろ。
hentaiにスクリプトでアクセスするのと変わらんと思うが?

236:名無しさん@お腹いっぱい。
10/08/22 13:40:30
Perlの知識とかが無い俺には使い方が全く分からないです。
誰か解説を・・・(;´∀`)

237:名無しさん@お腹いっぱい。
10/08/22 13:46:43
>>236
ここUNIX板なんだけど、UNIX使ってるのにperl全く使ったことないの?

238:名無しさん@お腹いっぱい。
10/08/22 13:48:10
よし、ポートを開いてIPアドレスと共にログイン名とパスワードを書いてくれたまえ。

239:名無しさん@お腹いっぱい。
10/08/22 14:07:07
>>232
俺は通信がらみのエラーは2分置きに3回リトライし、それでだめなら &nl=1 で取る。

240:名無しさん@お腹いっぱい。
10/08/22 14:11:17
?nl=1とかいつの間にできたんだろうな
これに気付いてから取得成功率100%になった

241:名無しさん@お腹いっぱい。
10/08/22 14:23:41
>>240
ずいぶん過去。過去過ぎて過去ログ。

242:名無しさん@お腹いっぱい。
10/08/22 14:35:39
>>241
俺が気づかなかっただけか…

>547 名前:名無しさん@お腹いっぱい。 [sage]: 2010/03/22(月) 00:16:01
>?nl=1
>
>704 名前:名無しさん@お腹いっぱい。 [sage]: 2010/03/28(日) 23:46:49
>?nl=1 は10枚程度で速攻規制かかるよね

画像URLを引き直すって言うよりはメイン鯖(gu.e-hentai.orgなど)の画像に明示的に繋げるURLだよね
串なら気にせず踏んでいいけど生IP派はできるだけ避けたほうがいい

243:名無しさん@お腹いっぱい。
10/08/22 14:56:53
>235
ある程度落としたところで自動的にIP変更して規制回避出来るやん自宅警備員。

244:名無しさん@お腹いっぱい。
10/08/22 15:29:52
週末パートの自宅近衛兵だがIP変更した位で規制回避できるならこんな板立たないだろ。

245:名無しさん@お腹いっぱい。
10/08/22 17:21:16
>IP変更した位で規制回避できるならこんな板立たないだろ。
BATファイル+ehg.plでDL
509エラーでmenu_right.gifを落とし始める。
ルーター再接続でIP変更
DL続行

こんな感じで作業してるけど。
ページ途中からDLできるように改造中。

246:名無しさん@お腹いっぱい。
10/08/22 19:17:23
>509エラーでmenu_right.gifを落とし始める。
これって画像URL取り出しの段階で防げないっけ

247:名無しさん@お腹いっぱい。
10/08/22 20:06:53
ehg.plのgetImageURLで$imageURL調べて"menu_right.gif"だったら
IP変更促してpause&再取得させれば楽になるかな?

248:名無しさん@お腹いっぱい。
10/08/22 20:27:40
改善は根本的なところから始めるべき。庇の上に建て増しても良い事無いよ。

249:名無しさん@お腹いっぱい。
10/08/22 20:41:33
>>248
根本的なところって例えばどういうの?

250:名無しさん@お腹いっぱい。
10/08/22 20:41:54
ehg.pl使ってないから改善のアドバイス出来ないけど
そもそも画像のファイル名かjpg.jpgとかで抽出すればmenu_right.gifは絶対出てこないはず
あと確かにIP変更すれば一応その場は再DLできるけど何回もやってるとISPごと焼かれる

251:名無しさん@お腹いっぱい。
10/08/22 20:47:57
>そもそも画像のファイル名かjpg.jpgとかで抽出すればmenu_right.gifは絶対出てこないはず
        ∧∧
       ヽ(・ω・)/   ズコー
      \(.\ ノ
    、ハ,,、 

252:名無しさん@お腹いっぱい。
10/08/22 20:58:10
>>251
>>13

253:名無しさん@お腹いっぱい。
10/08/22 21:00:18
"menu_right.gif" などで比較しても向こうの胸先三寸でころころ変えられちゃったら面倒でしょ?
そもそも何で "menu_right.gif" を拾っちゃうのか、拾わねばならんのかその原因を突き止めて
その上で全体の問題点に気づかないと手に負えなくなっちゃうよって意味で根本的と言ったのよ。

はっきり言うが自分で設計して作らんとそこから先には進めん。

254:名無しさん@お腹いっぱい。
10/08/22 21:25:45
*.gifでうpしてる人もいるけどな。

255:名無しさん@お腹いっぱい。
10/08/22 21:37:30
>>254
古いエロゲーのimage setで試してみたけど>>13の処理で普通に取れるけど

256:名無しさん@お腹いっぱい。
10/08/22 21:51:09
>>248,253だが、DBの根幹部だろうからそうそう弄れまいと思って前スレで "[0-9a-f]{40}-" で見るべきと書いたのが私。
ちなみに"最上位のdivセクション"も私。あの後この組み合わせで引っかかってしまったのは"&"の時だけ。
固定の文字列比較は愚の骨頂だし"例外"を用意するのは美しくないと思う。

257:名無しさん@お腹いっぱい。
10/08/22 22:00:52
509はどうしたら回避できるの?


258:名無しさん@お腹いっぱい。
10/08/22 22:11:11
うん、根本的かつ哲学的な質問だね。
それに対する答えは現代医学ではまだ判らないんだ。

259:名無しさん@お腹いっぱい。
10/08/22 22:17:37
プログラム講座はもういいからツールくれ。

260:名無しさん@お腹いっぱい。
10/08/22 22:17:51
>>256
最上位のdivセクションにこだわる理由はよくわからんが抽出方法は参考にさせてもらうわ
ありがとう

261:名無しさん@お腹いっぱい。
10/08/22 22:24:08
評価するのが高々1個の<a-/a>で済むのだ。

262:13,153
10/08/23 04:39:53
>>255
あれ?
lofiの仕様は変わらないけど・・・exとgは変わったよね?
今ソース見たらstyle属性見てjpg,jpeg,png,gifの拡張子チェックしてるだけな感じなんだけど。
jpg.jpgとか書いてない。
各自適当だろうから取れてるならいいけど。

263:255
10/08/23 05:11:12
>>262
今のgは"return sl("以降を見ればすぐ取れるから画像のURLを見る必要はないね

exの方はそれが用意されてないので文字列のマッチで画像のURLを適当に抽出してる
このやり方だとファイル名+(jpe*g.jpe*g|png.png|gif.gif)を使ったほうが楽
(大文字表記の拡張子や".jpeg"は一件も遭遇していないが念のため入れてる)
ちなみにもうexしか使ってない

264:255
10/08/23 05:19:35
書き込んでから間違いまくってることに気付いたので訂正

gの方のファイルはろくにメンテしてないので今更気付いたが"return sl("以降の画像URLだとメイン鯖叩くことになるからだめだ
画像URLの抽出もstyle="が含まれるタグ内で抽出かけた方が早いから確かに>>13の処理はもう必要ないわ…

265:名無しさん@お腹いっぱい。
10/08/23 16:44:38
my $mech = WWW::Mechanize->new() ;
$mech->agent_alias( 'Windows Mozilla' ); #added

こうすると幸せになれるかも(´・ω・`)

266:名無しさん@お腹いっぱい。
10/08/23 18:13:27
eh鯖落ち>94.23.191.10

267:名無しさん@お腹いっぱい。
10/08/24 19:41:32
俺ここ半年以上User-Agentには
Mozilla/5.0 (PET 2001; Commodore; U; en-US)
を送ってるな。

268:名無しさん@お腹いっぱい。
10/08/25 01:29:06
再現性がわからないんだがあるページで4x4で102バイトのpngが落ちてくる状況が頻発したから再取得の条件に入れといた

269:名無しさん@お腹いっぱい。
10/08/25 21:54:35
509エラー出たら15分休憩、それでも出たらさらに15分って処理いれて(2回程度で解除された)
DL止まらないようにしたけど、24時間かかって300Mぐらい。

やっぱIP更新させんとキツイか。


270:名無しさん@お腹いっぱい。
10/08/26 00:07:46
ルータをネット経由で操作云々寄りは串でやった方が楽だと思うよ…

271:名無しさん@お腹いっぱい。
10/08/26 01:03:59
ehg.plで串の刺し方教えてくださいませ

272:名無しさん@お腹いっぱい。
10/08/26 01:38:55
>>271
>WWW::Mechanizeでプロキシは使えますか?

>使えます。
>あらかじめ環境変数「HTTP_PROXY」、「HTTPS_PROXY」などにプロキシを設定しておくと、これが利用されます。
>内部ではコンストラクタ(newメソッド)内で、$self->env_proxyが呼び出されています
>(これの働きはもちろん、親クラスであるLWP::UserAgentのenv_proxyメソッドと同じです)。
>最初にこれが確認されるだけで、リアルタイムで現在の環境変数を見ているわけではないことには注意してください。

273:名無しさん@お腹いっぱい。
10/08/26 02:33:30
ありがとう
調べてみたけど、さっぱりわからない;
自分にはまだ早かったようです。。。

274:名無しさん@お腹いっぱい。
10/08/26 10:35:36
バッチファイルに

set HTTP_PROXY=串1
ehg.pl URL1 Dir1

set HTTP_PROXY=串2
ehg.pl URL2 Dir2

って書いとけばいいんじゃないの?

1URLに100ファイル以上あると効果薄いだろうけど。


275:名無しさん@お腹いっぱい。
10/08/26 14:27:29
ehg.plって初めて中身見たけど初代get.plと比べるとずいぶんコンパクトになったな

276:名無しさん@お腹いっぱい。
10/08/26 14:43:08
正に裏ってカンジね

277:名無しさん@お腹いっぱい。
10/08/26 23:47:59
バッチて...TOSBAC,HITAC,AOCS...懐かしい...

278:名無しさん@お腹いっぱい。
10/08/27 17:54:50
なんかしらんが今日は落ちまくってるな

279:名無しさん@お腹いっぱい。
10/08/28 00:19:29
マイナーチェンジきたっぽい
うざいなぁ

280:名無しさん@お腹いっぱい。
10/08/28 07:58:57
SayMove!も自動で落とせそうだけど、ネタ動画の判定無理っぽいから
メールとかで必要なインデックスだけ投げて目視で判定するしかないのか

281:名無しさん@お腹いっぱい。
10/08/28 12:20:18
難儀なことせんでも直接プロキシに接続して "GET URLリンク(exhentai.org) HTTP/1.1" すりゃ良いじゃん
と首をかしげるのは俺がphpだから?


282:名無しさん@お腹いっぱい。
10/08/29 00:50:04
生でやってたらどれくらいでアク禁になるの?

283:名無しさん@お腹いっぱい。
10/08/30 19:00:40
NEWの位置が変わったな

284:名無しさん@お腹いっぱい。
10/09/01 21:12:18
ehg.plかってに改造

1.>219 >220 適応
2.URLを "URLリンク(g.e-hentai.org)"のタイプにも適応
3.hentaiverse.netと他のサーバーでスリープ時間変更
4.509エラー時に長期スリープ
5.DLエラー時にログファイルに記録し、次のページから続行

こんだけ改造したらソースがスパゲティーにorz
誰か要る?

285:名無しさん@お腹いっぱい。
10/09/01 21:25:09
一日かけてどれくらい取れるの?
生だとスリープ変えても帯域制限に引っかかるから結局遅くなると思うんだけど

286:名無しさん@お腹いっぱい。
10/09/01 21:27:55
>>284
欲しいです!


287:284
10/09/01 22:00:17
ehg.pl改造版
URLリンク(www1.axfc.net)
バグや改善点見つけたら報告お願いします。


>一日かけてどれくらい取れるの?
IP更新してスグで百数十ファイル落とすと509エラーになった。
その後は1時間に40〜80ファイルとバラバラ。
画面見て509エラーになってたらIP変更やって(日中は仕事)1000ファイルで19時間かかってた。


288:284
10/09/01 22:19:21
追伸.
perl弄り始めて数週間なので改造部分のソースは汚いです。すいません。
スリープ時間やログファイル名等はソースのコメントを見ながら各自でいじって調整してください。


289:名無しさん@お腹いっぱい。
10/09/01 23:32:28
あーびっくり。一瞬前スレ開いたのかと思った。

290:名無しさん@お腹いっぱい。
10/09/04 03:25:21
>>288
とりあえず動作確認
これ-p使える?浦島なんだが以前のplじゃプロクシ噛ませられたよな

291:名無しさん@お腹いっぱい。
10/09/04 15:54:29
>290
使えない


>271-272

292:名無しさん@お腹いっぱい。
10/09/04 19:52:47
そか
ミジンコだからワケワカメというか
一言でいうとメンドイ感じになってしまったんだな
プロクシtxt読むの便利だったのに

293:名無しさん@お腹いっぱい。
10/09/04 20:59:23
何言ってるのかよく判んないけど「多分僕はやればできる子」でOK?

294:名無しさん@お腹いっぱい。
10/09/04 22:06:01
前のehg.plではプロクシをテキストで保存したリストを読み込んで画像を落とせてたんだよ


295:名無しさん@お腹いっぱい。
10/09/04 23:20:32
ソースあるなら自分で書き換えたらどうだ?

296:名無しさん@お腹いっぱい。
10/09/04 23:32:15
いやいや自分では作らないからこそ自分の意思を明確に伝える努力が大切だよ。

297:名無しさん@お腹いっぱい。
10/09/04 23:54:10
なら金払って買ってこい。

298:名無しさん@お腹いっぱい。
10/09/04 23:56:35
ダウソ厨の考えは理解できません

URLリンク(sankei.jp.msn.com)

299:名無しさん@お腹いっぱい。
10/09/05 00:01:31
まあ待て。

A)
そうでしたか。
私も自分で調べようと考えたのですが他愛のない技術しか持ち合わせておらず
一言で言うと調べるのが面倒臭くなったのですよ。
前のehg.plではプロクシの一覧をテキストで読む機能が便利でした。

B)
そうでしたか。
作者はまだ初心者なのでオリジナルのコードを深く理解することができず
一言で言うと機能を取り込むことが面倒臭くなったのでしょう。
前のehg.plではプロクシの一覧をテキストで読む機能が便利でした。

いずれにせよ遠回しに「対応して下さい」と言ってるに違いない。
大体日本人の多くは発注下手なんだよ。

300:名無しさん@お腹いっぱい。
10/09/05 12:36:18
>>299
ちょっと違うな。

C)
作者はWWW:Mechanizeでもproxy使えると思ってた


301:名無しさん@お腹いっぱい。
10/09/05 20:29:40
まとめると現状でも動作は大丈夫だったが希望としては将来的にそういった機能を盛り込んでもらえると楽
一気にダウンロードするスレ的に歓迎される

302:名無しさん@お腹いっぱい。
10/09/05 21:00:51
そだな。
技術的に面倒なことはなんもないというか
この機会にsocketも覚えるんだな。
httpはrfcを読んでおくといい。


303:名無しさん@お腹いっぱい。
10/09/05 21:18:35
みんながんばってね。

304:名無しさん@お腹いっぱい。
10/09/05 22:00:45
画像のURLを収集する処理と実際に画像をダウンロードする処理を別プロセスにするんだ。
収集側はギャラリー毎にスレッドを分けて共有テーブルから応答時間を基準にしたラウンド
ロビンで選んだプロクシ経由で接続してURLをキューイングし、ダウンロード側はホストに
応じてスレッドを振り分けるんだ。
すげぇ効率良いぞ。
排他忘れんな。
歯磨けよ。

305:名無しさん@お腹いっぱい。
10/09/05 22:08:01
>>304
windowsのperlでforkできんだっけ?


306:名無しさん@お腹いっぱい。
10/09/05 22:42:10
後の移植を考えるとプロセス間通信絡みのI/Fは自分でライブラリを書くんだ。書けるよな。

307:名無しさん@お腹いっぱい。
10/09/06 08:46:09
移植も何もPerlなんだしthreadsでいいじゃん。

308:名無しさん@お腹いっぱい。
10/09/06 09:53:37
ithread ってまともに動くようになったの?


309:名無しさん@お腹いっぱい。
10/09/06 16:09:49
厳密にスレッド制御するならともかく
ダウンロード用にスレッド分けるくらいならithreadsで問題ない

310:名無しさん@お腹いっぱい。
10/09/06 18:10:33
そもそもこの板の住人的にわざわざperlでやる必要あるのか?
curl+最初から入ってるコマンドの組み合わせで全部事足りるはずだけど

311:名無しさん@お腹いっぱい。
10/09/06 18:23:02
目についたタイトル片っ端から放り込んで3時間で1Gとかやってみたけどぶっちゃけそこまでやると目を通せないんだよね
見終わったエロ漫画とか最初の数ページ見ていいと思った奴を取得リストに貯めといて寝てる間に取っとく程度でいい

312:名無しさん@お腹いっぱい。
10/09/06 19:02:23
>>310
perlの布教と達成感と自己満足


313:名無しさん@お腹いっぱい。
10/09/06 19:42:40
>>310
そう単純に行かないサイトがあるからやってんじゃん?

314:名無しさん@お腹いっぱい。
10/09/06 19:54:54
perl以外がおとなしいって言うかperlが我がもの顔をしたがるのか
いずれにせよ全力で兎を追うのが狩りの醍醐味。しかもエロバニーだ

315:名無しさん@お腹いっぱい。
10/09/06 19:57:44
別にrubyとかpythonとかでもいいんじゃね

316:名無しさん@お腹いっぱい。
10/09/06 20:04:15
文字操作に関してperlは、早々からライブラリが充実してたからな。
俺は他人のスクリプトルールで詰まったり調べるのめんどいからCでやってるけど。

317:名無しさん@お腹いっぱい。
10/09/06 20:31:35
今のe-hentaiは登場した当初と違ってそれほど中身は凝ってない
単に画像のURLを取り出してアクセスするよりも規制をどう回避するかに注力した方がいい

318:名無しさん@お腹いっぱい。
10/09/06 20:51:42
>>317
そこはもう自分の中でクリアしちゃったからもんだから今暇なんだ。

319:名無しさん@お腹いっぱい。
10/09/06 21:12:06
元のhtmlだけ串経由で取って画像は生で取る
hentaiverseが割り当てられてるか?nl=1で取得し直した画像は串で取得(バックグラウンド実行にしていい)
たったこれだけの話なのにperlで書くからややこしくなる

320:名無しさん@お腹いっぱい。
10/09/06 21:12:15
>>311,317
自動化すると見なくなるよな。
とりあえず、タグ配置変更きたらメール飛ばして知らせるような仕組みでも追加してれば。

321:名無しさん@お腹いっぱい。
10/09/06 21:28:54
>>319
それではややこしくない方法をご教授ください


322:名無しさん@お腹いっぱい。
10/09/06 21:31:49
>>319
思い込み。hentaiverseでも画像だけ取りにいく分には規制のカウント外。
心配せずに直に取りにいってOK。プロクシのオーバーヘッドだけ損してるぞ。
nl=1で取りに行くのは本文なのでプロクシ経由が吉。

だからといって全部nl=1で取りに行くなよ。メインサーバが重くなるので
嫌われる。

323:名無しさん@お腹いっぱい。
10/09/06 21:39:49
>>320はタグの配置が変わった程度でコケる可哀相な仕様なの?

324:名無しさん@お腹いっぱい。
10/09/06 21:42:40
>>323
神仕様おせーて

325:名無しさん@お腹いっぱい。
10/09/06 21:54:57
>>323 自分で考え出して悦に入るのも醍醐味じゃ、ほっほっほ。

326:名無しさん@お腹いっぱい。
10/09/06 22:11:42
「醍醐」は牛や羊の乳を精製する五段階の最終過程を意味し、その汁は甘く濃厚という。
転じて「本来の愉悦」をさして「醍醐味」と呼ぶようになったのはおそらく豆であろう。

327:名無しさん@お腹いっぱい。
10/09/06 22:23:29
perl開発ユーザー以外は全く公開しないな。


328:名無しさん@お腹いっぱい。
10/09/06 22:25:40
>>327
んじゃ別の言語のを公開してみ。

329:名無しさん@お腹いっぱい。
10/09/06 22:36:51
日本語ツール
ソース

「ウpレカス」

330:名無しさん@お腹いっぱい。
10/09/06 22:40:26
ミジンコ的には何で開発しようが適当にリドミ読んで理解できて楽に一気にダウンロードできりゃ問題ない

331:名無しさん@お腹いっぱい。
10/09/06 22:41:56
スレ的にはそういうスレだ

332:名無しさん@お腹いっぱい。
10/09/06 22:42:12
>>330
ミジンコどころか……


割れ神(ピラミッドの頂点=神)
      ↑
    放流厨←─┐
      ↑        │
┌→吸出し厨 ┐ウイルス厨
│          │
├→購入厨─┤
│          │
└─販売厨←┘
    ↓  ↑
    卸し厨
    ↓  ↑
    製造厨
    ↓  ↑
    開発厨(食われるだけの存在=ミジンコ)


333:名無しさん@お腹いっぱい。
10/09/06 22:53:31
実はperl使い以外はperlは過去の産物、寄って集って拡張した挙句に
ぐちょぐちょになって言語と呼ぶには恥ずかしい化け物に成り果て
「perlを書いて一人前」と勘違いして泥沼に嵌り顎まで漬かってなお
あがいている奴が哀れでならないと思っている。

334:名無しさん@お腹いっぱい。
10/09/06 22:59:12
perl使い叩きのスレはここですか?

335:名無しさん@お腹いっぱい。
10/09/07 08:40:23
ほとんどのヒトはその時に一番使いやすい言語でやればいいだけと思っているので
言語にいちいち文句言ってるやつが哀れでならないと思っている。

336:名無しさん@お腹いっぱい。
10/09/07 11:14:16
生み出されれば使うだけ
叩かない、使って落とせりゃおk
いちいち言語とか気にしてるのは残念な人

337:名無しさん@お腹いっぱい。
10/09/07 13:33:58
perlでやればパイプを一杯使わなくても文字の操作が一発でできる
しかしperlモジュールでダウンロードするよりcurlとかwgetでやった方がお手軽に各種設定ができる
今のehg.plの欠点は効率的な串の使い方が出来ないことなので後者が提案された

この辺が落とし所かと

338:名無しさん@お腹いっぱい。
10/09/07 18:37:25
公開されてるツールがperl版しかない。
スクリプト言語だから読めれば改造が楽。
一から作るより既存のツールいじったほうが楽。

故にperl版使用。

ただニワカperlユーザーだから大きくソース改変するほどの知識が…。

339:名無しさん@お腹いっぱい。
10/09/08 09:49:43
作者がwindowsだからperlだけで書いてるだけじゃね?
windowsでUNIX/LINUX環境整えるのはめどいし。
perlとかの言語だけならそのインタプリタ入れるだけで
間口がUNIX以外にも広がるじゃん

340:名無しさん@お腹いっぱい。
10/09/08 10:39:37
言語に優劣は無いがユーザーに優劣は存在する。


ダメ出ししかしないクズは氏ネ。

341:名無しさん@お腹いっぱい。
10/09/08 12:39:40
そういや最初のget.plもUNIXで動かすとディレクトリのパーミッションでこけてたな
ここってWinユーザー多いのかもな

342:名無しさん@お腹いっぱい。
10/09/08 17:30:00
そんなに串.txt読みに行かせるのって難しいの?
当時それができたplがあったけど、それうpっても参考にはならんか

343:名無しさん@お腹いっぱい。
10/09/08 18:32:57
文句言うなら使わないか、自分で何とかしろ。
慈善事業じゃねえんだ。

344:名無しさん@お腹いっぱい。
10/09/08 19:05:41
自分で何とかしてるけどこうしたらいいんじゃないかと提案しただけ

345:名無しさん@お腹いっぱい。
10/09/08 19:19:59
すれ違う想い

346:名無しさん@お腹いっぱい。
10/09/08 21:23:30
>342
うp希望。

347:名無しさん@お腹いっぱい。
10/09/09 22:19:49
このスレ怖い

348:名無しさん@お腹いっぱい。
10/09/09 23:31:29
ははは何言ってんだい
スレが怖いんじゃねえ
板が怖いんだ

349:名無しさん@お腹いっぱい。
10/09/09 23:33:05
頭痛が痛い

350:名無しさん@お腹いっぱい。
10/09/09 23:42:29
ま、まんじゅうなんて別に怖くなんかないんだからねっ!
だからさっさとまんじゅうもってきなさいよ!


351:名無しさん@お腹いっぱい。
10/09/10 00:19:13
ここらでひとつ、おまえがイタい。

352:名無しさん@お腹いっぱい。
10/09/10 09:44:26
>>342
>そんなに串.txt読みに行かせるのって難しいの?

epiphanyで在れば読める可能性は在るかも知れ無いですね…

353:名無しさん@お腹いっぱい。
10/09/10 11:01:53
ファイルアクセスは基本面倒。
既存ファイル?新規?追記?上書き?テキスト?バイナリー?
形式あってる?読み込みバッファのオーバーフロー大丈夫?
文字コードは?

難しいわけではないけど面倒。

354:名無しさん@お腹いっぱい。
10/09/10 12:09:55
シェルでやりゃいいじゃねえか
この板に来たのも何かの縁だしcygwinなりcoLinuxなり入れろよ

355:名無しさん@お腹いっぱい。
10/09/10 12:23:39
なにそれこわい

356:名無しさん@お腹いっぱい。
10/09/11 21:04:32
自分は今までスクリプト起動時にプロクシリストを読んで随時切り替えながら
処理結果からプロクシを採点して次に使う際の基準にしてたんだ。
でも複数を同時に起動したとき互いの採点が共有できないのが難点。
スクリプトも標準入力から複数のギャラリーを繰り返し入力できるものの
閉じたとき学習結果を保存せず毎回ゼロからスタートしちゃうのも難点。

んでここに触発されて今日'プロクシ選択サーバ'を書いたよ。スクリプトでね。
socket通信なのでサーバはどこにでも置ける。スクリプトは毎回サーバから
プロクシをチェックアウトし、htmlを読んだら結果と共にチェックイン。
サーバがチェック時間や処理結果から重み付けを更新して適宜ファイルに反映。
動的な追加削除もできるようにした。これで同じプロクシを頻繁に選んじゃう
こともないし状態も共有できる上に学習速度も速いだろうと期待。

リスト自体は前から別スクリプトでcybersyndromeを読み応答が良好でhentaiに
繋がって且つ弾かれないものを収集して作ってる。この収集だけで小一時間
かかるのが面倒で、作ったら一週間程継続使用してる。
ちなみに'chunked'なんてものがあるってのはそこで初めて知った。

だが断る。

357:名無しさん@お腹いっぱい。
10/09/11 21:18:06
そこまでエロにこだわる執念の恐ろしさを知った…
俺も5年くらい前まではそうだったかも試練けど、最近は丸くなったな思うよ。

358:名無しさん@お腹いっぱい。
10/09/11 21:31:06
うん、何かにつけて凄い凝り性なんだ。
極みまで達した日には飽きもするんだろうけど
少しも青二才から抜け出せた気がしないんだよね。

359:名無しさん@お腹いっぱい。
10/09/11 22:25:03
httpdの勉強になって良いよな。

360:名無しさん@お腹いっぱい。
10/09/11 22:33:25
んじゃあその熱意に応じて

普通のプロキシは良いものを選んでも気がつくと使えなくなっていることが多い
また速度との兼ね合いからある特定のプロキシに群がることが多い
その点、Torを使えば、ほぼ100%の確率で接続が有効で、潤沢にある中からランダムに割り当てられたプロキシが取得できる
規制されたり極度に遅い串に当たったら、その出口ノードを排除する設定にして再起動することでノードの引き直しができる

Torはデータディレクトリとポート割り当てさえ変えれば多重に起動できる
またTorポート一つにつきsocksからhttpに変換するためのソフトを一つ起動する必要がある

361:名無しさん@お腹いっぱい。
10/09/11 22:50:28
だがその勉強で収入が上がるかといえばそんなことはない

362:名無しさん@お腹いっぱい。
10/09/11 23:00:52
>>359
今回のサーバは別にhttpを使ってる訳ではないが、まあ画像をデータベース化して
ブラウザから検索閲覧できる自前のhttpサーバはhentaiとセットで使ってる。
さすがにスクリプトではないけど。
>>360
へぇ面白そうだね。P2Pってところは反射で気になるけど。
>>361
収入はさておき会議と納期と折衝とSPICEと金勘定でがんじがらめの仕事に比べたら
好き勝手できるここは天国だよ。明日への活力ってところか。

363:名無しさん@お腹いっぱい。
10/09/12 13:47:30
なんか臭くなってきたな

364:名無しさん@お腹いっぱい。
10/09/12 15:10:51
今時は分析と設計だけ日本でやって下流の工程は中国に投げちゃうからね。
「俺も書きてぇ」っていう欲求不満はこんな所でしか晴らせないよな。

365:名無しさん@お腹いっぱい。
10/09/12 15:42:11
串リストの入手が面倒であきらめ。

URLリンク(www.multiproxy.org)
ここのリストからいくつか適当に選んで"LANの設定"のプロクシサーバーにセットしてみたけど無効なのばっかりだった。

366:名無しさん@お腹いっぱい。
10/09/12 17:33:19
IEでOKボタンいっぱい押しながら試したりして大変だったね。
自分ならtelnetでHTTP送ってみるかな。

367:名無しさん@お腹いっぱい。
10/09/12 21:57:54
>>365
笑えよ。"updated: 11-Feb-2009" だってさ。

368:名無しさん@お腹いっぱい。
10/09/12 22:34:41
串なんてツールで使えるS判定のコピペるだけ
それをtxtにして読みに行かせれば・・・出来たわけだし

369:名無しさん@お腹いっぱい。
10/09/13 21:41:56
1.プロクシリストから1行読み込み
2."http://"付けて $ENV{HTTP_PROXY} にセット
3.$mech = WWW::Mechanize->new()
4.$mech->get() 成功!

5.リストから次のプロクシ読み込み
6."http://"付けて $ENV{HTTP_PROXY} にセット
7.$mech->get() 失敗!
8.エラーコードは200

HTTPステータスコード
>200 OK
>OK。リクエストは成功し、レスポンスとともに要求に応じた情報が返される。
ブラウザでページが正しく表示された場合は、ほとんどがこのステータスコードを返している。

370:369
10/09/13 21:45:34
途中で送っちゃったorz
6と7の間に$mech = WWW::Mechanize->new()入れ忘れてるし。

で、
9. 以後5〜8を繰り返し

なんか初期化処理必要なのか?

371:369
10/09/13 21:54:42
orz
$@ を$!と書き間違えてた・・・

なんとかなりそう。
ただ元のソースいじり過ぎてスパゲティ状態(URLリストファイル対応、自動題名取得、エラーファイル再取得バッチ出力)
何処に追記すればいいのやらorz

372:名無しさん@お腹いっぱい。
10/09/13 22:46:22
いろいろ試行錯誤紆余曲折してるようだけど
proxyが a.b.c.d:p とするとポートpでa.b.c.dに接続して

GET URLリンク(exhentai.org) HTTP/1.1<cr><lf>
Host: a.b.d.d:p<cr><lf>
User-Agent: Mozilla/5.0<cr><lf>
Accept: text/html,*/*<cr><lf>
Accept-Encoding: gzip<cr><lf>
Connection: Close<cr><lf>
Cookie: ipb_member_id=1<cr><lf>
<cr><lf>

なり送れば済むんじゃないかい? Mechanizeは強力なんだろうけど
袋とじを開けようとしてチェンソーに振り回されているみたいだよ。
>>281は言いたかったと思う。

ついでに "RFC 2616" で検索したものを読んどいた方がいいと思う。
>>302も言いたかったと思う。

373:名無しさん@お腹いっぱい。
10/09/14 03:42:24
あまりにも大量すぎて画像の状態だと管理できなくなってきたのでtarで固めてcomixで読むことにした

374:名無しさん@お腹いっぱい。
10/09/14 09:57:20
1日に300以上あげられてるからなぁ

375:名無しさん@お腹いっぱい。
10/09/14 18:39:37
自分で固めたなら問題ないと思うけど、comixってパスワード付き書庫開くとX道連れにしない?
ctrl+alt+f1の画面でパスワード入力を受け付けるプロンプトが出てるみたいだけどパスワード入れてもだめ

376:名無しさん@お腹いっぱい。
10/09/14 20:12:34
>>375
うわ マジか
同人誌はzip配布の場所では取ってないから試したことなかった。気を付ける

最初はtar.gzかzipで固めてたんだけどふとtarでいいじゃんって思って試したら使えたので全部tarにしてしまった
もともと中身全部圧縮済み画像だからファイルサイズも大して変わらんし(当然だが)tarの方が展開速度が明らかに速い
似たような理由でWindowsだと無圧縮zipが使われてるらしいな

今までcomixってイマイチなソフトだなぁと思ってたんだがアーカイブ対応ビューワとしては及第点かな…

377:名無しさん@お腹いっぱい。
10/09/16 19:21:38
保守

378:名無しさん@お腹いっぱい。
10/09/18 20:23:34
Proxyテストプログラム
URLリンク(www1.axfc.net)

g.e-hentai.orgにアクセス出来るかテストするツール。

379:名無しさん@お腹いっぱい。
10/09/20 12:24:02
物色したギャラリーやページを待ち行列に追加する手作業が面倒だったんだけど
ブラウザの「リンクのURLをメールで送信」で自前のプログラムに渡せば楽チンって気が付いた。
Firefoxの拡張を自分で書ければ一番いいんだけど。

380:名無しさん@お腹いっぱい。
10/09/21 12:25:06
なかなかうまくスクレイピングできないなーと思ってぐぐったら
他の方々も苦労してらっしゃったのですね…

もう中身とかどうでもいいからいかに完璧にダウンロードできるかを極めたい。
今は普通にスクレイピングしながら509くらったら串きりかえしてるんだけど
すぐ串が足りなくなってしまう…

381:名無しさん@お腹いっぱい。
10/09/21 12:47:07
取得失敗対策もやって100%取れるようになったけど
一つだけハマったのはうpの段階で途切れたり壊れてるjpgがある

382:名無しさん@お腹いっぱい。
10/09/21 13:12:47
以前の串対応plが神過ぎたんだな

383:名無しさん@お腹いっぱい。
10/09/21 15:04:25
>>381
実際のダウンロードデータのサイズとContents-Lengthの比較はしてる?

384:名無しさん@お腹いっぱい。
10/09/21 15:48:21
>>383
してない
imagemagickの適当な処理に通してエラーが出たら三回まで再試行してる

385:名無しさん@お腹いっぱい。
10/09/21 17:23:07
途中で途切れるjpegは、重い画像サーバーに当たってるかもね。
レジュームリクエストするか長めのウェイトで必ず全データとれるよ。

386:名無しさん@お腹いっぱい。
10/09/21 18:04:32
多分ファイルが壊れてると思うけどなぁ
試行ごとに鯖が変わってるのも確かめたし?nl=1も試したが全部同じところで途切れてる
ついでにギャラリーのページでサムネイルもチェックしたが全く同じところで途切れてる

まぁそういうのは滅多にないから気にしないほうがいいか…
俺はconvertに通してstderrに何か出るようなら再取得するようにしてるけど
元から破損してる場合はContent-Lengthでチェックした方がちゃんと取れると思う

387:名無しさん@お腹いっぱい。
10/09/21 21:17:05
>287 と >378 を組み合わせて509出る度にプロクシ変えるよう改造した。
合計16時間ほどまわして1.15G(約3600ファイル)落ちた。
66ファイル 500:ERROR GETing 出てるけど。

388:名無しさん@お腹いっぱい。
10/09/21 21:31:37
66ファイルは取得ミス?
だとしたらちょっと多いな。500エラーだったら?nl=1につなぎ直せば回避できる気がする
速度的にはそんなもんが関の山だと思う
(串無しで画像に繋げばもっと速くなるがぶっちゃけ速くする必要もないし管理者にバレないという保証もないので)

389:名無しさん@お腹いっぱい。
10/09/21 22:05:26
速くなってありがたかったといえば無人稼動が無くなったこと位かな。

390:名無しさん@お腹いっぱい。
10/09/22 00:26:41
串通して落としてたら急に破損画像が連発。
元々壊れてたのか串が悪かったのか…。
画像DL時串無効に設定しなおして再挑戦。

391:名無しさん@お腹いっぱい。
10/09/22 00:34:41
たまに空文字返すPROXYはあるよね。
PROXYのせいなのか、あるいはhentaiが意図的にそう返しているのかは知らん。
あといちいち串と書くな恥ずかしい。

392:名無しさん@お腹いっぱい。
10/09/22 01:06:09
串でいいじゃん1文字だし

393:名無しさん@お腹いっぱい。
10/09/22 09:56:57
普通は串って書くよな
>>391が情弱すぎるだけ

394:名無しさん@お腹いっぱい。
10/09/22 14:51:50
なに通ぶってんだよw

395:名無しさん@お腹いっぱい。
10/09/22 17:09:29
素人の俺でも串って言うわ
2ちゃん住人ならほとんどが串って言うんじゃねーの

396:名無しさん@お腹いっぱい。
10/09/22 17:12:53
なんと言ってもいいけど○○って言わない奴は情弱って言うような人は頭が悪いなぁとは思う


397:名無しさん@お腹いっぱい。
10/09/22 18:13:31
ちがうちがうよ、見てるこっちが恥ずかしいって意味。
よくあるだろ、電車の中とかの物知り顔な中学生の会話。

398:名無しさん@お腹いっぱい。
10/09/22 18:20:17
くっしーさーん!
出てきてくださーい!

399:名無しさん@お腹いっぱい。
10/09/22 18:39:28
言わないからじゃなく、昔から使われてる名称を物知り顔で非難してるから叩かれてるんだよ。
もう少し読解力つけろ。

400:名無しさん@お腹いっぱい。
10/09/22 18:50:01
串でもproxyでもプロクシでもプロキシでもかまわんが
大文字でPROXYは解説書か環境変数以外で見ると違和感があるな。

401:名無しさん@お腹いっぱい。
10/09/22 18:52:48
通でも何でもないだろ
普通でもない
好きなようにしろよ
俺は一気にダウンロードが最終的に楽になりゃなんでもいいわ

402:名無しさん@お腹いっぱい。
10/09/22 18:55:14
「串」はアングラを気取った一部の連中が使いだしたもの。奴らは隠語を使うのが
格好いいと思ってた。
「串」は、一文字で済む、刺すという動詞と相性がいいので進化の勝者になった。
が、今更使うなよって感じだな。

若いおねーちゃんのファッションをババアが真似しだして更に10年経過した段階。
恥ずかしくて見てらん無い。

403:名無しさん@お腹いっぱい。
10/09/22 19:01:43
鯖とか垢とかもね

404:名無しさん@お腹いっぱい。
10/09/22 19:08:55
串教えてくださいと言って焼き鳥の串のアドレス貼られたのはいい思い出

405:名無しさん@お腹いっぱい。
10/09/22 21:19:00
>が、今更使うなよって感じだな。
独りよがりな意見だな。
その感覚を押しつけないでください。無視しててください。

406:名無しさん@お腹いっぱい。
10/09/22 21:21:15
ババア必死。ww

407:名無しさん@お腹いっぱい。
10/09/22 21:49:41
お前も必死www

408:名無しさん@お腹いっぱい。
10/09/22 21:58:55
正しいことを言った者が正義ではない
ツールを上げた者が正義なのだ

409:名無しさん@お腹いっぱい。
10/09/22 21:59:24
>>404
俺はプロキシ拾える場所教えてくれって言ったらプロ棋士一覧のサイト貼られたわw

410:名無しさん@お腹いっぱい。
10/09/22 22:32:40
どんだけ張り付いてんだか、ツールくれは技術的なこと以外の話になると今が出番とワラワラ沸いてくるな。
もう>>397は撤回するから好きに鯖でも串でも使ってくれ。膣内と書いてナカと読ませるのには慣れた。

411:名無しさん@お腹いっぱい。
10/09/23 00:04:31
ieの右クリックメニューで現在見ているwebページのURLをテキストファイルに追記するツール
URLリンク(www1.axfc.net)

Cドライブのルートに解凍→レジストリ実行で準備完了(ファイル消しちゃダメ)
詳しくはreadme.txtとhtmlソース(javaスクリプト)見て。

412:名無しさん@お腹いっぱい。
10/09/23 00:40:24
面白い試みだがここってUNIX板なんだよね

413:名無しさん@お腹いっぱい。
10/09/23 01:43:00
つられんなってw

414:名無しさん@お腹いっぱい。
10/09/24 21:02:53
プロキシ通したらデータ化けで数時間で止まるようになったorz
使った串が悪いんだろうけど。

415:名無しさん@お腹いっぱい。
10/09/24 21:11:15
網タイ穿いたボンレスハムババアが現れた。

416:名無しさん@お腹いっぱい。
10/09/24 21:58:51
どれだけ必死なのゆとりDQN。

417:名無しさん@お腹いっぱい。
10/09/24 23:15:58
ふむ、その趣味は無いが非常に興味深い事象に思えるな。参考までに画像を張りたまえ。
誤解の無いように言っとくが決してその手の趣味があるわけではないから勘繰るなよ。
いいから張りたまえ。早く!今すぐにィ!

418:名無しさん@お腹いっぱい。
10/09/25 08:27:11
URLリンク(erog3jigen.blog49.fc2.com)

419:名無しさん@お腹いっぱい。
10/09/25 14:12:12
jpegファイル破損検出用
URLリンク(blog.livedoor.jp)

420:名無しさん@お腹いっぱい。
10/09/27 00:37:09
串通さなきゃいけないような仕様はやめてほしい

421:名無しさん@お腹いっぱい。
10/09/27 06:45:16
そしたら鯖に負荷かかるだろうが馬鹿か
一枚づつシコシコと保存しろよ

422:名無しさん@お腹いっぱい。
10/09/28 00:15:52
いまひとつ歯車が噛み合っとらんけど、変に律儀なのは日本人の美徳だな。
たとえばGoogleの統計では全世界のe-hentaiの検索で日本からの検索なんて
グラフにもならん程少ない。自意識過剰気味。高楊枝っぽくって好きだけどな。


423:名無しさん@お腹いっぱい。
10/09/28 00:49:58
大量のプロキシからの同時接続で一瞬で1冊完成させるスクリプト組んでみた

424:名無しさん@お腹いっぱい。
10/09/28 01:58:07
>>423
高速で取っても読むのがどうせ追いつかなくなるだけだよ
あと物色する段階までは生IPで見てるだろうから向こうが本気になれば足がつく
以前プロキシ付きget.plの使いすぎでアク禁された俺が忠告しとく

425:名無しさん@お腹いっぱい。
10/09/28 11:32:33
一つで完結する面倒くさくないプロキシ付きget.plは必要だけどな
物色する段階で自重すりゃいいだけだし

426:名無しさん@お腹いっぱい。
10/09/28 18:24:45
まだ売ってるものは買えよ。

427:名無しさん@お腹いっぱい。
10/09/28 22:54:02
エロ漫画見たさに一晩中PC付けっぱなしにしてることに何の疑問も持たない奴は馬鹿

428:名無しさん@お腹いっぱい。
10/09/28 23:22:57
自鯖あるし。

429:名無しさん@お腹いっぱい。
10/09/28 23:25:18
uploader運営すれば勝手に集まる。

430:名無しさん@お腹いっぱい。
10/09/29 00:22:25
>>427
そこは別に
エロ漫画見たさにこんなスレにたどり着くことに比べれば屁でもないだろ

431:名無しさん@お腹いっぱい。
10/09/29 00:47:48
何の疑問もないw

432:名無しさん@お腹いっぱい。
10/09/29 10:10:32
>419
jpeginfo -c で十分だなぁ

433:名無しさん@お腹いっぱい。
10/09/29 18:27:02
>>287
これ使ってて500エラー時に?nl=1を足して再試行するには
どうしたらいいんだろうか?

434:名無しさん@お腹いっぱい。
10/09/29 18:53:10
>>419
俺は>>228

435:名無しさん@お腹いっぱい。
10/09/30 01:16:43
画像鯖のダウン放置なげえな

436:名無しさん@お腹いっぱい。
10/10/01 01:26:09
PNGの途中切れ判定関数作った

sub is_png
{
my $data = shift or die $!;

my $sig = substr( $$data, 0, 8 );
my $iend = substr( $$data, -8, 8 );

return
$sig ne "\x89\x50\x4E\x47\x0D\x0A\x1A\x0A" ? 0
: $iend ne "\x49\x45\x4E\x44\xAE\x42\x60\x82" ? 0
: 1 ;
}


次ページ
最新レス表示
スレッドの検索
類似スレ一覧
話題のニュース
おまかせリスト
▼オプションを表示
暇つぶし2ch

4063日前に更新/190 KB
担当:undef