1 名前: ◆gfD86vH6Zo [03/07/04 23:32] 2ちゃんねる専用のブラウザを作っちゃおう というプロジェクトです。 [前スレ1より] Part 1 pc.2ch.net/test/read.cgi/tech/981726544/ Part 2 pc.2ch.net/test/read.cgi/tech/1005282763/ Part 3 pc3.2ch.net/test/read.cgi/tech/1012544484/ Part 4 pc2.2ch.net/test/read.cgi/tech/1042432238/ monazilla.org (w www.monazilla.org/
738 名前:デフォルトの名無しさん mailto:sage [2007/07/03(火) 15:54:35 ] >>737 サーバーダウン(鯖落ち)情報 part159 qb5.2ch.net/test/read.cgi/operate/1182906850/183-
739 名前:デフォルトの名無しさん mailto:sage [2007/07/03(火) 15:58:07 ] 把握。 ひろゆき( ´Д` )
740 名前:デフォルトの名無しさん mailto:sage [2007/07/21(土) 18:41:47 ] よくある次スレ検索機能みたいなのってどういう仕組みになってんの?
741 名前:デフォルトの名無しさん mailto:sage [2007/07/21(土) 22:22:38 ] >>740 基本的には、スレタイの先頭数文字の一致。あとは【】をとばすとか、いろいろ考えられると思う。
742 名前:デフォルトの名無しさん mailto:sage [2007/07/21(土) 23:06:53 ] 結局自分で探すのが一番
743 名前:デフォルトの名無しさん mailto:sage [2007/07/21(土) 23:15:07 ] 自分で探すときの考え方をそのままプログラムに反映させるだけだろ ・・・と口で言うほど簡単ではないけど、基本的にはそうだと思う・・・
744 名前:デフォルトの名無しさん mailto:sage [2007/07/22(日) 03:10:59 ] ということは高精度なOCRが必要になるってことでしあ
745 名前:デフォルトの名無しさん mailto:sage [2007/07/22(日) 19:54:46 ] >>740 Janeはコサイン係数で文字列の類似度から次スレを見つけてるみたい。 twintailは文字列を単語毎に分解してるだけだから簡単な実装で大丈夫だと思うよ。
746 名前:デフォルトの名無しさん mailto:sage [2007/07/25(水) 11:41:26 ] webブラウザで pc11.2ch.net/test/read.cgi/tech/1057329161/6 を見たときに >>6 だけじゃなく >>1 も表示されるのって 前からそうだったっけ?
747 名前:デフォルトの名無しさん mailto:sage [2007/07/25(水) 13:14:24 ] >>746 >>6 しか表示されないけど? l6だと最後の6レスと>>1 が表示される nl6とかl6nにすると>>1 は表示されない
748 名前:746 mailto:sage [2007/07/25(水) 15:02:29 ] あ、ごめん、JavaScript モードにしてるからだったみたい。 CGI モードだと 6 だけだった。
749 名前:デフォルトの名無しさん mailto:sage [2007/08/25(土) 00:29:06 ] 一ヶ月書込みがないな
750 名前:デフォルトの名無しさん mailto:sage [2007/08/26(日) 11:34:22 ] 役割を終えたということで・・・・
751 名前:デフォルトの名無しさん mailto:sage [2007/08/26(日) 17:39:04 ] 2chの仕様変更でもない限り盛り上がらないだろうな ところで2ch以外の掲示板の話題はスレ違い? 俺はまちBBSのスレッド取得について詳しく書いてあるサイトがあれば教えて欲しいんだが。 あぼーんがあるとsubject.txtに書かれているレス数と最終レスの番号がずれるのでどうやって差分取得をすればいいのかわからない。
752 名前:デフォルトの名無しさん mailto:sage [2007/08/26(日) 18:17:50 ] あぼーんなら差分取得はしない
753 名前:デフォルトの名無しさん mailto:sage [2007/08/26(日) 19:01:49 ] >>751 DATで取れないのは最初から読み直し
754 名前:デフォルトの名無しさん mailto:sage [2007/08/26(日) 20:37:53 ] まちBBSって .cgi ファイルになってて取得できなくない? どうやってあぼーん検出するの?
755 名前:デフォルトの名無しさん mailto:sage [2007/08/26(日) 21:27:47 ] >>754 >あぼーんがあるとsubject.txtに書かれているレス数と最終レスの番号がずれるので
756 名前:デフォルトの名無しさん mailto:sage [2007/08/26(日) 22:41:49 ] それってスレを取得する度にsubject.txtも更新する必要があるような・・・
757 名前:デフォルトの名無しさん [2007/09/05(水) 23:40:09 ] 誘導されました。 2chブラウザ作っているのですが、qb5.2ch.netに書き込み確認のcookieタグを 取得しようとしても正しく取得できません。 調べるとhttpのヘッダが他のサーバーと違います。 これはどうしてですか? 書き込みをしようとした時にcokkieが書かれたヘッダです。 --------------- news22.2ch.net --------------- HTTP/1.1 200 OK Date: Tue, 04 Sep 2007 14:49:57 GMT Server: Apache/2.0.55 Set-Cookie: PON=***********; expires=Friday, 01-Jan-2010 00:00:00 GMT; path=/ Set-Cookie: HAP=******; expires=Friday, 01-Jan-2010 00:00:00 GMT; path=/ Vary: Accept-Encoding Content-Length: 1911 Connection: close Content-Type: text/html; charset=shift_jis --------------- qb5.2ch.net --------------- HTTP/1.1 200 OK Date: Tue, 04 Sep 2007 14:37:59 GMT Server: Apache/2.0.52 (Unix) PHP/4.3.10 mod_ssl/2.0.52 OpenSSL/0.9.7c-p1 Set-Cookie: PON=***********; expires=Friday, 01-Jan-2010 00:00:00 GMT; path=/ Set-Cookie: HAP=******; expires=Friday, 01-Jan-2010 00:00:00 GMT; path=/ Vary: Accept-Encoding Connection: close Transfer-Encoding: chunked Content-Type: text/html; charset=shift_jis
758 名前:デフォルトの名無しさん mailto:sage [2007/09/06(木) 00:00:28 ] HTTP/1.1を名乗っているのにChunked-Transter-Encodingを理解しない者は 腹を切って死ぬべきだ。詳しくはRFC2616で熟知すべし。
759 名前:デフォルトの名無しさん mailto:sage [2007/09/06(木) 00:06:01 ] HTTPヘッダが違うのは鯖がそういう環境だからだろう。 ていうかヘッダ見る限りクッキー取得できてるじゃねぇか。
760 名前:デフォルトの名無しさん mailto:sage [2007/09/06(木) 00:17:10 ] >>758-759 どうもありがとう。 Chunked調べたら分かりました。
761 名前:デフォルトの名無しさん mailto:sage [2007/09/09(日) 14:07:51 ] 【鯖落ち】板の不具合報告スレ+9【重い重い重い重い重い.....】 www.machi.to/bbs/read.pl?BBS=tawara&KEY=1101901351&START=218&END=218 知らぬ間にread.cgiになってたのね それ以外の情報がまだ無いけど・・・
762 名前:デフォルトの名無しさん mailto:sage [2007/09/09(日) 18:50:28 ] まだじゃね?
763 名前:デフォルトの名無しさん mailto:sage [2007/09/10(月) 08:57:18 ] >>761 情報サンクス。 dat直読みか、rawmodeを載せてくれるとうれしいなあ。 差分取得が楽になる。
764 名前:デフォルトの名無しさん mailto:sage [2007/09/18(火) 14:32:06 ] monazilla.org 更新再開されてたんだな。 phpのWarningがでまくってるけど。
765 名前:デフォルトの名無しさん mailto:sage [2007/09/18(火) 18:01:29 ] 他力本願だけどなw
766 名前:デフォルトの名無しさん mailto:sage [2007/09/18(火) 21:10:07 ] Warning: main(module/asm4cmt/): failed to open stream: No such file or directory in /home/monazill/public_html/index.php on line 116 Warning: main(): Failed opening 'module/asm4cmt/' for inclusion (include_path='.:/usr/local/lib/php') in /home/monazill/public_html/index.php on line 116 Warning: Cannot modify header information - headers already sent by (output started at /home/monazill/public_html/index.php:116) in /home/monazill/public_html/index.php on line 1542 ググッてもmonazilla.orgのキャッシュしか見つからないぜw
767 名前:デフォルトの名無しさん mailto:sage [2007/09/28(金) 23:35:37 ] BBS_THREAD_TATESUGI=64 おそらく連続してスレ建てするのを規制する行だと思うんだけど 64とされていた場合、次にスレ建てできるようになるまでどのくらいの 時間がかかるんだっけ?
768 名前:デフォルトの名無しさん mailto:sage [2007/09/28(金) 23:45:56 ] qb5.2ch.net/test/read.cgi/operate/1086942520/947-948n
769 名前:デフォルトの名無しさん mailto:sage [2007/09/29(土) 15:17:11 ] >>767 新しいスレが64個立つまで
770 名前:デフォルトの名無しさん mailto:sage [2007/09/29(土) 16:53:25 ] 過疎スレで64個って永杉だろorz・・・
771 名前:デフォルトの名無しさん mailto:sage [2007/09/30(日) 10:26:28 ] 過疎はきついなw
772 名前:● mailto:sage [2007/09/30(日) 13:04:33 ] 買え
773 名前:デフォルトの名無しさん mailto:sage [2007/09/30(日) 16:10:07 ] 買わされ続けて解約できないと聞いたから嫌
774 名前:○ mailto:sage [2007/09/30(日) 16:45:20 ] 解約手続きしたこと無いからわからんが 2chをやり続ける限り●も買い続けるぜ。
775 名前:● mailto:sage [2007/09/30(日) 16:45:48 ] ログインしてなかた
776 名前:デフォルトの名無しさん mailto:sage [2007/09/30(日) 18:15:45 ] メール送ったら解約できたぜ。 送ったメールに対する返信・確認や連絡は一切なくてうさんくさいこと この上なかったが、引き落としされなくなってた。 二度と買わねぇ
777 名前:デフォルトの名無しさん mailto:sage [2007/10/31(水) 02:08:43 ] 指定した2ちゃんの特定の板にある全てのスレを読み込んで 特定の文字、ID、名前、E-mail欄で検索をかけるちょっとしたツール を自作しよかと思ってるんだけど似たようなツールって既に現存したりする?
778 名前:デフォルトの名無しさん mailto:sage [2007/10/31(水) 10:03:01 ] 転送量・・・一つの板だけならそんなでもないかな。わかんないけど><
779 名前:デフォルトの名無しさん mailto:sage [2007/10/31(水) 11:15:41 ] 個人的にやるなら大丈夫だけど、ツールを配布するなら狐が激怒するから注意。 了承取っとかないとちょっとしたクロールでもバンされるから。
780 名前:デフォルトの名無しさん [2007/10/31(水) 11:22:36 ] そんなのUserAgentを適切に設定すればOK
781 名前:デフォルトの名無しさん mailto:sage [2007/10/31(水) 11:31:15 ] クロールはip単位でバンしてるから。 ちょっと前まではgooglebotさえバンしてたぐらいだから。 みみずんやら閉鎖したにくちゃんねるやら、2nnとかは ipの範囲を申告して了承を受けて取得してる。
782 名前:デフォルトの名無しさん [2007/10/31(水) 11:59:04 ] あいつら最近そういうの取り締まるのやる気ないから
783 名前:777 mailto:sage [2007/10/31(水) 12:17:20 ] 了解ッス。 キワモノの扱いってことはそういうツールは公にはなさそうだね。 というわけで自作する道を選びます(・ω・)ノシ 一つの板にある全てのスレを読み込んでいくわけになるんだけど 何秒以上間を置いてから読み込んだ方がいいとかわかる? そこらへんも実際にやってみないことには何ともいえないのかな?
784 名前:デフォルトの名無しさん mailto:sage [2007/10/31(水) 13:00:32 ] 運営側は何秒までならいいですよ〜なんて絶対に言わない。 言えばそこギリギリで負荷を掛ける奴がいるから。 定期的にクロールすれば負荷のグラフが突出、 するとログを調べられて規制の対象になる。 その辺りの調整はrootがやってるから、該当スレと負荷グラフを見てこっそりやるしかないわ。
785 名前:デフォルトの名無しさん mailto:sage [2007/10/31(水) 13:06:13 ] ちなみに公式の本文検索や投稿者検索は有料であります。 find.2ch.net/
786 名前:デフォルトの名無しさん [2007/10/31(水) 13:07:05 ] 逆に配布してみんなやるようにすればいい そうすれば自分だけ目を付けられることはなくなる
787 名前:デフォルトの名無しさん mailto:sage [2007/10/31(水) 13:23:38 ] >>786 鬼才現る
788 名前:デフォルトの名無しさん [2007/10/31(水) 13:28:16 ] 2chは最近はそれほど負荷に悩んでるって訳でもない。 サーバーの能力の伸びは今では利用者数の伸びをはるかに上回っているし。 それにひろゆきの年収を考えてみろ、いざとなればサーバーなんていくらでも増強するだろう。
789 名前:デフォルトの名無しさん mailto:sage [2007/10/31(水) 14:15:15 ] 設備をケチれば狐の会社が儲かる不思議。 rootは知的好奇心から鯖運営を無償でしてる(ことになってる)。 実際ひろゆきは2chのサーバー代は全く払ってない。(BE鯖、ひろゆき直轄を除く) ●のプール金から払ってることにしてるだけ。
790 名前:デフォルトの名無しさん mailto:sage [2007/10/31(水) 15:27:41 ] たしかそれがひろゆがたとえ逮捕されても死んでも2ちゃんはすぐには無くならない根拠となってるよな
791 名前:デフォルトの名無しさん mailto:sage [2007/10/31(水) 18:01:35 ] 逮捕されたり死んだら、実際にサーバーがあるアメリカの会社のJimが ひろゆきの代わりに管理人になると言われてる。 ちなみに彼はbbspinkの管理人ね。 内紛があって狐とはあまり仲がよくないけど、今でも一応ビジネスパートナー。
792 名前:デフォルトの名無しさん mailto:sage [2007/11/01(木) 09:27:46 ] >>788 この場合は負荷ではなく転送量の問題の方が大きいと思うが・・・
793 名前:デフォルトの名無しさん [2007/11/01(木) 09:29:11 ] >>792 転送量に悩んでるって話も聞かないな
794 名前:デフォルトの名無しさん mailto:sage [2007/11/01(木) 11:14:23 ] よーしパパ、自作専ブラのgzip転送サポートしないで作っちゃうぞー
795 名前:デフォルトの名無しさん mailto:sage [2007/11/01(木) 13:40:33 ] 今出回ってる奴らはgzipサポートしてんのかね
796 名前:デフォルトの名無しさん mailto:sage [2007/11/01(木) 13:49:59 ] そういえば鯖によってはgzip圧縮しないと転送してくれないものもあるんだっけ? 主要な2ちゃんブラウザってどれもgzip圧縮でやりとりしてるの?
797 名前:デフォルトの名無しさん mailto:sage [2007/11/01(木) 13:55:32 ] offlaw.cgi経由はgzipでないと無理じゃなかったっけ
798 名前:デフォルトの名無しさん mailto:sage [2007/11/01(木) 18:07:45 ] >>795 gzip受けられないと5年前ぐらいの過去ログがとれなくなるから さすがにしてるんじゃね?
799 名前:デフォルトの名無しさん mailto:sage [2007/11/01(木) 18:34:08 ] 2ちゃんのログをC#を使って取得しているんだけどその際参考にさせてもらってる サイトが↓ dobon.net/vb/dotnet/internet/webrequest.html WebRequestクラスを使ってログを取得しているんだけど上記のページで紹介されてる サンプルプログラムってgzipデータをやりとりなんてややこしいことやってないよね? gzip圧縮しなくてもログ取得できてるから気にしてなかったんだが、もしgzip圧縮された ログを取得して読めるようにするには上記のサンプルプログラムをどう改造したらいいの?
800 名前:デフォルトの名無しさん mailto:sage [2007/11/01(木) 18:41:28 ] www.atmarkit.co.jp/fdotnet/dotnettips/519httpcompress/httpcompress.html これじゃだめ?
801 名前:デフォルトの名無しさん mailto:sage [2007/11/01(木) 18:43:52 ] >>799 2.0以降なら HttpWebRequest.AutomaticDecompression
802 名前:デフォルトの名無しさん mailto:sage [2007/11/01(木) 19:02:51 ] >>800-801 ありがとう(・ω・)ノシ でも.NET 2.0以降じゃないと対応してないのか・・・ あいにく1.1(VS2003)で開発しているんだよね(´・ω・`)
803 名前:デフォルトの名無しさん mailto:sage [2007/11/02(金) 09:10:29 ] >>802 今時1.1はちとアレだ、Express Editionでも落として来い と言いたいところだが
804 名前:デフォルトの名無しさん mailto:sage [2007/11/04(日) 01:52:33 ] お題: 完成した専ブラをみんなに使ってもらうには
805 名前:デフォルトの名無しさん mailto:sage [2007/11/04(日) 03:32:37 ] Microsoftに売り込んでWindowsにバンドルしてもらう
806 名前:デフォルトの名無しさん mailto:sage [2007/11/04(日) 12:18:21 ] >>804 monazillaに登録されると一気に人が押し寄せてくるよ
807 名前:デフォルトの名無しさん mailto:sage [2007/11/06(火) 11:21:52 ] いらないレスを削除してスレをまとめる機能を専ブラに付けようと思ってるんだが。 一体どう計算させればできるのだろうか? 独自ファイルを一時的に作り、datに毎行移動フラグを付加してみたら良いのか。 読み込んだdat ↓ 一時保存ファイル(移動フラグ、フォントサイズ変更フラグ、色変更フラグなど付加) ↓ HTML変換
808 名前:デフォルトの名無しさん mailto:sage [2007/11/06(火) 11:46:02 ] いらないレスは透明あぼん扱いにして飛ばしちゃえば?
809 名前:デフォルトの名無しさん mailto:sage [2007/11/06(火) 19:50:35 ] >>808 それどうやれば使えるの……ってググってくるよ。 あぼ〜んのやり方知らないとか、やっぱりdatの扱い方を熟知しないと辛いか……
810 名前:デフォルトの名無しさん mailto:sage [2007/11/06(火) 22:42:30 ] dat->html変換にはかけてるんでしょ。その変換がレス単位なら、 外部条件によって実行するか、<--あぼん-->とだけに するかだけの話じゃないの?
811 名前:デフォルトの名無しさん mailto:sage [2007/11/06(火) 23:01:09 ] どんなスキルで作ろうとしてるのか不安になるな・・・
812 名前:デフォルトの名無しさん mailto:sage [2007/11/07(水) 09:09:01 ] 工エエェェ(´д`)ェェエエ工工 >>809 こんな感じかな dat読み込み ↓ 本文とか名前欄でいらない物が入ってるかチェックしていらないものはあぼん書き換え ここでサイズ変更とか色変更もここでやればいいと思う ↓ 一時ファイルに書き出し? ↓ html変換
813 名前:デフォルトの名無しさん mailto:sage [2007/11/07(水) 12:24:35 ] >>811 javaで作る予定。 スキルは……2chの仕様書は何となく理解できたくらい。 >>812 そんな感じ。 そう複雑になるものではないはずなんだけど、もしかしたら無駄な行程を入れてしまっているのかも知れない……
814 名前:デフォルトの名無しさん mailto:sage [2007/11/07(水) 21:12:02 ] >>813 > 2chの仕様書 kwsk
815 名前:デフォルトの名無しさん mailto:sage [2007/11/07(水) 21:20:08 ] >>814 これ。 ttp://www.monazilla.org/document/index.html
816 名前:デフォルトの名無しさん mailto:sage [2007/11/07(水) 21:44:26 ] ところで、スレまとめソフトを公開してはいけない規約とかあったか? 参考にしようとしたらどこ探しても見あたらないんだ。 2chまとめブログが最近増えてきてるからどっか大手が作ってるんだろうなと思ってたんだが、ないんだな。
817 名前:デフォルトの名無しさん mailto:sage [2007/11/08(木) 10:53:24 ] >>816 2ちゃん消滅騒動以来負荷をかけない、転送量を抑えるというのが暗黙の了解と思っている。 取得したdatに関してはどう使おうが問題はないはず
818 名前:デフォルトの名無しさん mailto:sage [2007/11/08(木) 13:41:36 ] どなたかdatをHTMLに変換する方法を優しく教えてくれませんか。 形式を見てもどうすれば本文を<b></b>で囲ったり名前の前に番号を振ったりできるのか分かりません……
819 名前:デフォルトの名無しさん mailto:sage [2007/11/08(木) 13:45:19 ] ただの文字列操作だ。 Jane等のオープンソースのコードを読んでみろ。
820 名前:デフォルトの名無しさん mailto:sage [2007/11/08(木) 14:11:36 ] ありがとうございます。
821 名前:デフォルトの名無しさん mailto:sage [2007/11/08(木) 15:59:32 ] >>818 おいおい datを1行読んで<>で分解して本文の前後に"<b>"と"</b>"を結合するだけだろ
822 名前:デフォルトの名無しさん mailto:sage [2007/11/08(木) 16:45:18 ] >>818 ぶっちゃけお前に2ちゃんブラウザは無理。 見た目より難易度高いよ、作るの。
823 名前:デフォルトの名無しさん mailto:sage [2007/11/08(木) 21:09:47 ] >>818 正規表現でグループ化すれば
824 名前:デフォルトの名無しさん mailto:sage [2007/11/21(水) 20:49:25 ] 作って公開して自らスレを立ててもいいのだろうか Duawinなんかは1=開発者のようだが
825 名前:デフォルトの名無しさん mailto:sage [2007/11/21(水) 21:24:17 ] 宣伝しなきゃデバッグしてくれるユーザーは現れないよ。
826 名前:デフォルトの名無しさん mailto:sage [2007/11/21(水) 22:03:25 ] つか、良いとか悪いって基準はなんなんだよw
827 名前:デフォルトの名無しさん mailto:sage [2007/11/21(水) 22:28:14 ] >>824 是非お願いします。
828 名前:デフォルトの名無しさん mailto:sage [2007/12/02(日) 07:03:27 ] 逆襲スレ落ちてしまったのか。
829 名前:デフォルトの名無しさん mailto:sage [2007/12/24(月) 23:15:39 ] 逆襲からここにたどり着くのが大変だった
830 名前:デフォルトの名無しさん [2008/01/13(日) 02:59:27 ] age
831 名前:デフォルトの名無しさん mailto:sage [2008/01/24(木) 15:05:57 ] PSPから書き込み
832 名前:デフォルトの名無しさん mailto:sage [2008/01/24(木) 15:22:41 ] もう一度
833 名前:デフォルトの名無しさん [2008/01/24(木) 15:43:58 ] しつこく 改行 テスト
834 名前:名なし mailto:sage [2008/01/24(木) 16:02:08 ] あ か さ
835 名前:デフォルトの名無しさん mailto:sage [2008/01/24(木) 16:07:03 ] たなは
836 名前:デフォルトの名無しさん mailto:sage [2008/01/24(木) 17:12:22 ] ここにも貼り foo-bar-web.hp.infoseek.co.jp/2chpsp.html PSP用のmonazillaです
837 名前:デフォルトの名無しさん mailto:sage [2008/01/25(金) 10:11:38 ] おぉ、乙!
838 名前:デフォルトの名無しさん mailto:sage [2008/01/25(金) 16:54:51 ] てすと