=== MediaWiki 管理者の集い 第2版 ===
at PHP
[
2ch
|
▼Menu
]
■コピペモード
□
スレを通常表示
□
オプションモード
□このスレッドのURL
■項目テキスト
950:nobodyさん 09/10/26 13:12:16 EUQzS1pj けせたよありがとう 951:nobodyさん 09/10/27 00:47:22 いや、それはこっちでいいと思う。 $wgDisableCounters = true; 952:nobodyさん 09/11/05 17:09:16 QrBblMDt こんにちは。Wikipedia日本語版の全編集履歴を取得したいと考えております。 全編集履歴を含むWikipediaダンプはjawiki-latest-pages-meta-history.xml(最新版)で、 これがなんと400GB近くあります。とりあえずmysqlに投入するために色々調べたら、 ImportDump.phpで投入すると何十日も掛かるらしく、xml2sqlというツールで変換して投入すると良いらしく、 (それでも数日掛かるのかな?)変換しようと考えております。しかし、何故か、<Redirect>タグがどうのこうのとエラーが出るし、 変換したら3つのファイル、revision.txt,page.txt,text.txtが作成されるのかな? で、よく考えたらHDDの容量が450GBしか無く、とても上記のファイルを確保できそうにありません 元のxmlファイルを削除しながら変換するオプションとかあるんですか?helpで見ても無さそうだし、どうしたもんか・・・ やっぱり1TBくらいのHDDを用意して作業するしかないんですかね 全編集履歴を取得した方居ませんか?どなたかアドバイスお願いします あと、テーブルの構造とかご存じでしたら教えてください。よろしくお願いします
次ページ
最新レス表示
スレッドの検索
類似スレ一覧
話題のニュース
おまかせリスト
▼オプションを表示
レスジャンプ
mixiチェック!
Twitterに投稿
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch
3986日前に更新/385 KB
担当:undef