- 1 名前:デフォルトの名無しさん mailto:sage [2023/06/12(月) 21:20:45.91 ID:F1HJC183.net]
- CSVファイルは検索が速いって聞きました
ではなぜソートが遅いのでしょうか?
- 31 名前:デフォルトの名無しさん [2023/09/12(火) 12:29:39.47 ID:QOX8wfhQ.net]
- 何行何列か示せと
- 32 名前:デフォルトの名無しさん [2023/09/12(火) 12:38:34.37 ID:A3YXlMvb.net]
- >>31
1億行、125列
- 33 名前:デフォルトの名無しさん mailto:sage [2023/09/12(火) 12:46:05.28 ID:DJD1APYm.net]
- こんな頭の悪いスレ上げるのはなぜですか?
- 34 名前:デフォルトの名無しさん [2023/09/12(火) 14:42:44.77 ID:A3YXlMvb.net]
- なぜ下げるんだい?
- 35 名前:デフォルトの名無しさん mailto:sage [2023/09/12(火) 14:59:33.38 ID:BQ9Iu4K/.net]
- なんで10GBもあるデータをCSVで管理しようと思ったんだろうな
- 36 名前:デフォルトの名無しさん [2023/09/12(火) 17:11:08.62 ID:zmLL4dpk.net]
- 10GBもあるデータをCSVにしようとした訳ではなく
何も考えずにCSVで管理してたらいつの間にか10GBになったんだろう
- 37 名前:デフォルトの名無しさん mailto:sage [2023/09/12(火) 18:09:26.28 ID:BQ9Iu4K/.net]
- そっかw
- 38 名前:デフォルトの名無しさん [2023/09/14(木) 15:11:27.86 ID:Ur1UGoF9.net]
- >>32
俺だったらなんでも良いからまずRDBに入れちゃうかも。 内容にもよるだろうが、とりあえずSQLiteとかな。
- 39 名前:デフォルトの名無しさん [2023/09/15(金) 19:50:24.13 ID:V4ggyvBY.net]
- 巨大なデータをSQLiteで処理するためのメモ
https://fanぶろぐs.jp/scripts/archive/11/0
- 40 名前:デフォルトの名無しさん mailto:sage [2023/09/15(金) 20:30:51.52 ID:mLRMgWkC.net]
- やさいい
- 41 名前:デフォルトの名無しさん mailto:sage [2023/09/27(水) 20:16:21.16 ID:PKUrAitV.net]
- まず各ブロック当たり1000行とかに分ける。ブロック単位でソートする。
1.ブロックA/B を連結してAB間でソート。 B=全体の数/2 2.ブロックA+1, B+1 で連結してソート 3. ブロックA+全体の数/2- 1(前半最後まで)、ブロックB+前半最後までを連結してソート 4.今度は全体の前半で1-3 風にブロックソート。後半〜最後までで1-3 風にブロックソート 5. 前半〜前半+3/4 でブロックソート、前半+2/4〜前半+4/4 でブロックソート、 ...... ・・・・ ってのを大昔 BASIC で作ったのですが、なぜかデータがゼロに なってしまうバグが出て作るのを止めてしまいました。ちゃんちゃん。駄目じゃん俺。
- 42 名前:デフォルトの名無しさん [2023/10/04(水) 21:29:03.45 ID:ja1//dn8.net]
- だいたいデータの入れ替えに時間が掛かるんだよな
メディアがHDDとかだと尚更 普通はインデックスで実データを間接参照させるんだが まあ、やって無いんだろうなぁ
- 43 名前:デフォルトの名無しさん [2023/10/05(木) 11:43:25.54 ID:AvBTKCCq.net]
- 速度を優先するなら固定長CSVの採用をオススメする
各行へのランダムシークが出来るし並び替えに必要な行の入れ替えも可能になる 最近のutf-8などを使いたい場合は文字数での管理が難しくなるがあくまでもストレージ上でのサイズを基準にして クラスタサイズも考慮し列サイズを決めていこう 検索性能を上げるには外部インデックスを作るしかないだろう ファイルサイズは100倍ぐらいに増えるかもしれないが単純なファイルキャッシュだけで下手なDBでは敵わない速度が出せるだろう
- 44 名前:デフォルトの名無しさん mailto:sage [2023/10/08(日) 19:41:45.47 ID:Unktq8Si.net]
- >>32
125列のレコードが1億行あったらカンマだけで10GB超えるんだが
- 45 名前:デフォルトの名無しさん mailto:sage [2023/10/12(木) 21:43:44.24 ID:5lP2cmIF.net]
- ひとつが100MBくらいのファイルになるように
ディレクトリ構造でB木をつくって(アンバランスでもOK) 個々にソートしたものを最後に結合
- 46 名前:過去ログ ★ [[過去ログ]]
- ■ このスレッドは過去ログ倉庫に格納されています
|

|