- 130 名前:122 mailto:sage [2009/01/15(木) 14:04:06 ]
- 122 ですが、ファイルは主にプログラムのソースコードです。
現在使っている MD5 以外の検索方法は ベースファイル名が一致しファイルサイズが近いものを DB から抽出し、 ファイルの最初の 128KB のバイナリ差分が小さいものに絞り込み、最後に ファイル全体のバイナリ差分が小さいもの選んでいます。 この方法でそこそこの時間で検索できますが、大幅な絞り込みのために ファイル名を使っているのでファイル名が全然違うファイルは検索対象に ならないので困っています。
|

|