ファイルの重複検出ツールを作ろうぜ
at TECH
[
2ch
|
▼Menu
]
■コピペモード
□
スレを通常表示
□
オプションモード
□このスレッドのURL
■項目テキスト
125:デフォルトの名無しさん 09/01/14 14:35:59 どうせ、画像ファイルだろ。MD5を作るんじゃなくて、サムネイル画像作ってそいつで比較したら?w 126:デフォルトの名無しさん 09/01/14 14:39:27 画像なら、画像の特徴を比較する必要有り。部分md5では無理 127:デフォルトの名無しさん 09/01/14 17:40:08 サムネイルもインデックスみたいなもんだな 128:デフォルトの名無しさん 09/01/14 22:02:32 最近のコンピュータは高速だからファイルの先頭から1ビットずつ比較しようぜ 129:デフォルトの名無しさん 09/01/14 22:04:27 指紋認証のやり方で特徴点抽出 130:122 09/01/15 14:04:06 122 ですが、ファイルは主にプログラムのソースコードです。 現在使っている MD5 以外の検索方法は ベースファイル名が一致しファイルサイズが近いものを DB から抽出し、 ファイルの最初の 128KB のバイナリ差分が小さいものに絞り込み、最後に ファイル全体のバイナリ差分が小さいもの選んでいます。 この方法でそこそこの時間で検索できますが、大幅な絞り込みのために ファイル名を使っているのでファイル名が全然違うファイルは検索対象に ならないので困っています。
次ページ
最新レス表示
スレッドの検索
類似スレ一覧
話題のニュース
おまかせリスト
▼オプションを表示
レスジャンプ
mixiチェック!
Twitterに投稿
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch
5368日前に更新/34 KB
担当:undef