お勧めの重複・類似・ ..
[2ch|▼Menu]
217:名無しさん@お腹いっぱい。
10/02/16 21:40:07 sl1TPji10
自動で画質悪いほうを捨ててくれる類似検索ソフト誰か作ってくれないかな

218:名無しさん@お腹いっぱい。
10/02/16 22:50:28 Da+WQFb00
>>217
セミオートなのはあるな
画像サイズ、ファイルサイズ、日付みたいな条件で出来る


219:名無しさん@お腹いっぱい。
10/02/16 22:56:52 tFtKThFD0
たとえばちょっと表情が違うだけで後は全く同じ構図の絵があったときに
ほぼ同じだから片方あればいいと思うか
この表情の変化が良いんだよと両方必要と思うか
結局見て判断するしかないんだよな。
あとは一度必要/不要と判断した類似画像を次に整理する機会に覚えていてくれればいいのだが…

220:名無しさん@お腹いっぱい。
10/02/16 23:31:54 PkPi6aZh0
それは消さずに不要フォルダでもつくってまとめておいて
それと類似するファイルをまとめて消すのが楽なんじゃね

221:名無しさん@お腹いっぱい。
10/02/17 04:28:21 fRScKqzj0
不要ファイルをハッシュ判定で削除するソフトならあるけど類似も消してくれるのは今のところないなあ
不要フォルダにある画像と99.9%一致したものを自動削除!ってできればいいけど不要ファイルが多くなってくると計算量がすごそうだw

222:名無しさん@お腹いっぱい。
10/02/17 15:57:41 7GznGPpw0
>>218
そのソフト教えてくれ

223:名無しさん@お腹いっぱい。
10/02/17 18:58:43 kEnEAhkt0
>>222
DupDetector だと思うが…

224:名無しさん@お腹いっぱい。
10/02/17 20:45:55 kNeYmusa0
こういう作業をやりたい人の数だけ、専用のソフトが必要だな。

225:名無しさん@お腹いっぱい。
10/02/17 22:46:58 0MdSyIrz0
画像は同じでjpgの圧縮率の違いによる劣化、微妙なサイズの違いとか見分けるのは流石に人力になっちゃうよなぁ

226:名無しさん@お腹いっぱい。
10/02/18 00:02:27 CreL4P0e0
>>225
A(100x100,100KB)の画像をリサイズして圧縮率も変えて保存したとして
B(125x125,75KB)
C(75x75,125KB)
の3つのファイルを比較した時に>>218みたいな単純な比較じゃ分からないからね

まあ画像の「顔」部分を抽出するアルゴリズムもあるくらいだから、どこかにあったりして…

227:名無しさん@お腹いっぱい。
10/02/18 02:07:28 rwGRKdsk0
重複してたっていいじゃない
人間だもの

               みつを

228:名無しさん@お腹いっぱい。
10/02/18 21:58:06 pjuhFdX70

>>221

GRID の場合…
検索対象のルートフォルダを「検索パス1」、不要ファイルの入ったフォルダを「検索パス2」、
検索2の方の「検索開始>>」ボタンで検索

結果が表示されたら上段の、グループのサムネで右クリックメニューから
RV_Special > Delete > all without 1st images で一応削除できる
(「検索パス2」のファイルは常に一番左に来るから「検索パス1」のファイルだけ消える)


229:名無しさん@お腹いっぱい。
10/02/20 10:25:08 +1uWBbIX0
今更だがテンプレNautilusのリンク先が間違ってるぞ。
URLリンク(www.geocities.co.jp)

230:名無しさん@お腹いっぱい。
10/02/20 10:39:12 +1uWBbIX0
>>122
あーそれ、俺の環境でも再現するわ。
多分だけど、フォルダ比較ウインドウの下に横スクロールバー出てるだろ。
カラムの長さを調整して、スクロールバーが表示されない状態にしてみな。
それでピッタリのサイズになるはずだ。

Undupはフォルダ比較ウインドウにスクロールバーを表示する事を想定してないんだろうな

231:名無しさん@お腹いっぱい。
10/02/20 19:48:27 HvPJgSgR0
>>229
どっちでも同じじゃね?
URLリンク(www.geocities.jp)
URLリンク(www.geocities.jp)
URLリンク(www.geocities.co.jp)
URLリンク(www.geocities.co.jp)


232:名無しさん@お腹いっぱい。
10/02/22 16:43:21 ihafj1uc0
うんこだっぷんの取りこぼしの理由知りたい?

233:名無しさん@お腹いっぱい。
10/02/24 08:57:40 CBKxfRbc0
SmartEyeの新しいの発見!

234:名無しさん@お腹いっぱい。
10/02/24 09:58:33 AIrA+V2g0
警察官もビビる内部監察官が実在恋愛捜査官≠ノ彼女と別れさせられた!!
警察官の配偶者とその親族は公安に身★辺調★査される (公然の秘密)。
漫画実話ナックルズ2010年4月号
URLリンク(megalodon.jp)
URLリンク(megalodon.jp)
URLリンク(megalodon.jp)
URLリンク(megalodon.jp)

集団強姦未遂で「停職30日」じゃ甘すぎるぞ!!自衛隊わいせつ事件簿 
《平成20年度》自衛隊員のわいせつ事件 全掲載
この漫画は公文書開示請求によって入手した報道発表文ならびに各資料をもとに脚色をまじえて
構成しております。漫画実話ナックルズ2010年4月号
URLリンク(megalodon.jp)
URLリンク(megalodon.jp)
URLリンク(megalodon.jp)
URLリンク(megalodon.jp)
URLリンク(megalodon.jp)
URLリンク(megalodon.jp)
URLリンク(megalodon.jp)
URLリンク(megalodon.jp)
URLリンク(megalodon.jp)

●東京地検の情報リークは国家公務員法違反●
URLリンク(megalodon.jp)
URLリンク(megalodon.jp)

235:名無しさん@お腹いっぱい。
10/03/03 10:57:04 maQ5ngwY0
GRIDは64Bitに対応してないの?

236:名無しさん@お腹いっぱい。
10/03/05 20:54:45 tJoB+eOe0
ImageCompare使いやすいわ
他におすすめとかある?

237:名無しさん@お腹いっぱい。
10/03/05 22:55:53 b3FZhTe00
GRIDは個人的におすすめ
数が多いと面倒かもしれないけどね

俺の環境の場合ImageCompareが浮動小数点エラーで落ちて使い物にならないんだけど
XPのSP2とかSP1だとまともに動くのかね?

238:名無しさん@お腹いっぱい。
10/03/06 20:11:06 PEzrvDzHP
フォルダ内の重複を総当りでチェックするのではなく、
こちらが指定したファイルに対して特定のフォルダから重複(類似)を探すソフトはないでしょうか?


239:名無しさん@お腹いっぱい。
10/03/06 20:16:31 3ikoS7cd0
GRID

240:名無しさん@お腹いっぱい。
10/03/06 20:24:50 PEzrvDzHP
ありがとう
見てみます

241:名無しさん@お腹いっぱい。
10/03/07 13:03:29 fGdbyaLN0
うんこだっぷんの取りこぼしの理由知りたい?

242:名無しさん@お腹いっぱい。
10/03/07 14:00:51 fYgEbYWx0
3次エロ画を整理したいんだけど結局どれとどれがおすすめなのよ

243:名無しさん@お腹いっぱい。
10/03/07 14:57:57 fGdbyaLN0
真眼と神眼と信眼

244:名無しさん@お腹いっぱい。
10/03/13 15:03:34 8WMnhNm40
FileHammerは?
URLリンク(mebiusbox.crap.jp)

245:名無しさん@お腹いっぱい。
10/03/19 07:51:49 7vPcMn650
一番手軽で使い勝手いいのってどれ?UnDupでいい?
UnDupは重複ファイルしかムリなの?一部合致ってのは?

246:名無しさん@お腹いっぱい。
10/03/19 15:26:30 c7X7KO/x0
一部合致ってどういう意味があるんだ?
画像だとして上はノーブラが合致で、
下がぱんつはいてないとと縞ぱんで不一致ってやつか?

247:名無しさん@お腹いっぱい。
10/03/19 15:27:38 PFPJE7H80
なんじゃそりゃw

248:名無しさん@お腹いっぱい。
10/03/19 19:20:20 mT3jTuwF0
GRIDのキャッシュフォルダから
存在しないフォルダのキャッシュを消したいのだがどうすりゃいいんだ?
それらしいボタンを押してるのに全然数が減らない。

249:245
10/03/19 20:00:40 7vPcMn650
>>246
俺もよくわからん
でも完全合致と部分合致とやらがある

250:名無しさん@お腹いっぱい。
10/03/19 21:08:54 HWp+eapI0
>249
使い方に書かれてない?
部分一致検索(ファイルの特定範囲のみを比較します。)
ってオプションじゃないかと思うんだけど
簡略化して高速検索するための物だと思ってるけど、
テキストみたいなファイルだと指定範囲によって類似近似シリーズ物を探すこととかも出来そうだな


251:名無しさん@お腹いっぱい。
10/03/20 05:03:08 jmY7iE8P0
そういう意味なのか
部分一致検索だともしかしたら完全には同じでないのがヒットすることもあるかも、ってこと?簡略化ってことは

252:名無しさん@お腹いっぱい。
10/03/20 06:49:53 AvukQUCM0
破損してるファイルだけどサイズも一緒で破損箇所までバイナリも一緒
っていうの探すんじゃね?

253:名無しさん@お腹いっぱい。
10/03/20 08:04:08 lghXesTk0
部分一致ってJaneのキャッシュみたいにヘッダがあるファイルのヘッダだけを比較とかに使うんじゃない?
まあ、可変長だからJaneのキャッシュは無理だが…

254:名無しさん@お腹いっぱい。
10/03/20 11:21:08 o65vciaR0
>>251
例えば1TBのファイルの中身を頭から尻尾まで調べ上げるのと、100kBのファイルを調べるのではかかる時間が違うでしょ?
DNA鑑定をする時にすべての配列を調べたりしないのと同じ
プレーンテキストなんかは無理だろうけど普通のファイルはある程度の範囲がバイナリ一致すれば同一とみなせる物がほとんど

範囲の指定は自分でできるからヘッダだけ比較することも頑張れば可能かもね
逆にJPGだとヘッダを無視するオプションもあるみたいだけど(純粋に画像の中身のみ比較したい人向けに)

255:名無しさん@お腹いっぱい。
10/03/20 23:11:34 VvY3CR4s0
こんな認識してる

1.完全一致検索 ( 1pass )
  同じサイズのファイルをリストアップ
  リストアップされた同じサイズのファイルどうしを先頭から最後まで比較する(以下全比較)
  同じサイズのファイルが10個あったら9*8*7*6*5*4*3*2回全比較する
  (全比較中に違いを見つけたら中断)
2.完全一致検索 ( 2pass )
  同じサイズのファイルをリストアップ
  リストアップされたファイルのCRCを計算する
  最後に同じサイズで同じCRCのファイルがあったら全比較する
3.簡易検索 (CRC32)
  同じサイズのファイルをリストアップ
  リストアップされたファイルのCRCを計算する
4.サイズを無視(部分一致)
  1〜3は同じサイズのものがあったファイルしか開かないのに対し、これは指定したサイズ範囲の上限
  以上の大きさのファイルを全て開き部分一致チェックする
※1〜3は「部分一致検索をする」にチェックを入れても無視される

2と3は拾い集めた画像フォルダ等、同じファイルが多数存在する可能性がある場合に有効
  拾い集めた画像フォルダなら3で十分
  サイズとCRCの両方が万が一一致してしまうのがいやな完璧主義なら2を使う

1はファイル構成が同じはずもしくはほぼ同じ(バックアップとか)のフォルダ同士を比較する時等に有効
  同ファイルが基本的に1対1ならCRCの計算と全比較の両方やるのはムダ
  それ以前にフォルダ比較ツールでも使った方がいい
  拾い集めた画像フォルダでもまめに一致検索をしている人は同じファイルが多数存在している
  可能性が低いのでこっちを使った方がいいかも

256:255
10/03/20 23:13:57 VvY3CR4s0
4は1〜3のどれかで同ファイルを処分した後、一部破損で不一致になったファイルやダウンロード
ミスで途中で切れてしまっているファイルを探したい時に有効
  指定したサイズ範囲以上の全ファイルを開くので大量にある画像フォルダより、でかいゴミとなる
  動画等の大きなサイズのファイル向き
  より完璧にしたいなら比較範囲をずらして2回やる
  その際、指定した範囲が動画等のヘッダ部にかぶってしまうと違うファイルでも一致してしまう
  可能性があるので、多少先頭からずらした位置を指定する
  拾い集めた画像の場合一度目で見てキャッシュになっているものを保存するので途中で切れている
  可能性はまず無いし、ヘッダのみが違っているファイルはたいがいファイルサイズも違うので無意味
  (ヘッダを無視を使った方がいい)

257:255
10/03/20 23:23:25 VvY3CR4s0
訂正
×9*8*7*6*5*4*3*2回
○9+8+7+6+5+4+3+2回

258:名無しさん@お腹いっぱい。
10/03/21 00:31:20 VCxUSgn70
>>255
とりあえず、その1から4はそれぞれ比較方法の一つであって(UnDupには7通りの比較方法がある)
オプションである「部分一致検索をする」と同列に話すのはどうかなあとは思う
あと、「サイズを無視」には「部分一致検索をする」オプションが必ずセットでついてくるだけの話で、
基本的には(おそらく)全てのファイルを対象にCRC32での簡易検索をするものかと
他の比較方法の時はしたい人だけ「部分一致検索をする」にチェックを入れればいいよと

正直「部分一致検索をする」の使い道があまり思いつかなかったんだけど、確かに破損ファイルは探せるかもねえ
一度比較して重複をなくした後、部分一致検索してもし一致するファイルが有れば破損・不完全ファイルの可能性はあるね
少量の動画ファイルくらいならエクスプローラ上でファイル名やサイズでソートして人の目で確かめた方が速い事が多いだろうけど

259:名無しさん@お腹いっぱい。
10/03/21 04:15:23 M0W9f3rM0
難しい
CRCもよくわからんから読んでも理解できんわ

260:255
10/03/21 04:24:24 KXz/0NQ40
>>258
>あと、「サイズを無視」には「部分一致検索をする」オプションが必ずセットでついてくるだけの話で、
>基本的には(おそらく)全てのファイルを対象にCRC32での簡易検索をするものかと
>他の比較方法の時はしたい人だけ「部分一致検索をする」にチェックを入れればいいよと

全て違うサイズで1対だけわざと部分一致したファイル(サイズは違う)を入れたフォルダに対して
「サイズを無視」検索をやると当然1組の重複として表示されるけど、1〜3は「部分一致検索をする」に
チェックを入れてもヒットしないし、File Monitorで見ても1ファイルも開いてないよ
だから、 「>基本的には(おそらく)全てのファイルを対象にCRC32での簡易検索をするものかと」 は×
(「サイズを無視」は全ファイル開いてる)

1〜4以外の名前とかサイズとか日付とかのオプションを選択した時は「部分一致検索をする」がグレーに
なって使えなくなるから「部分一致検索をする」は「サイズを無視」以外では無効ってことだね

も1度訂正
○9+8+7+6+5+4+3+2+1回

261:255
10/03/21 06:30:52 KXz/0NQ40
すまん、間違ってた
1〜3で「部分一致検索をする」にすると、同じサイズのファイルがあったらそれらの部分比較をするみたい
ファイルをコピーして片方の一部を意図的に変更して比較実行すると1〜3ともヒットする
1は指定範囲のみの完全一致
2は指定範囲のみのCRCと完全一致
3は指定範囲のみのCRCの一致
ということかな?
ファイルサイズが同じものだけしか比較しないから一部破損とかフォーマットが決められたサイズ固定の
データの部分比較とかに使えるかな?
でも上限値がキロバイトでしか指定できないからデータ等には使いにくそう


最新レス表示
スレッドの検索
類似スレ一覧
話題のニュース
おまかせリスト
▼オプションを表示
暇つぶし2ch

5010日前に更新/65 KB
担当:undef