FileManyサポート掲示板
TOP > 記事閲覧
fld_nor.gif 【要望】書庫内部同士での比較とフォルダ同士の比較
投稿日 : 2021/02/10(Wed) 18:57
投稿者 TAKAO
参照先
初めまして、お世話になっております。

作者様におかれましては、
FileManyというソフトを作っていただき
とても助かっています。(友達にも勧めていたりしています)

助かっている上に、これ以上に要望なんて、
厚かましい事をしていいんだろうか?と思うのですが

もし考えていただければと思い
2つほどあるので聞いていただければ幸いです。


■書庫内部における検索方法の要望について(1つ目)

検索方法(Hashとかに類するのかな?)の要望なのですが、
Windowsでは、ZIPファイルは、フォルダのように扱えます。
(フォルダの中身を見るようにクリックで見れるという意味)

そこで私は以前から、画像をZIPで固めた状態で使っていますが
中には全く同じに見えるものがあるのですが、ZIPなどの書庫で固めてしまっているために

書庫レベルでの比較をすると、MD5で不一致になってしまっています。
そこで、その2つのZIPを解凍して画像単位で比較するとサイズやMD5は一致するのです。

つまりZIPやRARなどの圧縮ファイルは、書庫ファイルのサイズが多少違っていても
書庫の中身にある画像やファイルの"CRC32"の値は同一という状況があります。

これは、以下の内容が主に関係します。

・書庫ファイルの圧縮率の違い
(無圧縮と高圧縮の違いなど)

・書庫ファイルに格納されるファイルの名前の違い
(001.jpgと0001.jpgの違い)

・書庫ファイルに格納される更新日時
(2020/07/08 6:53のものと2021/07/08 6:53の違い)

・書庫ファイルに格納されるフォルダつきの有無
(フォルダあり→ファイル群、フォルダなし(root直下)→ファイル群)

・書庫ファイルに関係ないものが格納している
(Thumbs.dbや.DS_Storeも一緒に格納してしまっている)

調べたかぎりだと、これらがあると出来上がる書庫のMD5値などが異なるようです。

恐らくロジックとしては、解凍状態と同じような条件にするため
中身のファイル群のハッシュ値を取得して比較するのが良いのかと思います。

WINRARのソフトで、ZIPやRARやLZHを開いてみると、"CRC32"の値が開いただけで取れるので
恐らく書庫ファイル(の構造上CRCチェックが出来るものは値が格納されていると思われる)が
持つ格納されているファイル群にはCRC値などの
格納した各ファイル群のハッシュ値が格納されていると思うので、
これを加算や乗算などして合計した値(書庫モードにおける独自ハッシュ)を出して

独自のハッシュ値で、書庫ファイル(ZIPやRARなど)を比較するモードを検討して頂けないでしょうか?
今は無理でも、将来的にアリだなと思って頂けるだけでも構いません。。

この要望は、どちらかというと画像類似検索の書庫ファイル版を作って欲しいに近いのかも知れません。
検討していただければと思います。



■フォルダ同士の比較(2つ目)

これは別の方も似た要望を出していた気がしますが、フォルダをコピーしたり
バックアップ(フォルダ毎またはドライブ毎)をあちこちに作ってしまったために
フォルダ同士で比較する機能が欲しいなと思います。

あとプロジェクトフォルダをコピーしたり、派生したものを作ろうとしたり
バックアップを作ろうとしたりして、、1フォルダの中にある100ファイルの内10つが違うケースの場合は
他の90ファイルが同一でも削除する訳には行かないのですが、、

またフォルダは無数にあるので、ある階層では異なるが、違う階層では同一とか
多分、判定するのは難しい気もするので
例えば、”フォルダ設定一覧”を基準とした比較が出来たらいいなと思います。
編集 編集
件名 Re: 【要望】書庫内部同士での比較とフォルダ同士の比較
投稿日 : 2021/02/13(Sat) 11:49
投稿者 管理人
参照先
コメントありがとうございます。

■書庫内部における検索方法の要望について

圧縮ファイルの比較については
実際に解凍せずサイズやハッシュ値のような情報で
ある程度比較することができるかもしれませんが

恐らく検索の種類としてサイズ、ハッシュ値、バイナリ比較の他に
『書庫の比較』のような種別をまず増やして
書庫同士の比較に関する設定類を別枠で用意するなど
今の実装の延長では実装難度が高そうです。

圧縮ファイルの順番も順不同で比較するとか
サブフォルダも加味するのか、とか色々ありそうです。
一応、Issueには追加しておきますが
実現の可能性は低いと思います。


■フォルダ同士の比較

以前、検索過程の副産物としての情報を元に
一致していると思われるフォルダを表示していた頃がありましたが
厳密さに欠けるため廃止しました。

こちらもIssueに追加しておきますが
専用のアルゴリズムが必要になるため
復活の可能性は低いと思います。
編集 編集
件名 スレッドをトップへソート
名前
メールアドレス
URL
画像添付


暗証キー
画像認証 (右画像の数字を入力) 投稿キー
コメント sml_cool.gifsml_sml.gifsml_yawn.gifsml_q.gifsml_big.gifsml_shm.gifsml_wink.gifsml_cry.gifsml_roll.gifsml_bonk.gif

- WEB PATIO -