首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Fuzzy diff n by n文件

Fuzzy diff n by n文件
EN

Unix & Linux用户
提问于 2018-01-21 01:35:42
回答 1查看 531关注 0票数 0

我想知道n个文件之间的个体差异,因此类似于以下内容:

代码语言:javascript
复制
parallel --tag 'diff {1} {2} | wc -l' ::: * ::: *

这里的一个大问题是二进制文件,一条megalong行将与一条短行计算相同。

如何生成n个文件上的模糊差异?

EN

回答 1

Unix & Linux用户

发布于 2018-01-21 01:35:42

使用ssdeep生成哈希文件:

代码语言:javascript
复制
ssdeep `find .  -type f` > hash

这将给出90%的<=相似度<100%的对:

代码语言:javascript
复制
ssdeep -m hash `find .  -type f` | grep -E '9[0-9].这只有在长时间伸展(文件大小约为1%的块)相同的情况下才能工作。

这只有在长时间伸展(文件大小约为1%的块)相同的情况下才能工作。

票数 1
EN
页面原文内容由Unix & Linux提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://unix.stackexchange.com/questions/418572

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档