我有一个文件夹,我想创建tgz文件并计算其sha256:
使用以下命令将文件夹转换为tgz
"tar -c -C #{Shellwords.escape dir} #{Shellwords.escape basename} " \ "--owner=0 --group=0 --mtime='2000-01-01 00:00:00' | gzip -n > #{Shellwords.escape file}"
现在我使用2个单独的用户运行上述过程,它给了我2个文件:1和2
两个tgz文件的大小不同:
-rw-r--r--@ 1 myuser \Domain Users 9024 Jul 31 14:28 1.tgz -rw-r--r--@ 1 myuser \Domain Users 9037 Jul 31 14:29 2.tgz
如果我尝试计算文件之间的差异,我没有看到任何diff.Diff是使用以下命令获得的.
diff <(tar -tvf 1.tgz | sort) <(tar -tvf 2.tgz | sort)
如果我使用这两个文件的ruby计算sha256,那么它会有所不同.
编辑:
阅读评论和一些谷歌搜索后,我发现每次添加文件的顺序并不固定.
看这https://reproducible-builds.org/docs/archives/#file-ordering.
我会尝试这个并添加细节.
解决方法
这可能是有很多原因造成的.
> tar存储的元数据(以及gzip存储的元数据,可能包括tar存档的修改时间).我看到你正在使用一些可能会重置此元数据的某些部分的GNU tar选项,但我打赌这些选项并非穷尽所有变量属性.
>文件的顺序.当您将文件解压缩到文件系统时,对于大多数应用程序来说,顺序几乎不重要(尽管每个目录条目通常在基础文件系统的同一个dirent中的任何其他条目之前或之后).但是,不保证tar存档中文件的顺序.
> gzip压缩.通过文件格式保证压缩文件将被解压缩到原始文件,但是,不一定保证它们的压缩格式必须相同.此外,如果输入内容不同(即使它保持相同的大小),那么同样地,您将看到两个档案甚至可能因文件大小不同而不同.