我想区分两个
JSON文本文件.不幸的是,它们是按任意顺序构造的,所以当它们在语义上相同时我会得到差异.我想使用jq(或其他)以任何类型的完整顺序对它们进行排序,以消除仅因元素排序而产生的差异.
–sort-keys解决了一半问题,但它没有对数组进行排序.
我对jq一无所知,也不知道如何编写一个保存所有数据的jq递归过滤器;任何帮助,将不胜感激.
我意识到逐行’diff’输出不一定是比较两个复杂对象的最佳方式,但在这种情况下我知道这两个文件非常相似(几乎完全相同)并且逐行差异很好为了我的目的.
Using jq or alternative command line tools to diff JSON files回答了一个非常相似的问题,但没有打印出差异.另外,我想保存排序结果,所以我真正想要的只是一个用于排序JSON的过滤程序.
解决方法
这是一个使用泛型函数sorted_walk / 1的解决方案(因为下面的postscript中描述的原因而命名).
normalize.jq:
# Apply f to composite entities recursively using keys[],and to atoms def sorted_walk(f): . as $in | if type == "object" then reduce keys[] as $key ( {}; . + { ($key): ($in[$key] | sorted_walk(f)) } ) | f elif type == "array" then map( sorted_walk(f) ) | f else f end; def normalize: sorted_walk(if type == "array" then sort else . end); normalize
使用bash的示例:
diff <(jq -S -f normalize.jq FILE1) <(jq -S -f normalize.jq FILE2)
POSTSCRIPT:在首次发布此响应后修改了walk / 1的内置定义:它现在使用keys_unsorted而不是键.