我们在项目中有一个要求,我们必须比较两个法律文本(update1,update2),并提出一个算法来定义多少个单词和多少个句子已经改变.
有没有可以使用的算法?我甚至没有寻找代码.如果我知道算法,我可以用java编写它.谢谢.
解决方法
通常这是通过找到
Longest Common Subsequence(通常称为LCS问题)来实现的.这就是diff的工具.当然,diff是一个面向行的工具,它听起来像你的需求有所不同.但是,我假设你已经构建了一些比较单词和句子的方式.