考虑以下两个字符串,第一个是代码,第二个是英语句子(短语是准确的).如何检测第一个是代码而第二个不是代码.
1. for (int i = 0; i < b.size(); i++) { 2. do something in English (not necessary to be a sentence).
我正在考虑计算特殊字符(例如“=”,“;”,“”等),并设置是否达到某个阈值.有没有更好的方法来做到这一点?任何Java库?
请注意,代码可能无法解析,因为它不是完整的方法/语句/表达式.
我的假设是英语句子非常规则,它很可能只包含“,”,“.”,“_”,“(”,“)”等等.它们不包含这样的东西:写(“整体很多文字“);