我想知道你的字符串是否几乎相似.例如,像’Mohan Mehta’这样的字符串应该匹配’Mohan Mehte’,反之亦然.另一个例子,像’Umesh Gupta’这样的字符串应该匹配’Umash Gupte’.
基本上一个字符串是正确的,另一个字符串是错误的拼写.我的所有字符串都是人的名字.
关于如何实现这一点的任何建议.
解决方案不必100%有效.
解决方法
如果你想要stdlib的东西你可以使用
difflib.sequencematcher:
from difflib import SequenceMatcher s_1 = 'Mohan Mehta' s_2 = 'Mohan Mehte' print(SequenceMatcher(a=s_1,b=s_2).ratio()) 0.909090909091
fuzzywuzzy是您可以安装的众多库中的一个,它使用带有python-Levenshtein的difflib模块.您还应该查看Approximate_string_matching上的wikipage