在这个概念上我很难过.
基本上,我需要接受一些任意的唯一字符串,并且能够将其转换为标准化的浮点值.输出浮点值不重要,只要相同的字符串输入总是导致相同的标准化浮点型输出.
那么这是一个散列算法吗?我熟悉SHA1或MD5,这似乎与密码哈希相似,其结果与正确的密码相同.但是这些方法输出字符串,我相信.而我没有得到的是如何将SHA1或MD5的结果转换为一致的浮点值.
# Goal def string_to_float(seed_string) # ... end string_to_float('abc-123') #=> 0.15789 string_to_float('abc-123') #=> 0.15789 string_to_float('def-456') #=> 0.57654 string_to_float('def-456') #=> 0.57654
解决方法
您想要的关键部分是将SHA1或MD5哈希输出转换为确定性和1-1的浮点数.这是一个基于md5的简单解决方案.这也可以用作整数.
require 'digest/md5' class String def float_hash (Digest::MD5.hexdigest(self).to_i(16)).to_f end end puts "example_string".float_hash # returns 1.3084281619666243e+38
这将生成一个十六进制散列,然后将其转换为一个整数,然后将其转换为浮点数.每个步骤都是确定性的.
注意:由@emboss指出,这样可以减少碰撞阻力,因为double为8字节,散列为16字节.应用程序的声音不应该是一个大问题.