我试图找出在Ruby on Rails中排序UTF-8字符串的“正确”方式.
在我的应用程序中,我有一个填充了国家/地区的选择框.当我的应用程序本地化时,每个现有的区域设置都有一个country.yml文件,将一个国家的ID与该国家的本地化名称相关联.我不能在yml文件中手动对字符串进行排序,因为我需要所有区域设置的ID一致.
我所做的是创建一个ascii_name方法,它使用unidecode
gem将重音和非拉丁字符转换为等价的ascii(例如,“Afeganistão”将成为“Afeganistao”),然后排序:
require 'unidecode' class Country def ascii_name Unidecoder.decode(name).gsub("[?]","").gsub(/`/,"'").strip end end Country.all.sort_by(:&ascii_name)
然而,这是有明显的问题:
>它不能正确地排序非拉丁语言区域,因为可能没有直接类似的拉丁字符.
>它不区分一封信和该字母的所有重音形式(因此,例如A和Ä可互换)
有谁知道一个更好的方法,我可以排序我的字符串?
解决方法
http://github.com/grosser/sort_alphabetical
这个宝石应该有帮助.它将sort_alphabetical和sort_alphabetical_by方法添加到Enumberable中.