我正在使用nokogiri来屏蔽一些
HTML.在某些情况下,我收到了一些奇怪的字符,我用以下代码跟踪了这些字符的ASCII码:
@parser.leads[0].phone_numbers[0].each_byte do |c| puts "char=#{c}" end
这些字符的ASCII码为194和160.
我想在解析时以某种方式剥离这些字符.
我已经尝试了以下代码,但它不起作用.
@parser.leads[0].phone_numbers[0].gsub(/160.chr/,'').gsub(/194.chr/,'')
任何人都可以告诉我如何实现这一点?
解决方法
你也可以试试
s.gsub(/\xA0|\xC2/,'')
要么
s.delete 160.chr+194.chr