HTMLEntities 解码到ascii 194,不应该是160吗?
我正在使用 HTMLEntities 来解码 HTML 字符串。今天我看到了被解码为 194 而不是 160。194
jruby-1.6.2 :002 > HTMLEntities.new.decode( " " )[0]
=> 194
是正确的,还是我做错了什么(可能是 Ruby 中的 UTF-8 字符串)?
(JRuby = 1.6.2、Rails = 2.3.11、HTMLEntities = 4.3.0)
I'm using HTMLEntities to decode HTML-Strings. Today I saw that is decoded to 194 instead of 160.
jruby-1.6.2 :002 > HTMLEntities.new.decode( " " )[0]
=> 194
Is 194 correct, or am I doing something wrong (maybe something with UTF-8-Strings in Ruby)?
(JRuby = 1.6.2, Rails = 2.3.11, HTMLEntities = 4.3.0)
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
您看到的是两字节 UTF-8 序列的第一个字节。尝试解压它以查看预期的 Unicode 代码点:
What you are seeing is the first byte of a two-byte UTF-8 sequence. Try unpacking it to see the expected Unicode code point: