当前位置：文江博客话题详情

ruby 从任何编码到 ascii

发布于 2024-10-19 00:41:08 字数 284 浏览 2 评论 0原文

我主要要处理的是英文字母和所有标点符号，我不必担心欧洲口音。因此，我唯一担心的是，当用户粘贴从网络上复制的内容时，例如，当我在控制台（在 Win7 上）中执行 put 操作时，它会输出

“It gammaÇÖs”#，而它实际上在哪里所以我的主要问题是

，是否有一种可以在 Ruby 中使用的万能转换方法，可以正确替换所有 ,.;?!"'~` _- 与 ASCII 计数器部分？

我真的非常理解关于编码的知识很少，如果您认为这是错误的问题（很可能是这种情况），请建议我应该寻找什么，

谢谢。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

無處可尋 2024-10-26 00:41:08

我在出版业工作，我们经常处理这个问题。我们在 stringex https://github.com/rsl/stringex 方面取得了成功。他们有一个 to_ascii 方法，可以标准化 unicode 破折号等。

回复收藏 0 原文

素年丶 2024-10-26 00:41:08

在 Ruby 2.0 中：

"ItΓÇÖs".encode("ASCII", invalid: :replace, undef: :replace, replace: '')
 => "Its"

And in ruby 2.0:

"ItΓÇÖs".encode("ASCII", invalid: :replace, undef: :replace, replace: '')
 => "Its"

回复收藏 0 原文

债姬 2024-10-26 00:41:08

对于以编程方式处理多字节编码 iconv 是你的朋友。并且，James Gray 撰写了一系列博客文章，讨论如何分解问题并转换编码。

处理已粘贴的文本时，问题会变得更加复杂，因为某些字符可能采用一种多字节编码，而其他字符可能采用另一种多字节编码。您可能必须遍历字符串检查多字节字符，然后询问 Ruby 编码是什么，如果不是您期望的编码，则将其转换为预期或所需的编码，然后移至下一个字符。格雷的文章很好地涵盖了这一切，值得一读。

回复收藏 0 原文

~没有更多了~

关于作者

第七度阳光i

暂无简介

0 文章

0 评论

23 人气

关注发私信

友情链接

文江博客

ruby 从任何编码到 ascii

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

留蓝

18790681156

zach7772

Wini

ayeshaaroy

初雪

友情链接

ruby 从任何编码到 ascii

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

留蓝

18790681156

zach7772

Wini

ayeshaaroy

初雪

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。