当前位置：文江博客话题详情

清理 Unicode 输入的最佳实践

发布于 2024-10-19 19:14:10 字数 359 浏览 5 评论 0原文

我目前正在开发一个 Web 应用程序（使用 Ruby），我最终希望世界上任何地方的人们都可以使用它。考虑到这一点，对非 ASCII 字符的支持至关重要。但是，我不希望数据库在用户名等字段中充满“噪音”字符。

是否有任何公认的最佳实践可以在这些情况下处理 Unicode 输入而不疏远用户？关于处理用户名中的同形异义词以使冒充变得更加困难有什么想法吗？

到目前为止我的一些想法 -

在存储或在查询中使用文本之前规范化文本
过滤不可打印的字符
限制输入中允许的顺序组合变音符号的数量

还有任何进一步的想法，或者我是否为自己做了不必要的工作？

谢谢。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

愿与i 2024-10-26 19:14:10

http://www.ietf.org/rfc/rfc3454.txt 会告诉你什么你应该这样做，也就是说担心正常化和安全问题。

回复收藏 0 原文

~没有更多了~

关于作者

神经暖

暂无简介

文章

26 人气

关注发私信

诺曦

文章 0 评论 0

关注

要走干脆点

文章 0 评论 0

关注

把回忆走一遍

文章 0 评论 0

关注

陌上青苔

文章 0 评论 0

关注

Arthur

文章 0 评论 0

关注

哄哄

文章 0 评论 0

友情链接

文江博客

清理 Unicode 输入的最佳实践

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者