确定 UTF-8 文本是否都是 ASCII?
在 PHP 中,确定某些给定的 UTF-8 文本是否是纯 ASCII 的最快方法是什么?
What's the fastest way, in PHP, to determine if some given UTF-8 text is purely ASCII or not?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
一个可能更快的函数是使用负字符类(因为正则表达式可以在遇到第一个字符时停止,并且不需要在内部捕获任何内容):
没有正则表达式(基于我的评论){
但我有问一下,你为什么这么关心更快?使用更具可读性和更容易理解的版本,只有当您知道这是一个问题时才担心优化它...
编辑:
另一个选择是
mb_check_encoding
:A possibly faster function would be to use a negative character class (since the regex can just stop when it hits the first character, and there's no need to internally capture anything):
Without regex (based on my comment) {
But I'd have to ask, why are you so concerned about faster? Use the more readable and easier to understand version, and only worry about optimizing it when you know it's a problem...
Edit:
Another option is
mb_check_encoding
:检查是否有任何字节大于 0x7f,或者是否有任何字符高于 U+007F。
Check if any byte is greater than 0x7f, or any character is above U+007F.