去除utf中的垃圾字符

发布于 2024-11-19 11:28:48 字数 261 浏览 1 评论 0原文

我使用 utf8 格式将所有数据存储到 mysql 中。在将数据插入数据库之前，我需要清理带有不需要的字符的字符串。字符串采用 utf8 格式。我知道如何使用正则表达式和字符串替换，但不知道如何使用阿拉伯字符。

需要清理的示例字符串：“████ .. ????????????????????????????????????????????????????????????????????????????????????????????????????????????

谢谢你

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

子栖 2024-11-26 11:28:48

好的。正如 @Jonathan Leffler 已经说过的，如果您可以指定需要替换的字符的 unicode 字符范围，您可以使用正则表达式将字符替换为空字符串。

unicode 字符在表达式（在 PHP 中）中指定为 \x{FFFF}。此外，您还必须设置 u 修饰符使 PHP 将模式视为 UTF8。

所以最后，你会得到这样的结果：

preg_replace('/[\x{FFFF}-\x{FFFF}]+/u','',$string);

其中

/.../u 是分隔符加上修饰符
[...]+ 是字符类加上量词，这意味着 匹配这些字符一次或多次
\x{FFFF}-\x{FFFF} 是一个 unicode 字符范围（显然你必须提供正确的代码点/字符数）。

您还可以使用 ^ 来否定该组，您可以指定要保留的范围：

preg_replace('/[^\x{FFFF}-\x{FFFF}]+/u','',$string);

更多信息：

Ok. As @Jonathan Leffler already said, if you can specify the unicode character ranges for the characters that need to be replaced, you can use a regular expression to replace the characters with an empty string.

A unicode character is specified as \x{FFFF} in an expression (in PHP). In addition, you have to set the u modifier to make PHP treat the pattern as UTF8.

So in the end, you have something like this:

preg_replace('/[\x{FFFF}-\x{FFFF}]+/u','',$string);

where

/.../u are the delimiters plus the modifier
[...]+ is a character class plus quantifier, which means match any of these characters inside one or mor times
\x{FFFF}-\x{FFFF} is a unicode character range (obviously you have to provide the right codepoints/numbers of the characters).

You can also negate the group with a ^ you can specify the range which you want to keep:

preg_replace('/[^\x{FFFF}-\x{FFFF}]+/u','',$string);

More information:

回复收藏 0 原文

~没有更多了~

关于作者

忆悲凉

暂无简介

0 文章

0 评论

23 人气

关注发私信

友情链接

文江博客

去除utf中的垃圾字符

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

丿*梦醉红颜

我怀念的。

森林的天空

〇下7度

命硬

yyqoni

友情链接

去除utf中的垃圾字符

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

丿*梦醉红颜

我怀念的。

森林的天空

〇下7度

命硬

yyqoni

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。