未知字符

发布于 2024-12-05 18:58:15 字数 176 浏览 0 评论 0原文

我从编码为“UTF-8”的文件中读取字符串。我需要将它与一个表达式相匹配。文件的第一个字符是#，但在字符串中第一个字符是''（空符号）。我已经将其转换为字符集“UTF-8”的字节，这里是[-17,-69,-65]。有谁知道它是什么以及如何用正则表达式解决它？

需要登录才能够评论，你可以免费注册一个本站的账号。

怪异←思 2024-12-12 18:58:15

某些编辑器（如记事本）在保存 UTF-8 文本时添加 BOM（字节顺序掩码）签名。在从此类文件读取字符串之前，您应该检查 0xEF、0xBB、0xBF 字节，如果存在则跳过它们。

另一种方法是不要使用记事本编辑 UTF-8 文本，使用其他程序，如 Notepad++、Kate 或任何可以控制添加 BOM 的程序。

~没有更多了~

暂无简介

0 文章

0 评论

22 人气

文章 0 评论 0

文章 0 评论 0

文章 0 评论 0

文章 0 评论 0

文章 0 评论 0

文章 0 评论 0