如何读取包含 UTF-8 十六进制编码字符的文件,然后将字符解码为 HTML 十六进制数字?

发布于 2024-10-12 10:47:17 字数 348 浏览 1 评论 0原文

我有一个包含 UTF-8 十六进制编码字符的文件,如下所示:

<root>
<element>1 \xc3\x97 2 = 2</element>
</root>

我想读取该文件并将所有 \xhh 字符转换为等效的 HTML 十六进制数字,然后写入新文件。因此,给定一个包含上述内容的文件,新文件必须如下所示:

<root>
<element>1 &#xd7; 2 = 2</element>
</root>

谢谢!

I have a file containing UTF-8 hex encoded characters, as below:

<root>
<element>1 \xc3\x97 2 = 2</element>
</root>

I want to read the file and transform all the \xhh characters to the equivalent HTML hex numbers and then write to a new file. So, given a file with the above contents, the new file must look like:

<root>
<element>1 × 2 = 2</element>
</root>

Thanks!

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

他是夢罘是命 2024-10-19 10:47:17

假设您在输入流上使用了 :utf8 ,那么这将修复数据:

s/([^\x00-\x7F])/sprintf "&#x%x;", ord $1/ge;

Assuming you’ve used :utf8 on the input stream, then this will fix the data:

s/([^\x00-\x7F])/sprintf "&#x%x;", ord $1/ge;
~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文