当前位置：文江博客话题详情

perl中的编码问题

发布于 2024-11-15 02:12:36 字数 256 浏览 1 评论 0原文

我有一个编码问题，想寻求帮助。我注意到如果我选择“UTF-8”作为编码，有（至少）两个双引号 " 和 “。但是当我选择“ISO-8859-1 " 作为编码，我看到后面的双引号变成 ¡°，或者有时例如 –。

任何人都可以解释为什么会出现这种情况吗？如何匹配“并将其替换为”在 Perl 中使用正则表达式？

多谢。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

暗恋未遂 2024-11-22 02:12:36

ISO-8859-1 是一种每个字符一个字节的编码。花哨的 Unicode 双引号不在 ISO-8859-1 字符集中。所以您看到的是一个表示为 ISO-8859-1 字节序列的多字节字符。

要匹配这些奇怪的东西，请参阅 perlunicode 手册页，尤其是 \x{...}和 \N{...} 转义序列。

要回答您的问题，请尝试使用 \x{201C} 来匹配 Unicode 左双引号，并尝试使用 \x{201D} 来匹配右双引号。您在问题中错过了后者:-)。

[更新]

我应该提供我的参考资料...英国的一位好绅士在 ASCII 和 Unicode 引号。普通的 ASCII/ISO-8859-1 双引号称为引号。

回复收藏 0 原文

时光无声 2024-11-22 02:12:36

可能是这样的 旧帖子会有所帮助..

回复收藏 0 原文

~没有更多了~

关于作者

橘味果▽酱

暂无简介

0 文章

0 评论

24 人气

关注发私信

尘世孤行

文章 0 评论 0

关注

烟─花易冷

文章 0 评论 0

关注

你是年少的欢喜

文章 0 评论 0

关注

倒带

文章 0 评论 0

关注

忱杏

文章 0 评论 0

关注

送君千里

文章 0 评论 0

友情链接

文江博客

perl中的编码问题

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

尘世孤行

烟─花易冷

你是年少的欢喜

倒带

忱杏

送君千里

友情链接

perl中的编码问题

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

尘世孤行

烟─花易冷

你是年少的欢喜

倒带

忱杏

送君千里

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。