当前位置：文江博客话题详情

C# regex Unicode character-properties

正则表达式和数据库读/写中的 Unicode

发布于 2024-10-04 05:40:40 字数 359 浏览 16 评论 0原文

晚安，

我目前正在基于正则表达式匹配的 C# 中为人类语言开发一个非常简单的词法分析器，我目前面临的问题是指定一个可以匹配目标语言中所有可能的标点符号的正则表达式，以及另一个可以匹配的正则表达式。还可以匹配各种空格。在 Stack Overflow 和另一个网站中搜索后，我发现我可以分别使用正则表达式 \p{P} 表示标点符号，使用 \p{Z} 表示空格，并且它可以工作从文本文件读取时。问题是，在最终的程序中，需要从 SQL 数据库读取记录并使用词法分析器处理它们，而且我不知道数据库中记录的编码是什么。在这种情况下这会成为问题吗？无论编码是什么，上述正则表达式是否可以匹配输入的每个标点符号和空白字符？

非常感谢。

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（1）

一片旧的回忆 2024-10-11 05:40:40

.NET Framework 会将数据库中的字符串转换为 Unicode。是否正确转换它们取决于是否有东西告诉它数据库文本编码是什么。但您的 Regex 看到的字符串将采用 Unicode。

因此，假设数据库访问层正确转换了数据库记录中的文本，您不必担心编码，因为它始终是 Unicode。

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

文章

评论

27 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

5040234068

文章 0 评论 0

樱花雨梦

文章 0 评论 0

≈。彩虹

文章 0 评论 0

雨轻弹

文章 0 评论 0

血之狂魔

文章 0 评论 0

qq_0bIjwE

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文