当前位置：文江博客话题详情

internationalization locale case-sensitive

UNIX下如何准确转换字符大小写？（假设 i18N）

发布于 2024-07-24 09:40:24 字数 361 浏览 7 评论 0原文

我试图了解如何在存在不同语言环境的情况下准确地操作 UNIX 中的字符和字符集，并且这样做不需要 UNIX 标准项目之外的特殊工具。

我的研究向我展示了德语升号 s 字符的问题：一个字符变成两个字符 - 以及其他问题。使用 tr 显然是一个非常糟糕的主意。我看到的唯一选择是这样的：

echo StUfF | perl -n -e "print lc($_);"

但我不确定这是否可行，并且它需要 Perl - 不一定是一个坏要求，但一个非常大的锤子......

awk 和 grep 和 sed 和......怎么样？这或多或少是我的问题：我如何确保文本在每个区域设置中都是小写的？

I'm trying to get a feel for how to manipulate characters and character sets in UNIX accurately given the existance of differing locales - and doing so without requiring special tools outside of UNIX standard items.

My research has shown me the problem of the German sharp-s character: one character changes into two - and other problems. Using tr is apparently a very bad idea. The only alternative I see is this:

echo StUfF | perl -n -e "print lc($_);"

but I'm not certain that will work, and it requires Perl - not a bad requirement necessarily, but a very big hammer...

What about awk and grep and sed and ...? That, more or less, is my question: how can I be sure that text will be lower-cased in every locale?

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（2）

紙鸢 2024-07-31 09:40:25

Perl lc/uc 适用于大多数语言，但无法正确处理土耳其语，请参阅我的这个错误报告了解详细信息。但如果您不需要担心土耳其语，那么 Perl 是不错的选择。

回复收藏 0 原文

茶底世界 2024-07-31 09:40:25

您无法确定文本在每个区域设置中都是正确的。这是不可能的，关于i18n相关人员的实现，软件库中总是存在一些错误。

如果你不害怕使用 C++ 或 Java，你可以看看 ICU ，它实现了广泛的整理、标准化等规则。

回复收藏 0 原文

~没有更多了~

关于作者

黯然#的苍凉

暂无简介

文章

评论

25 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

Promise

文章 0 评论 0

qq_lbRlsh

文章 0 评论 0

待＂谢繁草

文章 0 评论 0

yy2010hell

文章 0 评论 0

漫无边际

文章 0 评论 0

傲娇萝莉攻

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文