拉丁字母到英文字母哈希

发布于 2024-10-08 23:44:15 字数 160 浏览 3 评论 0原文

我必须将所有拉丁字符转换为相应的英文字母。我可以使用 Python 来做吗?或者有没有可用的映射?

非 Unicode 字符

Ramírez Sánchez 的 Unicode 值应转换为 Ramirez Sanchez

I have to convert all the latin characters to their corresponding English alphabets. Can I use Python to do it? Or is there a mapping available?

Unicode values to non-unicode characters

Ramírez Sánchez should be converted to Ramirez Sanchez.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

天气好吗我好吗 2024-10-15 23:44:15

看来您想要的是消除口音。您可以通过以下方式执行此操作:

def strip_accents(text):
    return ''.join(char for char in
                   unicodedata.normalize('NFKD', text)
                   if unicodedata.category(char) != 'Mn')

>>> strip_accents('áéíñóúü')
'aeinouu'
>>> strip_accents('Ramírez Sánchez')
'Ramirez Sanchez'

这对于西班牙语来说效果很好,但请注意,它并不总是适用于其他语言。

>>> strip_accents('ø')
'ø'

It looks like what you want is accent removal. You can do this with:

def strip_accents(text):
    return ''.join(char for char in
                   unicodedata.normalize('NFKD', text)
                   if unicodedata.category(char) != 'Mn')

>>> strip_accents('áéíñóúü')
'aeinouu'
>>> strip_accents('Ramírez Sánchez')
'Ramirez Sanchez'

This works fine for Spanish, but note that it doesn't always work for other languages.

>>> strip_accents('ø')
'ø'
~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文