从 Ethiopic(和其他)音译为 ASCII (ሀ -> ha; ü -> ue)

发布于 2024-09-19 09:09:52 字数 561 浏览 4 评论 0原文

我还不太擅长阅读阿姆哈拉语(天哪/埃塞俄比亚语)信件。

如果我有一段用 Ge'ez(埃塞俄比亚)字母书写的文本 ( http://en.wikipedia. org/wiki/Ge%27ez_language )我想将它们音译为 ASCII。

当我使用 LYNX 文本模式浏览器访问 http://www.addismap.com/am/ (阿姆哈拉语网页)它向我显示“edis 地图:yeedis ebeba karta”。我如何在 Python、Bash 或 PHP 中访问此功能?他们使用哪个 API?

似乎不是 iconv:

$ iconv -f UTF-8 -t ASCII//TRANSLIT
Input:    ሀ ለ ሐ መ ሠ ረ ሰ
Output:   ? ? ? ? ? ? ?

I am not yet so good with reading Amharic (Geez / Ethiopic) letters.

If I have a text in Ge'ez (Ethiopia) letters ( http://en.wikipedia.org/wiki/Ge%27ez_language ) I want to transliterate them to ASCII.

When I go with the LYNX Textmode browser to http://www.addismap.com/am/ (webpage in Amharic) it showes me "edis map: yeedis ebeba karta". How can I access this functionality for example in Python, Bash or PHP? Which API do they use?

It seems not to be iconv:

$ iconv -f UTF-8 -t ASCII//TRANSLIT
Input:    ሀ ለ ሐ መ ሠ ረ ሰ
Output:   ? ? ? ? ? ? ?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

绝對不後悔。 2024-09-26 09:10:05

Unicode 公共区域设置数据存储库 定义了一些音译。 Unidecode (或其 Python 端口) 还有更多。

The Unicode Common Locale Data Repository defines some transliterations. Unidecode (or its Python port) has even more of them.

山色无中 2024-09-26 09:10:01

ICU http://icu-project.org/ 具有阿姆哈拉语-拉丁语转换功能,可将您的文本转换为“hā le ḥā me še re se”。您可以在命令行中使用 uconv -x 'Amharic/BGN-Latin' 来使用它,或者使用 pycu

ICU http://icu-project.org/ has an Amharic-Latin transform, which will turn your text into "hā le ḥā me še re se". You could use this using uconv -x 'Amharic/BGN-Latin' from the command line, or use pyicu.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文