从 Ethiopic(和其他)音译为 ASCII (ሀ -> ha; ü -> ue)
我还不太擅长阅读阿姆哈拉语(天哪/埃塞俄比亚语)信件。
如果我有一段用 Ge'ez(埃塞俄比亚)字母书写的文本 ( http://en.wikipedia. org/wiki/Ge%27ez_language )我想将它们音译为 ASCII。
当我使用 LYNX 文本模式浏览器访问 http://www.addismap.com/am/ (阿姆哈拉语网页)它向我显示“edis 地图:yeedis ebeba karta”。我如何在 Python、Bash 或 PHP 中访问此功能?他们使用哪个 API?
似乎不是 iconv:
$ iconv -f UTF-8 -t ASCII//TRANSLIT
Input: ሀ ለ ሐ መ ሠ ረ ሰ
Output: ? ? ? ? ? ? ?
I am not yet so good with reading Amharic (Geez / Ethiopic) letters.
If I have a text in Ge'ez (Ethiopia) letters ( http://en.wikipedia.org/wiki/Ge%27ez_language ) I want to transliterate them to ASCII.
When I go with the LYNX Textmode browser to http://www.addismap.com/am/ (webpage in Amharic) it showes me "edis map: yeedis ebeba karta". How can I access this functionality for example in Python, Bash or PHP? Which API do they use?
It seems not to be iconv:
$ iconv -f UTF-8 -t ASCII//TRANSLIT
Input: ሀ ለ ሐ መ ሠ ረ ሰ
Output: ? ? ? ? ? ? ?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
Unicode 公共区域设置数据存储库 定义了一些音译。 Unidecode (或其 Python 端口) 还有更多。
The Unicode Common Locale Data Repository defines some transliterations. Unidecode (or its Python port) has even more of them.
ICU http://icu-project.org/ 具有阿姆哈拉语-拉丁语转换功能,可将您的文本转换为“hā le ḥā me še re se”。您可以在命令行中使用
uconv -x 'Amharic/BGN-Latin'
来使用它,或者使用 pycu。ICU http://icu-project.org/ has an Amharic-Latin transform, which will turn your text into "hā le ḥā me še re se". You could use this using
uconv -x 'Amharic/BGN-Latin'
from the command line, or use pyicu.