transliteration

transliteration

文章 0 浏览 5

将西里尔文转换为拉丁文 - 拉丁入侵者/例外

我正在使用简单的字典将西里尔字母替换为拉丁字母,大多数时候它工作得很好,但是当有一些拉丁字母作为输入时我遇到了问题。大多数时候是公司名称。 …

雪花飘飘的天空 2025-01-10 18:37:23 1 0

如何使用 inltk 标记印度语言

我使用这个 NLP 文档做到了这一点,请查看: https://inltk.readthedocs.io/en/latest/index.html from inltk.inltk import tokenize text="जो मु…

时光礼记 2025-01-09 14:54:44 0 0

使用 Newtonsoft.Json 在 C# 中反序列化 Google 音译

作为初学者,我尝试反序列化 Google 音译器返回数组。这是一个像这样的 JSON 数组: [{"ew" : "namaste","hws" : ["नमस्ते","नमसते","नम…

蛮可爱 2025-01-08 14:42:35 0 0

Java Swing 项目中的 Google 音译 API

我正在开发一个 Java Swing 的音译项目。它可以访问互联网,但我无法对其进行设置。我们该怎么做呢?我们需要下载 Google API 库还是只需一个函数调用…

回忆躺在深渊里 2025-01-02 06:58:57 1 0

使用批处理逐字符转换用户输入

好吧,基本上我想要一个简单的批处理程序,以这样的方式将 X 字符更改为 Y 字符, a-b b-c c-d d-e e-f etc etc etc 我查找字符串和其他变量技巧,但…

画尸师 2024-12-13 11:06:41 2 0

Solr、特殊字符和拉丁文到西里尔文字符转换

我正在尝试使用 Solr (或 Lucene)设置一个搜索引擎,它可以包含带有特殊字符的拉丁文文本(特殊字符包括 Ö 或 Ç 作为示例)或西里尔字符(示例包括 …

温折酒 2024-12-07 22:51:01 4 0

Emacs 代码页问题:Terminus 字体、utf-8 和西里尔文转译输入

我喜欢 Emacs 的 cyrillic-translit 输入法。然而,当我将美妙的 Terminus 设置为我的默认字体后,俄语字符出现在 Arial 或其他字体中(无论如何,它…

苄①跕圉湢 2024-12-07 17:28:02 4 0

基于音译的单词查找的高效数据结构/算法

我正在寻找一种有效的数据结构/算法来存储和搜索基于音译的单词查找(就像谷歌所做的那样:http: //www.google.com/transliterate/ 但我并没有尝试使…

呆橘 2024-12-06 04:31:44 3 0

PHP 中的西里尔字母音译

如何将西里尔字母转写为拉丁字母? E.g. Главная страница -> Glavnaja stranica 这个 音译 PHP 扩展 可以很好地做到这一点,但我无法…

狼性发作 2024-12-05 07:53:48 4 0

将 unicode 数字从英语转换为梵文

我一直在寻找一些正则表达式或任何其他方法将数字 0-9 转换为०-९(梵文脚本)。我正在使用 asp.net,但在全球化命名空间中找不到执行此操作的任何方…

贵在坚持 2024-11-19 02:40:29 8 0

ICU自定义音译

我希望利用 ICU 库进行音译,但我想为一组特定的自定义音译提供一个自定义音译文件,以便在编译时合并到 ICU 核心中,以便在其他地方以二进制形式使用…

聆听风音 2024-11-14 21:13:39 6 0

用其表音相似字符替换特殊字符(在 php - utf8 中)

您知道有很多字符,例如 è 或 é。还有更多,比如 ö,ä,ì,á,ù,... 我想用它的“pheneticpartner”字符替换这些字符,但我不想像 str_replace(array("á",…

苍暮颜 2024-11-05 13:39:08 9 0

ICU 中的拉丁文<->汉文转换?

我刚刚开始在 C++ 程序中使用 ICU4C 实现 ICU 转换。我特别关注中文的音译。 根据本文档,该包同时支持“Han-Latin”和“Latin” -汉”转换。作为一…

天气好吗我好吗 2024-11-04 11:51:48 9 0

array_flip() 和 utf8

我有一个数组(18 个键): $en = array( 'Ą' => 'A', 'Č' => 'C', 'Ę' => 'E', 'Ė' => 'E', 'Į' => 'I', 'Š' => 'S', 'Ų' => 'U', 'Ū' => 'U…

不喜欢何必死缠烂打 2024-10-24 22:40:16 7 0

陷入 for c# 循环!

我有两个 xml 文件,其中有 devanagri 到 itrans 映射,这些文件是 dev.xml 和古吉拉特语.xml。 xml 文件内容如下: 对于 guj.xml 它是: અ a 对于 d…

怎会甘心 2024-10-24 06:39:22 7 0
更多

推荐作者

佚名

文章 0 评论 0

羁客

文章 0 评论 0

文章 0 评论 0

夏日落

文章 0 评论 0

隐诗

文章 0 评论 0

更多

友情链接

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文