如何使用 inltk 标记印度语言
我使用这个 NLP 文档做到了这一点,请查看: https://inltk.readthedocs.io/en/latest/index.html from inltk.inltk import tokenize text="जो मु…
使用 Newtonsoft.Json 在 C# 中反序列化 Google 音译
作为初学者,我尝试反序列化 Google 音译器返回数组。这是一个像这样的 JSON 数组: [{"ew" : "namaste","hws" : ["नमस्ते","नमसते","नम…
Java Swing 项目中的 Google 音译 API
我正在开发一个 Java Swing 的音译项目。它可以访问互联网,但我无法对其进行设置。我们该怎么做呢?我们需要下载 Google API 库还是只需一个函数调用…
使用批处理逐字符转换用户输入
好吧,基本上我想要一个简单的批处理程序,以这样的方式将 X 字符更改为 Y 字符, a-b b-c c-d d-e e-f etc etc etc 我查找字符串和其他变量技巧,但…
Solr、特殊字符和拉丁文到西里尔文字符转换
我正在尝试使用 Solr (或 Lucene)设置一个搜索引擎,它可以包含带有特殊字符的拉丁文文本(特殊字符包括 Ö 或 Ç 作为示例)或西里尔字符(示例包括 …
Emacs 代码页问题:Terminus 字体、utf-8 和西里尔文转译输入
我喜欢 Emacs 的 cyrillic-translit 输入法。然而,当我将美妙的 Terminus 设置为我的默认字体后,俄语字符出现在 Arial 或其他字体中(无论如何,它…
基于音译的单词查找的高效数据结构/算法
我正在寻找一种有效的数据结构/算法来存储和搜索基于音译的单词查找(就像谷歌所做的那样:http: //www.google.com/transliterate/ 但我并没有尝试使…
PHP 中的西里尔字母音译
如何将西里尔字母转写为拉丁字母? E.g. Главная страница -> Glavnaja stranica 这个 音译 PHP 扩展 可以很好地做到这一点,但我无法…
用其表音相似字符替换特殊字符(在 php - utf8 中)
您知道有很多字符,例如 è 或 é。还有更多,比如 ö,ä,ì,á,ù,... 我想用它的“pheneticpartner”字符替换这些字符,但我不想像 str_replace(array("á",…
ICU 中的拉丁文<->汉文转换?
我刚刚开始在 C++ 程序中使用 ICU4C 实现 ICU 转换。我特别关注中文的音译。 根据本文档,该包同时支持“Han-Latin”和“Latin” -汉”转换。作为一…
array_flip() 和 utf8
我有一个数组(18 个键): $en = array( 'Ą' => 'A', 'Č' => 'C', 'Ę' => 'E', 'Ė' => 'E', 'Į' => 'I', 'Š' => 'S', 'Ų' => 'U', 'Ū' => 'U…
陷入 for c# 循环!
我有两个 xml 文件,其中有 devanagri 到 itrans 映射,这些文件是 dev.xml 和古吉拉特语.xml。 xml 文件内容如下: 对于 guj.xml 它是: અ a 对于 d…