Solr、特殊字符和拉丁文到西里尔文字符转换
我正在尝试使用 Solr (或 Lucene)设置一个搜索引擎,它可以包含带有特殊字符的拉丁文文本(特殊字符包括 Ö 或 Ç 作为示例)或西里尔字符(示例包括 …
Emacs 代码页问题:Terminus 字体、utf-8 和西里尔文转译输入
我喜欢 Emacs 的 cyrillic-translit 输入法。然而,当我将美妙的 Terminus 设置为我的默认字体后,俄语字符出现在 Arial 或其他字体中(无论如何,它…
基于音译的单词查找的高效数据结构/算法
我正在寻找一种有效的数据结构/算法来存储和搜索基于音译的单词查找(就像谷歌所做的那样:http: //www.google.com/transliterate/ 但我并没有尝试使…
PHP 中的西里尔字母音译
如何将西里尔字母转写为拉丁字母? E.g. Главная страница -> Glavnaja stranica 这个 音译 PHP 扩展 可以很好地做到这一点,但我无法…
用其表音相似字符替换特殊字符(在 php - utf8 中)
您知道有很多字符,例如 è 或 é。还有更多,比如 ö,ä,ì,á,ù,... 我想用它的“pheneticpartner”字符替换这些字符,但我不想像 str_replace(array("á",…
ICU 中的拉丁文<->汉文转换?
我刚刚开始在 C++ 程序中使用 ICU4C 实现 ICU 转换。我特别关注中文的音译。 根据本文档,该包同时支持“Han-Latin”和“Latin” -汉”转换。作为一…
array_flip() 和 utf8
我有一个数组(18 个键): $en = array( 'Ą' => 'A', 'Č' => 'C', 'Ę' => 'E', 'Ė' => 'E', 'Į' => 'I', 'Š' => 'S', 'Ų' => 'U', 'Ū' => 'U…
陷入 for c# 循环!
我有两个 xml 文件,其中有 devanagri 到 itrans 映射,这些文件是 dev.xml 和古吉拉特语.xml。 xml 文件内容如下: 对于 guj.xml 它是: અ a 对于 d…
Google Transliteration API:如何获取输入和翻译将输出保存在文本文件中?
大家好; 我需要在 java 应用程序中使用 google transliterrate api。 到目前为止,我所做的是将示例导入到 netbeans 中名为“hellolanguage”的库“g…
在 perl 中保存音译表
我想用 0 音译 1 - 8 的数字,但在编译时不知道数字。由于音译不会插入变量,所以我这样做: @trs = (sub{die},sub{${$_[0]} =~ tr/[0,1]/[1,0]/}…
iOS/Android 上的音译
是否可以在 iOS 上特别使用 Google Transliterate API 和/或安卓? 这里的关键是能够让用户在任何常规文本字段中的任何位置键入非英语(从英语音译)…
在 Ruby 中使用 Iconv 进行音译
当我尝试使用 Iconv.iconv('ascii//ignore//translit', 'utf-8', string).to_s (参见 questions/1726404/transliteration-in-ruby) 我得到了除了那些…