用于获取字母同义词/相似字形的 Java 库

发布于 2024-12-17 07:24:37 字数 146 浏览 1 评论 0原文

我想知道是否有一个库可以让字符获取其同义词?

像这样的东西:

char c = getNextChar();
if (c == latin.H || c == cyrillic.H) {
    //...
}

I would like to know whether there is a library which allows characters to get their synonyms?

something like:

char c = getNextChar();
if (c == latin.H || c == cyrillic.H) {
    //...
}

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

阳光的暖冬 2024-12-24 07:24:37

所以,据我了解,你不需要字母的“同义词”;你需要字母的“同义词”。您想要具有相同“字形”(形状)的字母。

我不知道是否存在这样的图书馆。但是,您可以通过使用您最喜欢的字体渲染字符并检查字形“相同性”来做到这一点。

例如,您可以采取以下步骤:

  • 下载 UniFont,最好是在其 BDF形式
  • 的位图计算校验和(例如MD5)
  • 为每个字符组 基于校验和的字符。

我创建了一个 小型 Python 2.7 测试脚本(出于开发速度的目的)执行上述步骤,生成类似的内容(摘录):

Group 0041
        U+0041 LATIN CAPITAL LETTER A
        U+0391 GREEK CAPITAL LETTER ALPHA
        U+13AA CHEROKEE LETTER GO
Group 0042
        U+0042 LATIN CAPITAL LETTER B
        U+0392 GREEK CAPITAL LETTER BETA
        U+0412 CYRILLIC CAPITAL LETTER VE
        U+13F4 CHEROKEE LETTER YV

YMMV。

So, as I understand it, you don't want “synonyms” of letters; you want letters with the same “glyphs” (shapes).

I don't know if such a library exists. However, you can do it by rendering chars using your favourite font and checking glyph “sameness”.

For example, you can take the following steps:

  • Download UniFont, preferrably in its BDF form
  • Calculate a checksum (e.g MD5) for the bitmap of every character
  • Group characters based on their checksum.

I created a small Python 2.7 test script (for development speed purposes) doing the above steps, producing something like (excerpt):

Group 0041
        U+0041 LATIN CAPITAL LETTER A
        U+0391 GREEK CAPITAL LETTER ALPHA
        U+13AA CHEROKEE LETTER GO
Group 0042
        U+0042 LATIN CAPITAL LETTER B
        U+0392 GREEK CAPITAL LETTER BETA
        U+0412 CYRILLIC CAPITAL LETTER VE
        U+13F4 CHEROKEE LETTER YV

YMMV.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文