当前位置：文江博客话题详情

拉丁语词形变化：

发布于 2024-10-29 07:00:49 字数 1122 浏览 2 评论 0原文

我有一个单词数据库（包括名词和动词）。现在我想生成这些名词和动词的所有不同（变形）形式。做到这一点的最佳策略是什么？

由于拉丁语是一种高度变形的语言，因此存在：

a) 名词的词尾变化

b) < a href="http://en.wikipedia.org/wiki/Latin_conjugation" rel="nofollow noreferrer">动词的变化

请参阅此翻译页面以获取动词变化的示例（“mandare”）：结合

我不想手动输入所有单词的所有这些形式。

我怎样才能自动生成它们？最好的方法是什么？

一系列复杂的规则如何变形所有单词
贝叶斯方法
......

有一个名为“William Whitaker's Words”的程序。它也为拉丁词创建词形变化，所以它正是在做我想做的事情。

维基百科说该程序的工作原理如下：

Words 使用一组基于自然前置、中置和后缀、词尾变化和词形变化的规则来确定条目的可能性。由于这种分析单词结构的方法，即使程序找到给定单词的可能含义，也不能保证这些单词曾经在拉丁文学或演讲中使用过。

该程序的源代码也可在此处获取。但我真的不明白这是如何运作的。你能帮助我吗？也许这将是我的问题的解决方案......

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

雨巷深深 2024-11-05 07:00:49

您可以执行类似于 hunspell 字典格式的操作（请参阅 http://www.manpagez.com/man /4/hunspell/)

您定义了 2 个表。一个包含词根（永远不会改变的部分），另一个包含对给定类的修改。对于给定的类，对于每个词尾变化（或词形变化），它告诉在词根末尾（或开头）添加哪些字符。它甚至可以指定替换给定数量的字符。现在，要获得特定词尾变化的单词，您需要获取词根，应用它所属类别的转换，然后瞧！

例如，对于 mandare，根将是 mand，并且该类将包含诸如 o、as、ate, amous, atis... 用于主动指示性现在时。

回复收藏 0 原文

谜泪 2024-11-05 07:00:49

我将使用名词作为例子，但它也适用于动词。

首先，我将创建两个类：Regular 和 Irregular。对于 Regular 名词，我将为三个词尾变化创建三个类，并使它们全部实现 Declensable（或者无论如何这个词是英语:)接口 (FirstDeclension extends Regular Implements Declensable< /代码>）。该接口将定义两个静态枚举（NOMINATIVE、VOCATIVE等，以及SINGULAR、PLURAL ）。所有这些都有一个根字符串和后缀的静态哈希图。然后，FirstDeclension#get (case, number) 方法将根据哈希图附加正确的后缀。

Irregular 类应该必须为每个单词定义一个本地哈希图，然后实现相同的 Declensable 接口。

这有什么意义吗？

附录：澄清一下，class Regular 的构造函数是

public Regular (String stem) {
    this.stem = stem
}

I'll use as example the nouns, but it applies also to verbs.

First, I would create two classes: Regular and Irregular. For the Regular nouns, I would make three classes for the three declensions, and make them all implement a Declensable (or however the word is in English :) interface (FirstDeclension extends Regular implements Declensable). The interface would define two static enums (NOMINATIVE, VOCATIVE, etc, and SINGULAR, PLURAL).
All would have a string for the root and a static hashmap of suffixes. The method FirstDeclension#get (case, number) would then append the right suffix based on the hashmap.

The Irregular class should have to define a local hashmap for each word and then implement the same Declensable interface.

Does it make any sense?

Addendum: To clarify, the constructor of class Regular would be

public Regular (String stem) {
    this.stem = stem
}

回复收藏 0 原文

长亭外，古道边 2024-11-05 07:00:49

也许，您可以在实现中遵循 AOT 路线。（它属于 LGPL。）

AOT 中没有拉丁语形态，只有俄语、德语、英语，其中俄语当然是屈折形态的一个例子像拉丁语一样复杂，因此 AOT 应该准备好作为实现它的框架。

尽管如此，我相信在继续编程之前，人们必须拥有一个已经明确定义的形态的复杂精确的形式系统。至于俄语，我想，大多数工作形态计算机系统都是基于安德烈·扎利兹尼亚克（Andrey Zalizniak）以及《俄语语法词典》和相关著作中对俄语形态的认真分析。

回复收藏 0 原文

~没有更多了~

关于作者

就像说晚安

暂无简介

0 文章

0 评论

21 人气

关注发私信

友情链接

文江博客

拉丁语词形变化：

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

留蓝

18790681156

zach7772

Wini

ayeshaaroy

初雪

友情链接

拉丁语词形变化：

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

留蓝

18790681156

zach7772

Wini

ayeshaaroy

初雪

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。