当前位置：文江博客话题详情

如何从 Wordnet 中获取按出现概率排序的同义词

发布于 2024-09-09 04:32:49 字数 232 浏览 8 评论 0原文

我正在 Wordnet 中搜索一大堆单词的同义词。按照我的方式，当某个单词有多个同义词时，结果按字母顺序返回。我需要的是让它们按出现概率排序，并且我只取前 1 个同义词。

我使用了prolog wordnet数据库和Syns2Index将其转换为Lucene类型索引来查询同义词。有没有办法让它们按这种方式按概率排序，或者我应该使用另一种方法？

速度并不重要，同义词查找不会在线完成。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

〃安静 2024-09-16 04:32:49

如果有人偶然发现这个线程，这就是要走的路（至少是我需要的）：

http://lyle.smu.edu/~tspell/jaws/doc/edu/smu/tspell/wordnet /impl/file/ReferenceSynset.html#getTagCount%28java.lang.String%29

tagCount 方法给出每个单词最可能的同义词集组。问题又是概率最高的同义词集可以有几个单词。但我想没有机会避免这个

回复收藏 0 原文

清醇 2024-09-16 04:32:49

我认为你应该再做一步（前提是速度并不重要）。

从 Lucene 索引中，您应该构建另一个字典，其中每个单词都映射到一个小对象，该对象包含唯一的同义词，其含义具有更高的出现概率，其含义和出现概率。即，给定以下代码：

class Synonym {
public:
    String name;
    double probability;
    String meaning;
}

Map<String, Synonym> m = new HashMap<String, Synonym>();

...您只需从 Lucene 索引中填充它即可。

I think that you should do another step (provided that speed is not important).

From the Lucene index, you should build another dictionary in which each word is mapped to a small object that contains the only synonym that its meaning has higher probability of appearance, its meaning, and probability of appearance. I.e., given this code:

class Synonym {
public:
    String name;
    double probability;
    String meaning;
}

Map<String, Synonym> m = new HashMap<String, Synonym>();

... you just have to fill it from the Lucene index.

回复收藏 0 原文

~没有更多了~

关于作者

桃扇骨

暂无简介

文章

25 人气

关注发私信

毁梦

文章 0 评论 0

关注

qq_02ocQH

文章 0 评论 0

关注

花期渐远

文章 0 评论 0

关注

鞋纸虽美，但不合脚ㄋ〞

文章 0 评论 0

关注

adminaaa

文章 0 评论 0

关注

yangzhenyu

文章 0 评论 0

友情链接

文江博客

如何从 Wordnet 中获取按出现概率排序的同义词

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者