phrase

投稿关注

文章 0 浏览 6

用Gensim的词汇包在Python中生成Trigrams

我有以下代码段，我可以在的情况下创建的代码段。分析目的： sent = [row for row in file_model.message] phrases = Phrases(sent, min_count=1, pro…

东走西顾 2025-01-22 05:20:49 2 0

使用 Gensim Phraser 识别包含单词“not”的二元组用于情感分析

我正在开展一个情感分析项目，在该项目中我正在分析文档语料库，并且我特别不删除单词“not”作为停用词，以便我可以使用它来确定文本是否同意或不同…

何以笙箫默 2025-01-15 10:25:28 1 0

Solr 搜索忽略第一个单词

我在网上浏览过SO和其他地方，但没有找到任何特定于我的问题的内容。我想知道还有其他人经历过吗？他们又是如何解决的呢？我正在尝试对多单词字段进…

你与清晨阳光 2025-01-08 04:44:18 3 0

R 文本挖掘：计算特定单词在语料库中出现的次数？

我已经看到这个问题在其他语言中得到了回答，但在 R 中却没有。 [专门用于 R 文本挖掘]我有一组从语料库中获得的常用短语。现在我想搜索这些短语在另…

凉城已无爱 2024-12-28 22:11:28 4 0

Solr 3.4.0 中支持 EdgeNGram 分析和短语搜索

我想为 SOLR 查询中的每个术语启用“startsWith”搜索，但也能够执行短语搜索（在引号中给出）。对于前缀搜索，我首先添加了后缀“*”。此解决方案允…

戏舞 2024-12-27 23:40:12 3 0

将天数转换为表达周和天的英语短语

我距离未来的约会还有几天，但想知道具体是多少周和多少天。另外，请注意，如果不到一周，那么它只会返回相同的数字。这可能吗？例如，17 天将是 2 …

离旧人 2024-12-24 02:50:02 5 0

搜索模式频率

最好是 PHP 解决方案——但任何想法都很棒。给出一个文本 blob '这是一个包含一些内容的超级字符串，我想找到红色毛衣和紫色大象。紫色大象会数两次…

夜巴黎 2024-12-20 02:24:45 3 0

Solr：使用 EdgeNGramFilterFactory 进行精确短语查询

在 Solr (3.3) 中，是否可以通过 EdgeNGramFilterFactory 使字段可逐个字母搜索，并且对短语查询也敏感？例如，我正在寻找一个字段，如果包含“contr…

疑心病 2024-12-07 04:25:26 5 0

有效地为字符串簇选择标题（簇的中心）

我有一个（不完美的）集群字符串数据，其中一个集群中的项目可能如下所示： [ Yellow ripe banana very tasty, Yellow ripe banana with little dots,…

恋你朝朝暮暮 2024-12-05 06:56:18 9 0

SQL Server 2008 (T-SQL) 中的短语搜索

我有一个包含 3 行的 varchar 列： i eat orange, orange, oranges are nice 我希望 SELECT 查询按以下顺序返回结果： orange, oranges are nice, i e…

巴黎盛开的樱花 2024-12-01 19:02:49 3 0

如何在java中查找文档中短语（多个标记字符串）的频率？

我想查找文档中多标记字符串或短语的频率。这不是我正在寻找的单词/单个术语的频率，它总是多个术语，并且术语的数量是动态的...... 例如：在文档中搜…

不必你懂 2024-11-29 09:22:04 5 0

Lucene.net 中带有特殊字符的精确短语

我在 lucene.net 中进行全文搜索时遇到问题，其中搜索结果包含特殊的 lucene 字符。我的 Lucene 文档中有一个名为“content”的字段。该字段创建如下…

梦情居士 2024-11-29 00:27:38 4 0

高效的短语匹配算法

我有一组大约 700 万个短语，可以匹配大约 3 亿个查询。查询可以是子字符串或包含短语本身。基本上我想要衡量两个短语之间的“相似性”[不一定是编辑…

顾挽 2024-10-18 08:03:50 6 0

如何使用 NLP 技术筛选成语并将短语与其他常见短语区分开来？

存在什么技术可以区分简单的常见短语（例如“to the”、“and the”）和具有自己词汇含义的固定短语和习语（例如“pick up”、“fall in love”、“红…

书信已泛黄 2024-10-09 21:31:03 11 0

如何在倒排索引结构中搜索短语查询？

如果我们想在倒排索引结构中搜索像“t1 t2 t3”这样的查询（t1，t2，t3必须排队），我们应该采取哪些措施？ 1-首先我们搜索 "t1" 术语并找到包含 "t1…

小…楫夜泊 2024-08-29 02:42:35 15 0

共 2 页
1
2
下一页

友情链接

文江博客