phrase

phrase

文章 0 浏览 6

用Gensim的词汇包在Python中生成Trigrams

我有以下代码段,我可以在的情况下创建的代码段。分析目的: sent = [row for row in file_model.message] phrases = Phrases(sent, min_count=1, pro…

东走西顾 2025-01-22 05:20:49 2 0

使用 Gensim Phraser 识别包含单词“not”的二元组用于情感分析

我正在开展一个情感分析项目,在该项目中我正在分析文档语料库,并且我特别不删除单词“not”作为停用词,以便我可以使用它来确定文本是否同意或不同…

何以笙箫默 2025-01-15 10:25:28 1 0

Solr 搜索忽略第一个单词

我在网上浏览过SO和其他地方,但没有找到任何特定于我的问题的内容。我想知道还有其他人经历过吗?他们又是如何解决的呢? 我正在尝试对多单词字段进…

你与清晨阳光 2025-01-08 04:44:18 3 0

R 文本挖掘:计算特定单词在语料库中出现的次数?

我已经看到这个问题在其他语言中得到了回答,但在 R 中却没有。 [专门用于 R 文本挖掘]我有一组从语料库中获得的常用短语。现在我想搜索这些短语在另…

凉城已无爱 2024-12-28 22:11:28 4 0

Solr 3.4.0 中支持 EdgeNGram 分析和短语搜索

我想为 SOLR 查询中的每个术语启用“startsWith”搜索,但也能够执行短语搜索(在引号中给出)。 对于前缀搜索,我首先添加了后缀“*”。此解决方案允…

戏舞 2024-12-27 23:40:12 3 0

将天数转换为表达周和天的英语短语

我距离未来的约会还有几天,但想知道具体是多少周和多少天。另外,请注意,如果不到一周,那么它只会返回相同的数字。 这可能吗? 例如,17 天将是 2 …

离旧人 2024-12-24 02:50:02 5 0

搜索模式频率

最好是 PHP 解决方案——但任何想法都很棒。 给出一个文本 blob '这是一个包含一些内容的超级字符串,我想找到红色毛衣和紫色大象。紫色大象会数两次…

夜巴黎 2024-12-20 02:24:45 3 0

Solr:使用 EdgeNGramFilterFactory 进行精确短语查询

在 Solr (3.3) 中,是否可以通过 EdgeNGramFilterFactory 使字段可逐个字母搜索,并且对短语查询也敏感? 例如,我正在寻找一个字段,如果包含“contr…

疑心病 2024-12-07 04:25:26 5 0

有效地为字符串簇选择标题(簇的中心)

我有一个(不完美的)集群字符串数据,其中一个集群中的项目可能如下所示: [ Yellow ripe banana very tasty, Yellow ripe banana with little dots,…

恋你朝朝暮暮 2024-12-05 06:56:18 9 0

SQL Server 2008 (T-SQL) 中的短语搜索

我有一个包含 3 行的 varchar 列: i eat orange, orange, oranges are nice 我希望 SELECT 查询按以下顺序返回结果: orange, oranges are nice, i e…

巴黎盛开的樱花 2024-12-01 19:02:49 3 0

如何在java中查找文档中短语(多个标记字符串)的频率?

我想查找文档中多标记字符串或短语的频率。这不是我正在寻找的单词/单个术语的频率,它总是多个术语,并且术语的数量是动态的...... 例如:在文档中搜…

不必你懂 2024-11-29 09:22:04 5 0

Lucene.net 中带有特殊字符的精确短语

我在 lucene.net 中进行全文搜索时遇到问题,其中搜索结果包含特殊的 lucene 字符。 我的 Lucene 文档中有一个名为“content”的字段。该字段创建如下…

梦情居士 2024-11-29 00:27:38 4 0

高效的短语匹配算法

我有一组大约 700 万个短语,可以匹配大约 3 亿个查询。 查询可以是子字符串或包含短语本身。基本上我想要衡量两个短语之间的“相似性”[不一定是编辑…

顾挽 2024-10-18 08:03:50 6 0

如何使用 NLP 技术筛选成语并将短语与其他常见短语区分开来?

存在什么技术可以区分简单的常见短语(例如“to the”、“and the”)和具有自己词汇含义的固定短语和习语(例如“pick up”、“fall in love”、“红…

书信已泛黄 2024-10-09 21:31:03 11 0

如何在倒排索引结构中搜索短语查询?

如果我们想在倒排索引结构中搜索像“t1 t2 t3”这样的查询(t1,t2,t3必须排队), 我们应该采取哪些措施? 1-首先我们搜索 "t1" 术语并找到包含 "t1…

小…楫夜泊 2024-08-29 02:42:35 15 0
更多

推荐作者

十二

文章 0 评论 0

飞烟轻若梦

文章 0 评论 0

OPleyuhuo

文章 0 评论 0

wxb0109

文章 0 评论 0

旧城空念

文章 0 评论 0

-小熊_

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文