information-retrieval

information-retrieval

文章 0 浏览 7

搜索关键词排名

问题是:如何根据搜索时间和次数对我的 Web 应用程序中的搜索查询中使用的关键字进行排名? 用户在文本框中键入他的搜索查询。通过 AJAX 我需要向用户…

诺曦 2024-12-04 11:56:22 11 0

用于在网站上查找联系方式的脚本或库

有谁知道脚本/食谱/库可以在网站上查找最相关的联系信息? 一些可能的情况: 在个人网页上查找联系电话号码 在博客上查找所有者电子邮件地址 查找联系…

冰雪梦之恋 2024-12-03 01:54:18 8 0

如何构建一个算法来根据关键字对 HTML 页面进行分类?

我正在尝试创建一种算法,根据在页面上找到的关键字设置与网页的某些相关性。 我现在正在这样做: 我设置了一些单词和它们的值:“movie”(10),“cin…

沫雨熙 2024-12-02 14:08:40 8 0

给定一个大的 URL 列表,将 URL 分组为模式或正则表达式的最佳数据挖掘方法是什么?

我有一个包含 100 万个 URL 的列表,我想将相似的 URL 聚集在一起。该过程的输出将是正则表达式或模式的列表。理想情况下,我想使用 Ruby 来导出数据…

无需解释 2024-12-01 09:43:49 10 0

有没有可以让我按图像搜索的 API?

我有一张图片,我想搜索看看它是什么。有可用的 API 吗?…

戏剧牡丹亭 2024-11-30 03:49:18 7 0

如何选择其中没有其他 div 的 div 元素?

我正在使用 Java 和 Jsoup 来解析 HTML 页面,我想获取所有不包含其他 div 的 div 来打印它包含的文本。 但例如,如果一个 div 包含一个表,而该表包…

再可℃爱ぅ一点好了 2024-11-29 08:08:31 12 0

全文个性化搜索产品

有哪些全文搜索技术可以支持全文个性化搜索? 例如,您选择的网络邮件提供商中的联系人搜索:它是全文,但仅搜索您的个人联系人,而不是整个联系人。 …

梦亿 2024-11-28 22:12:00 9 0

如何从 HTML 页面中仅提取主要文本内容?

更新 Boilerpipe 似乎工作得很好,但我意识到我不需要只主要内容,因为许多页面没有文章,而只需要对整个文本进行一些简短描述的链接(这在新闻门户中…

吐个泡泡 2024-11-28 21:58:35 7 0

重建现在著名的 17 岁的基于马尔可夫链的信息检索算法“Apodora”

当我们都在百思不得其解时,一名 17 岁的加拿大男孩显然发现了一种信息检索算法,该算法: a)执行精度是当前广泛使用的向量空间模型的两倍 b)“相当…

凯凯我们等你回来 2024-11-28 06:19:25 10 0

查询词消除

在布尔检索模型中,查询由使用不同运算符组合在一起的术语组成。乍一看,连接是最明显的选择,但是当查询长度增长时,糟糕的事情就会发生。使用合取时…

ぶ宁プ宁ぶ 2024-11-27 00:35:39 11 0

我应该如何考虑搜索引擎索引?

我正在使用弹性搜索,但不明白索引到底是什么。例如,如果我有 3 个模型(背包、鞋子和手套),我是否将每个模型放入自己的索引中,或者是否为每个模…

我ぃ本無心為│何有愛 2024-11-25 12:34:02 7 0

在 Python 中使用 Whoosh 进行模糊字符串搜索

我在 MongoDB 中建立了一个大型银行数据库。我可以轻松地获取这些信息并用它快速创建索引。例如,我希望能够匹配银行名称“Eagle Bank &”密苏里州信…

失眠症患者 2024-11-24 08:13:55 14 0

Lucene 中的 Jaccard 相似度

我需要使用 Jaccard 相似度与 n 元语法来计算 Lucene 中查询和文档的相似度。由于 Jaccard 相似度是 IR 中非常常见的度量,我希望找到它的 Lucene 实…

浮世清欢 2024-11-24 07:32:56 6 0

快速内存倒排索引

我正在寻找通用倒排索引的快速内存实现。我所需要的只是存储几百万个实体的权重特征,并使用倒排索引使用各种距离函数计算实体之间的相似性。 我可以…

伤感在游骋 2024-11-18 14:33:46 11 0

计算概率分布

我有一个简单(可能很愚蠢)的问题。我想计算两个文档的 Kullback-Leibler 散度。它需要每个文档的概率分布。 我不知道如何计算每个文档的概率。任何…

梦里兽 2024-11-18 14:28:35 9 0
更多

推荐作者

李珊平

文章 0 评论 0

Quxin

文章 0 评论 0

范无咎

文章 0 评论 0

github_ZOJ2N8YxBm

文章 0 评论 0

若言

文章 0 评论 0

南…巷孤猫

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文