information-retrieval

information-retrieval

文章 0 浏览 7

识别英语句子中无意义的成分

我想知道是否有一种算法或库可以帮助我识别英语中没有意义的组件?例如,非常严重语法错误?如果是这样,您能否解释一下它是如何工作的,因为我真的很…

相权↑美人 2025-01-07 11:51:15 5 0

计算两个列表之间的相似度

编辑: 由于每个人都感到困惑,我想简化我的问题。我有两个有序列表。现在,我只想计算一个列表与另一个列表的相似程度。 例如, 1,7,4,5,8,9 1,7,5,4…

雪花飘飘的天空 2025-01-07 08:45:07 6 0

电子设备信息 - 在哪里访问笔记本电脑/电视/相机数据?

我希望建立一个消费电子设备推荐引擎,类似于 Decide.com 等。 在广泛搜索网络后,我找不到任何可以为我提供(至少一部分)所需数据的公共 API/Web 服…

死开点丶别碍眼 2025-01-04 00:19:47 3 0

有没有更好的方法来查找搜索引擎代码的集合交集?

我一直在编写一个小型搜索引擎,需要找出是否有更快的方法来查找集合交集。目前,我正在使用大多数搜索引擎算法中所解释的排序链表。即对于每个单词,…

决绝 2025-01-03 22:55:49 5 0

如何从 PDF 文件中提取突出显示的部分

有没有办法以编程方式从 PDF 文件中提取突出显示的文本?欢迎任何语言。我找到了几个使用 Python、Java 和 PHP 的库,但没有一个能完成这项工作。…

把梦留给海 2025-01-02 02:17:59 5 0

如何清除Solr中的缓存?

我正在尝试比较不同 Solr 查询的性能。为了得到公平的测试,我想清除查询之间的缓存。 这是怎么做到的?当然,可以重新启动服务器,我很好奇是否有更…

关于从前 2025-01-01 00:41:34 4 0

指定 ngram 大小并在 indri 中添加一项平滑

我正在尝试使用狐猴项目的 indri 搜索引擎。我有以下问题: 1)如何为 indri 在索引​​期间构建的 Langauge 模型指定 Ngram 大小。 2)我们如何告诉 …

比忠 2024-12-29 17:55:44 4 0

如何让倒排索引搜索更快?

我正在设计一个全文搜索引擎的架构。要点之一是以很少的响应时间处理大型数据集之间的查询。我能想到的一件事是将倒排索引拆分为分区。有两种策略:基…

゛清羽墨安 2024-12-28 19:29:33 5 0

倒排索引搜索中如何使用map-reduce?

很容易理解如何使用map-reduce来收集文本并构建大型倒排索引。但是map-reduce如何用于倒排索引搜索呢?…

呆头 2024-12-28 18:23:10 7 0

有没有检索系统?

我正在寻找一个视频检索系统,其代码很容易获得,以便我可以检查它。此外,我正在寻找有关它的任何相关文档。 该应用程序将在本地运行。我将有一个视…

花海 2024-12-28 12:44:46 3 0

使用 JSoup 仅从多个页面获取文本

我有一组 1000 个页面(链接),是通过向 Google 查询得到的。我正在使用 JSoup。我想删除图像、链接、菜单、视频等,只获取每个页面的主要文章。 我…

情绪少女 2024-12-27 17:49:12 5 0

如何计算两个license.txt文件之间的相似度?

我想计算许可证的 txt 文件之间的相似性,以便我可以根据 license.txt 识别它对应的许可证。我应该使用什么样的信息检索技术?一旦我编写了 tf-idf 但…

夜深人未静 2024-12-27 12:51:28 5 0

是否有一种算法可以确定文本与主题的相关性?

我想知道什么可以用来确定页面与游戏、电影等主题的相关性。 这方面是否有一些研究,或者是否只计算某些相关单词出现的次数?…

终陌 2024-12-27 09:15:39 4 0

如何使用 Lucene 中的 MultiFieldQueryParser?

我正在使用 Version.Lucene_29。使用普通的字符串查询方法,我可以执行以下操作: Directory directory = new FSDirectory(...); //Start Lucene retr…

晨曦慕雪 2024-12-26 18:43:53 2 0

如何按相关性对搜索结果进行排序?

我正在开发一个项目,该项目搜索数据库,然后根据用户输入的字符串按相关性对搜索结果进行排序。我认为我当前的搜索相当不错,但是我编写的用于按相关…

孤君无依 2024-12-22 17:57:38 3 0
更多

推荐作者

李珊平

文章 0 评论 0

Quxin

文章 0 评论 0

范无咎

文章 0 评论 0

github_ZOJ2N8YxBm

文章 0 评论 0

若言

文章 0 评论 0

南…巷孤猫

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文