爪哇。比较网页结构 (dom) 相似度。
是否有一个库(用于java)可以比较网页之间的相似性(HTML,dom相似性)? 在我的应用程序中,我想对网站的链接进行分类。 例如: 第 1 组:产品详细…
用于字符串相似度的 Python 摘要/哈希
我正在寻找一种算法,可以从较长的字符串生成短(fx 16 个字符(不重要))哈希码/摘要。 主要要求是几乎相同的字符串应该产生相同的摘要。FX 2 几乎…
如何调整编辑距离来对语言上相似的单词进行分类(例如动词时态、形容词比较、单数和复数)
我不知道如何完成这项任务。我正在计算一个单词的频率,实际上是该单词的基本形式(例如,跑步将被计为跑步)。我查找了 Levenshtein 距离的一些实现…
根据一组文档的相似性对句子进行排名的最佳方法
我想知道根据一组文档的相似性对句子进行排名的最佳方法。 例如,可以说, 1.共有5个文档。 2. 每个文档包含很多句子。 3. 让我们将文档 1 作为主要的…
如何在 SQL Server 中查找与给定字符串相似的字符串?
我有一个 SQL Server 表,其中包含多个字符串列。我需要编写一个应用程序来获取字符串并在 SQL Server 表中搜索类似的字符串。 例如,如果我将“ ? ? …
用于比较图像相似度的Java库
Closed. This question is seeking recommendations for software libraries, tutorials, tools, books, or other off-site resources. It does not …
确定两个字符串是否“足够相似”的良好指标是什么?
我正在研究一个非常粗略的初稿算法来确定 2 个字符串的相似程度。我还使用 Levenshtein Distance 来计算字符串之间的编辑距离。 我目前所做的基本上是…
如何衡量两个系列数据之间的相似性?
我需要找到两个数据数组之间的相似性度量。 您可以将相似性度量称为任何您想要的名称,差异、相关性或任何其他名称。 例如: 1, 2, 3, 4, 5 < Series …
如何定义 usort 以使我的数组按特定顺序排序?
我正在尝试构建一个 php 类,它应该按照与输入的搜索查询的“相似性”顺序对来自 mysql 数据库的结果进行排序。我正在使用PHP函数similar_text。 clas…