当前位置：文江博客话题详情

algorithm search database approximation

如何使用近似查询存储数据？

发布于 2024-11-06 03:36:27 字数 445 浏览 6 评论 0原文

我正在尝试找到一种快速访问存储数据的方法（优于 O(n)）。

我的数据库由表示某些项目的一些信息的数据（4096 字节字符串）组成。
问题是，查询永远不准确。我得到一个 Item，然后需要使用函数 F(a,b) 找到最接近的匹配项。

只是一个例子：

1234
3456
6466
F(a,b) = return % of similar digits  

GetClosest(1233,F) = 1234

问题是 F(a,b) 是一个复杂的算法（不是一个合适的度量）。

我现在所拥有的只是遍历整个数据库来搜索最佳匹配。
是否有一种树或其他集群数据库类型可以让我更快地发现复杂性？

更多信息：

F 返回百分比相似度值。其中 100% 是完美匹配。

I'm trying to find a way to store my data with fast access (better than O(n)).

My database consists of data (4096 byte strings) that represents some information about some items.
The problem is, that the query is never exact. I get one Item, and then need to find the closest match using a function F(a,b).

just an example:

1234
3456
6466
F(a,b) = return % of similar digits  

GetClosest(1233,F) = 1234

The problem is that F(a,b) is a complicated algorithm, (not a proper metric).

What I have now is just go over the whole database to search for the best match.
Is there a kind of tree or other cluster database type that can give me faster finding complexity ?

More information:

F gives back a similarity value in %percentage. where 100% is a perfect match.

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（2）

秋千易 2024-11-13 03:36:27

抱歉，答案是“可能不会”，除非您的问题还有一些您尚未描述的结构。对于 4096 字节的字符串，您将遭受维度的诅咒。

如果您有较短的字符串和足够的数据，那么最近的匹配在字符串的很大一部分上很可能是相同的，那么您可以使用在字符串的不同块上索引的多个树状结构来存储数据。最近的很有可能足够接近，您可以仅根据这些树中的接近元素来证明它是最近的。然而，由于字符串的大小和计算机中可以存储的数据有限，这是不可能的。

也就是说，您需要完全接近的还是仅需要稍微接近的？如果只有可能接近的一个，那么您可以通过几个随机的稀疏位样本对其进行索引。在搜索中，您只能检查与其中一个元素完全匹配的元素。这将大大减少搜索空间，同时拒绝更少的近邻，并且可能会产生合理的（即使经常是错误的）答案。

回复收藏 0 原文

黯淡〆 2024-11-13 03:36:27

有什么方法可以为每个数据分配一个“分数”吗？

您可以根据您的分数对数据进行索引/排序。

当您搜索时，您可以为搜索条件分配一个分数，然后查找分数最接近的项目。

这在很大程度上取决于您的数据和您对“差异”的定义。

回复收藏 0 原文

~没有更多了~

关于作者

风吹过旳痕迹

暂无简介

文章

评论

25 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

燃烧我的卡路李先生

文章 0 评论 0

qq_2gSKZM

文章 0 评论 0

∞梦里开花

文章 0 评论 0

qq_IklFPL

文章 0 评论 0

迷途知返

文章 0 评论 0

深海不蓝

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文