实时网络搜索（.Net 中）

发布于 2024-08-09 21:54:35 字数 597 浏览 2 评论 0原文

你们将如何在.Net 平台上创建一个“实时”搜索引擎。近乎实时的网络搜索现在非常流行，我希望你们能帮助我集思广益一些想法。我最终可能会尝试制作一些原型，但大多数情况下这只是一种“心理训练”。

要求是：

.NET 平台、IIS、MS SQL 服务器或 Lucene.Net（文件系统）
要索引的输入数据只是关键字加上一些元信息 - 无需进一步处理所需的
数据按关键字分组并按出现次数排序不保留关键字的
历史数据（超过某个固定时间的数据将被丢弃或移动到其他数据存储）

对主题不太了解，这就是我到目前为止所想到的：

数据被馈送通过网络服务连接到系统。由于数据已经是关键字的形式，因此不进行进一步的处理。 WS将数据保存到db。 Select查询以固定的时间间隔执行以返回数据（例如：我们查询过去一小时的传入数据并每秒执行一次查询）。分组和排序在内存中执行，以减轻sql server的负担。数据库中的旧数据每隔几分钟就会被丢弃。我不确定如果不断添加许多新行，sql server 将如何处理。然后显示分组和排序的数据。

我相信你们对于这类事情有更多的经验和更好的想法。

问候，

翁德雷

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

萌梦深 2024-08-16 21:54:35

根据您对系统的描述，一个简单的数据库架构可能如下所示

：
- id（主键）
- 关键字（唯一）

输入
- id（主键）
- 数据（文本）

输入关键字
- id（主键）
- input_id（外键）
-keyword_id（外键）
- count（整数；id为keyword_id的关键字出现在id为input_id的输入中的次数）
-expiration_date（时间戳；定期删除所有已过期的条目）

数据操作如下：

写入：每当执行输入操作时，数据库引擎都必须处理写入所有三个的写入操作表。
读取：每当执行搜索操作时，数据库引擎都需要处理所有三个表的读取操作
。删除：定期删除 input_keyword 中的条目，如果需要，还需要删除关键字表中的条目。

在流量大的系统上，您的数据库会经常受到攻击。由于您实际上只是为了方便在这些表中执行 SELECT 操作而使用数据库，并且数据的生命周期非常短暂，因此您最好使用内存中的数据结构来替换“关键字”和“ input_keyword”表以消除对磁盘的命中。这可能需要更复杂的应用程序代码，但在繁忙的系统上可能是值得的。