如何使用 lucene.net 索引文件夹

发布于 2024-10-07 09:51:30 字数 335 浏览 0 评论 0原文

我正在尝试使用 lucene.net 在 asp.net 中开发一个搜索引擎。我浏览了许多教程和页面以获得适当的结果，但我做不到。实际上，我有一个包含一些文件（doc、ppt、pdf、excel 等）的文件夹，我只想在该文件夹中搜索内容，如果在该文件夹中找不到结果，则要求用户在网络上搜索。

例如我有一个包含数千个文件的文件夹@ C:\test 如果用户搜索“miller”，那么它应该搜索每个文档。如果找到结果，那么它应该显示类似

搜索文本文件没有出现的结果米勒 C:\test\1\file.doc 5 miller C:\test\1\11\new.doc 2

请帮助我，我没有得到适当的结果。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

烟酒忠诚 2024-10-14 09:51:30

Lucene / Lucene.NET 只是一个索引引擎，您仍然必须从您想要支持自己的文件类型中提取文本 - 在 Windows 上您可以使用 IFilter 接口适用于多种文件类型，如果您安装了 Acrobat Reader 7+，则应该内置支持用于 PDF 文件的 IFilter。至于索引部分本身，有很多很多示例。

另请参阅此线程使用 C# 或经典 ASP (VBScript) 从 PDF 中提取文本的好方法是什么？

回复收藏 0 原文

~没有更多了~