Lucene.net 获取包含匹配项的整个 csv 行
我需要在巨大的 csv 文件中搜索一个术语(或更多术语)。 我发现 Lucene.Net 是对其进行快速查询的最佳方式。
好吧,我可以创建索引并进行查询,但我无法获取包含匹配项的整个行。
我正在尝试使用荧光笔类,但我需要切割正确行周围的字符串,我认为这不是最好的方法。
I need to search a term (or more terms) inside huge csv files.
I foud Lucene.Net as the best way to make a fast query on them.
Well, l'm able to create an index and make queries but I cant get the entire rows that contains the match.
I'm trying with the highlighter class, but I need to cut the string around the correct row and I think this is not the best way..
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
您应该将每一行放入索引中的单个文档中(例如,在
"csv_row"
字段中),然后通过搜索结果中的doc.Get("csv_row")
访问它文件。PS Lucene 确实是在大型文本文件中搜索的正确方法,比数据库快得多。
You should put each row in an individual Document on indexing (say, in
"csv_row"
field), then access it viadoc.Get("csv_row")
in search result documents.P.S. Lucene is really the right way to search within huge text files, much faster than the database.