Lucene 中字级注释层的索引和搜索
我有一个数据集,在底层文本上有多层注释,例如 part-of-标签,来自浅层解析器的块,名称实体,以及来自各种 自然语言处理 (NLP) 工具。对于像 The ma…
构建 URL 索引,要包含哪些功能?
我正在努力构建 URL 的索引。目标是构建和存储一个数据结构,该数据结构将具有作为域 URL(例如 www.nytimes.com)的键,并且该值将是与该 URL 关联的…
使用 .Net 进行文本挖掘、事实提取、语义分析
我正在寻找任何免费的工具/组件/库,让我能够在 .NET 应用程序中利用文本挖掘、事实提取和语义分析。 GATE 项目是我所需要的,但它是用 Java 编写的。…