构建 URL 索引,要包含哪些功能?
我正在努力构建 URL 的索引。目标是构建和存储一个数据结构,该数据结构将具有作为域 URL(例如 www.nytimes.com)的键,并且该值将是与该 URL 关联的…
使用 .Net 进行文本挖掘、事实提取、语义分析
我正在寻找任何免费的工具/组件/库,让我能够在 .NET 应用程序中利用文本挖掘、事实提取和语义分析。 GATE 项目是我所需要的,但它是用 Java 编写的。…
自然语言/文本挖掘和 Reddit/社交新闻网站
我认为有大量与 reddit、digg 或 news.google.com 等网站相关的自然语言数据。 我对文本挖掘做了一些研究,但找不到如何使用这些工具来解析像 reddit …