如何直观地设计用于编程提取的混搭查询

发布于 2024-08-13 09:05:11 字数 147 浏览 11 评论 0原文

我正在开发一个应用程序，该应用程序从互联网页面获取各种输入，而每个信息片段都来自不同的位置（混搭）。我想通过可视化工具生成混搭构建块（片段）。您知道有什么类似的东西可以用于这样的项目吗？（已经做好的控件、示例代码、文章等）首选开发环境是 .NET - 但不是强制性的。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

海未深 2024-08-20 09:05:11

在我看来，主要的挑战是以语义形式从每个提要中提取适当的信息。维基百科将混搭描述为：

混搭有很多种类型，例如
作为消费者混搭、数据混搭和
企业混搭。最常见的
混搭类型是消费者混搭，
面向大众。
数据混搭结合了相似类型的
来自多个媒体和信息
源转化为单一表示。
AlertMap 就是一个例子，它
结合了 200 多个来源的数据
与恶劣天气条件有关，
生物危害威胁和地震
信息，并将它们显示在
世界地图；另一个是芝加哥
犯罪地图，显示犯罪情况
芝加哥的犯罪率和地点。

经典的混搭——芝加哥犯罪——之所以有效，是因为日期和地理位置等关键信息在语义上是可用的。其他类型的公共信息包括个人、组织和特定领域的标识符。

当您确定了这些之后，您可能希望考虑语义网正在开发的基于 RDF 的工具。请注意，政府开始以 RDF 形式发布数据，因此我将其视为一项关键技术。

如果您的网页没有立即包含语义信息，您可能必须创建屏幕抓取工具和 HTML 解析器。这不是很迷人，没有特殊的工具，而且往往只是艰苦的工作。