如何直观地设计用于编程提取的混搭查询

发布于 2024-08-13 09:05:11 字数 147 浏览 2 评论 0原文

我正在开发一个应用程序,该应用程序从互联网页面获取各种输入,而每个信息片段都来自不同的位置(混搭)。 我想通过可视化工具生成混搭构建块(片段)。 您知道有什么类似的东西可以用于这样的项目吗? (已经做好的控件、示例代码、文章等) 首选开发环境是 .NET - 但不是强制性的。

I'm into development of an application that fetches various inputs from internet pages whereas each information snippet comes from a different location (mashup).
I would like to generate the mashup building block (snippets) through a visual tool.
Do you know of anything similar that can be used for such a project? (Already made control, a sample code, article, etc.)
Preferred development environment is .NET - but not mandatory.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

海未深 2024-08-20 09:05:11

在我看来,主要的挑战是以语义形式从每个提要中提取适当的信息。维基百科将混搭描述为:

混搭有很多种类型,例如
作为消费者混搭、数据混搭和
企业混搭。最常见的
混搭类型是消费者混搭,
面向大众。

数据混搭结合了相似类型的
来自多个媒体和信息
源转化为单一表示。
AlertMap 就是一个例子,它
结合了 200 多个来源的数据
与恶劣天气条件有关,
生物危害威胁和地震
信息,并将它们显示在
世界地图;另一个是芝加哥
犯罪地图,显示犯罪情况
芝加哥的犯罪率和地点。

经典的混搭——芝加哥犯罪——之所以有效,是因为日期和地理位置等关键信息在语义上是可用的。其他类型的公共信息包括个人、组织和特定领域的标识符。

当您确定了这些之后,您可能希望考虑语义网正在开发的基于 RDF 的工具。请注意,政府开始以 RDF 形式发布数据,因此我将其视为一项关键技术。

如果您的网页没有立即包含语义信息,您可能必须创建屏幕抓取工具和 HTML 解析器。这不是很迷人,没有特殊的工具,而且往往只是艰苦的工作。

IMO the major challenge will be to extract the appropriate information from each feed in semantic form. Wikipedia describes mashups as:

There are many types of mashups, such
as consumer mashups, data mashups, and
enterprise mashups. The most common
type of mashup is the consumer mashup,
aimed at the general public.

Data mashups combine similar types of
media and information from multiple
sources into a single representation.
One example is AlertMap, which
combines data from over 200 sources
related to severe weather conditions,
biohazard threats, and seismic
information, and displays them on a
map of the world; another is Chicago
Crime Map, which indicates the crime
rate and location of crime in Chicago.

The classic mashup - Chicago crime - works because key information such as dates and geolocations are available semantically. Other types of common information are persons, organisations, and domain-specific identifiers.

When you have identified these you may wish to consider the RDF-based tools that the semantic web is developing. Note that governments are starting to emit their data in RDF so I would see this as a key technology

If your web pages do not have semantic information immediately you will probably have to create screen scrapers and HTML parsers. That's not very glamorous, there are no special tools and tends to be just hard work.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文