自动将表数据抓取为 XML

发布于 2024-09-03 00:41:43 字数 959 浏览 4 评论 0原文

问题

我有一个 YQL 查询结果,我正在尝试将其转换并排序到一个干净的 XML 文件中。

背景

令人烦恼的是,世界杯信息无法以易于重复使用的格式免费提供。

因此,在对 YQL 进行一些巧妙处理之后,我成功地释放了包含我想要的数据的所需表行。

YQL查询可以在以下位置查看: http://query.yahooapis.com/v1/public/ yql/ravingbeefsteak/worldcup2010groupliberator?diagnostics=true

其结果是一大堆表格行(在浏览器中查看源代码以查看这一点)。

我现在想获取这些生成的表行,并将它们转换为 XML 文件,作为一个绝对的 n00b,我不知道从哪里开始或寻找什么。

该文件还可以使用某种结构,因此解决这个问题的一部分将涉及创建 XML 结构,我设想该结构看起来像这样:

<teams>
  <team>
    <name>X</name>
    <webpage>X</webpage>
    <flagsrc>X</flagsrc>
    ...
  </team>
</teams>

我还需要对数据进行查找和替换(以成为XML team/webpage 和 team/flagsrc 元素中的数据),无需手动干预即可将附加数据添加到这些字段中。

如果有人能指出我需要做什么以使我的需求成为现实的正确方向,我将不胜感激。

Problem

I have a YQL query result that I'm trying to get converted and sort into a clean XML file.

Background

Being the pains that they are, information from the World Cup isn't freely available in an easy to reuse format.

So, after a bit of finessing with YQL I have managed to liberate the required table rows which contain the data I'm after.

The YQL query can be viewed at:
http://query.yahooapis.com/v1/public/yql/ravingbeefsteak/worldcup2010groupliberator?diagnostics=true

The result of this is a whole bunch of table rows (view source from within your browser to see this).

I'd like to now take these resulting table rows, and convert them into an XML file, and being an absolute n00b I don't know where to start or what to look for.

The file could also use some structure to it, so part of working this out will involve creating that XML structure which I envision would look something like:

<teams>
  <team>
    <name>X</name>
    <webpage>X</webpage>
    <flagsrc>X</flagsrc>
    ...
  </team>
</teams>

I'm also needing to do a find and replace on the data (to what would become the data inside the XML team/webpage & team/flagsrc elements) to prepend addition data to these fields without manual intervention.

If anyone can point me in the right direction of what I need to be doing to make my needs a reality it would be greatly appreciated.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

不忘初心 2024-09-10 00:41:43

我错过了什么吗?链接到的文档已经是一个XML 文档。

如果您想将数据转换为另一种 XML 格式,请查看 XSLT。我会提供更多信息,但您没有指出您所在的平台。

Am I missing something? The document linked to is already an XML document.

If you want to transform the data to another XML format, look at XSLT. I'd give more information but you did not indicate what platform you are on.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文