生成站点地图的最有效算法?

发布于 2024-07-16 22:37:00 字数 58 浏览 5 评论 0原文

..给定一个 URL 作为输入(C 编程语言)。 (来自 sitemap.org 的站点地图规范)。

..given an URL as input (C programming language). (Sitemap specifications from sitemap.org).

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

终难遇 2024-07-23 22:37:00

正如 apphacker 的评论中所述,我们真的不知道您要做什么。 如果您计划只是从 html 网站上抓取链接,那么我会推荐某种词法扫描器生成器:例如 flex。

如果您获取网站网址作为输入,那么您将需要使用一些网络代码来读取网页。 如果您对 C 语言的网络一无所知,那么我建议您在谷歌上搜索 beej 的指南并从那里开始。

如果您只是按照标签建议获得一个直接的 XML 文件,那么如果您绝对必须使用 C,那么我会再次推荐 Flex。如果您不必使用 C,那么我会推荐 Perl 或 Python; 他们可能更适合这份工作。

无论哪种方式,我们都需要您向我们提供更多信息,但我希望这对现在有所帮助。

As stated in the comments by apphacker we don't really know what you're trying to do. If you are planning on just scraping links from a html website then I would recommend some sort of lexical scanner generator: like flex.

If you are getting a website url as input then you are going to need to use the some networking code to read the webpages. If you don't know anything about networking in C then I would recommend googling beej's guides and going from there.

If you are just getting a straight XML file as your tags suggest then once again I would recommend flex if you absolutely must use C. If you don't have to use C then I would recommend Perl or Python; they are probably better suited to the job.

Either way we need you to give us more information but I hope that helps for now.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文