从 ASP.NET webForm 获取数据

发布于 2025-01-05 17:58:06 字数 759 浏览 2 评论 0原文

我对网络开发相当陌生，以前我从未做过任何屏幕抓取或网络爬行，但昨天我的一个朋友问我是否能够从这个网站，不是我的，也不是他的，但数据是公开的，甚至可以下载。数据的问题是，它只能作为每个日期或公司的一个文件提供，而不是多个日期或公司的一个文件，这涉及到大量繁琐的“点击”日历，所以他认为如果我将能够创建一些应用程序，可以一键抓取所有数据并将其输出到一个文件或类似的文件中。

该网站使用 aspx webFrom 和 __doPostBack 来检索不同日期的数据，甚至是下载数据的链接数据输入XSL 不是通常的“href=...”链接，我认为它们是某些 asp 脚本的引用...

老实说，我尝试的唯一方法是 PHP cURL，但它不起作用，但自从我第一次尝试 cURL有时，我什至不知道它是否不起作用，因为 cURL 不可能，或者只是因为我不知道如何使用它。我只稍微精通 PHP 和 JavaScript，但不精通 ASP，尽管我不介意学习新的东西。

所以我的问题是.. 是否有可能从这样的网站获取数据？如果是的话，您能否给我一些关于如何解决此类问题的提示？

该网站再次位于此处 http://extranet.net4gas.cz/capacity_ee.aspx

谢谢

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

岁月如刀 2025-01-12 17:58:06

C# 有一个很好的 WebClient 类来完成这项工作：

// Create web client.
WebClient client = new WebClient();

// Download string.
string value = client.DownloadString("http://www.microsoft.com/");

一旦您将页面 html 放入字符串中，您就可以使用正则表达式来抓取您要查找的内容。
这是一个非常基本的正则表达式来给出提示：

Regex regex = new Regex(@"\d+");
Match match = regex.Match("hello here 10 values");
if (match.Success)
{
    Console.WriteLine(match.Value);
}

C# has a nice WebClient class to do the job:

// Create web client.
WebClient client = new WebClient();

// Download string.
string value = client.DownloadString("http://www.microsoft.com/");

once you have the page html in a string you use regular expressions to scrape the content you are looking for.
here is a very basic regular expression to give a hint:

Regex regex = new Regex(@"\d+");
Match match = regex.Match("hello here 10 values");
if (match.Success)
{
    Console.WriteLine(match.Value);
}

回复收藏 0 原文

节枝 2025-01-12 17:58:06

Marosko，正如您所说，网站上的数据是向公众开放的，因此您肯定可以从中获取数据。现在，它是减少手动点击日期并从中抓取数据。我个人不太了解 Curl 如何工作，但我确信它会涉及大量编码。我宁愿建议您使用一些自动化工具（例如软件应用程序）来自动化整个过程。尝试一下 Automation Anywhere，我几个月前买了它用于一些数据提取目的，它运行得很好。它是自动化的，您可以检查它显示的屏幕抓取功能。这是我最喜欢的:)

查尔斯

回复收藏 0 原文

~没有更多了~