HttpClient - 获取不正确的页面源

发布于 2024-08-19 03:25:57 字数 418 浏览 3 评论 0原文

我使用 HttpClient 和 GetMethod 来获取 URL 的页面源：

http://www.google.com/finance?chdnp=1&chdd=1&chds=1&chdv=1&chvs=Logarithmic&chdeh=0&chdet=1264263288788&chddm=391&chddi=120&chls=Ohlc&q=NSE:.NSEI&

但不知何故，我总是最终获取以下页面源：

http://www.google.com/finance?q=NSE:.NSEI

谁能告诉我为什么以及如何获取页面源以前的网址？

原文

I used HttpClient and GetMethod to get the page source of the URL :

http://www.google.com/finance?chdnp=1&chdd=1&chds=1&chdv=1&chvs=Logarithmic&chdeh=0&chdet=1264263288788&chddm=391&chddi=120&chls=Ohlc&q=NSE:.NSEI&

But somehow I always end up getting page source of :

http://www.google.com/finance?q=NSE:.NSEI

Can anyone tell me why and how to get page source of the former URL?

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

初心未许 2024-08-26 03:25:57

我将在这里冒险假设发生的事情是您的 HttpClient 实现在内部处理 HTTP 重定向，因此当您在第一个 URL 上调用 GetMethod 时，服务器 (google.com ）可能会发回第二个 URL 的 HTTP 重定向（302 或 301）响应，这就是您最终返回的内容。

原因可能是第一个 URL 需要某种 cookie，而您在发出请求时没有提供该 cookie。准确确定以这种方式发出请求时会发生什么情况的最佳方法是使用 WireShark 等工具或 Fiddler 分析来自 HttpClient 的 HTTP 请求/响应序列以及使用 FireFox 发出的正常请求或看看IE到底有什么不同。

回复收藏 0 原文

~没有更多了~