从外部网址获取标题和图像时的 Html 敏捷包问题
我正在使用 HTML Agility DLL 来获取外部网站链接的图像和标题。 当我尝试从网站加载标题时。 http://www.gettyimages.com 然后我得到了错误的标题。 我收到标题“Getty Images - 检测到不支持的浏览器”,
出了什么问题?
I am using HTML agility DLL for getting images and title of external website link.
when I try to load title from the website.
http://www.gettyimages.com then I getting wrong title.
I getting title "Getty Images - Unsupported browser detected "
whats going wrong?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
我认为它与 Html Agility Pack 没有任何关系。 Getty Images 似乎会检查您请求的“User-Agent”http 标头并更改返回的 HTML 的标题。
您可以尝试通过更改用户代理来伪装成 Firefox/IE 来解决该问题,或者干脆将其切断。
有关使用 WebClient 下载内容的示例,请参阅 http://www.dotnetperls.com/webclient。
I don't think it has anything to to with the Html Agility Pack. It seems that Getty Images checks your request's "User-Agent" http header and changes the title of the returned HTML.
You can try pretending to be Firefox/IE by changing the user agent to work around that or just cut it off.
See http://www.dotnetperls.com/webclient for an example using WebClient to download the content.