当前位置：文江博客话题详情

使用 C# 搜索多个网站

发布于 2024-12-01 04:05:31 字数 223 浏览 0 评论 0原文

我可以使用C#自动搜索网站，然后返回搜索结果吗？

如果我给它一个顶级域名，是否有一个网络爬虫会做同样的事情（例如：我告诉它在 stackoverflow.com 上找到“有趣”这个词，它会告诉我所有“有趣”出现的时间）？

这些网站允许通过搜索栏进行搜索。

我需要网站合作来自动搜索吗？

注意：我只计划每天进行一到两次搜索，因此我怀疑我会被阻止，或被要求验证自己的身份。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

笑脸一如从前 2024-12-08 04:05:31

如果您计划爬行整个网站来计算单词数，如果您不缓存它，您就会被阻止，那么您基本上会请求网站的每个页面。也许考虑集成谷歌域搜索？

以下是 google 页面的链接，详细介绍了如何与 c#

http://code 进行交互。 google.com/apis/gdata/client-cs.html

编辑： 抱歉，不太正确：http://gsalib.codeplex.com/

http://answers.oreilly.com/topic/2165-how-to-search-google-and-bing-in-c/

回复收藏 0 原文

霓裳挽歌倾城醉 2024-12-08 04:05:31

我会考虑构建一个 RSS 聚合器。 RSS 是标准化的，因此这可能是从各种来源收集搜索结果的最可靠方法。

编辑：对于不支持 RSS 的网站

对于不支持 RSS 的网站，您可以考虑使用屏幕抓取工具。查看有关代码项目的这篇文章以帮助您入门：

http://www.codeproject。 com/KB/aspnet/weather.aspx

回复收藏 0 原文

谁的新欢旧爱 2024-12-08 04:05:31

...网站允许通过搜索栏进行搜索...我可以使用 C# 自动搜索网站，然后返回搜索结果吗？

可以，如果网站提供了搜索词所在的 URL作为 URL 的查询字符串参数提供。

          http://yourTargetDomain?searchterm=foo

但是，除非该网站专门将该 URL 的搜索结果设计为结构化数据，否则该网站不会“告诉[您]所有出现‘有趣’的情况”，而是会向您发回适合浏览器的搜索响应要显示，因此您必须从该 HTML 流中解析结果。

例如：

http://philadelphia.craigslist .org/search/tls?query=ladder&srchType=A&minAsk=&maxAsk=

...web sites allow searching via their search bar ... Can I use C# to auto search websites, then return the search results?

Yes, if the website provides a URL where the search-term is provided as a query-string argument to a URL.

          http://yourTargetDomain?searchterm=foo

But unless the website has specifically designed the search results from that URL to be structured data, the website won't "tell [you] all the times 'funny' appeared" but will send you back a search response that is suitable for a browser to display, so you would have to parse the results out of this stream of HTML.

For example:

http://philadelphia.craigslist.org/search/tls?query=ladder&srchType=A&minAsk=&maxAsk=

回复收藏 0 原文

~没有更多了~