想要从其他网站链接检索元数据和元内容

发布于 2025-01-08 09:43:43 字数 499 浏览 0 评论 0原文

我正在从事一个社交网络项目。 它基于asp.net 4.0、WCF和JQuery。 在我的项目中,有一个模块用于从以下内容中提取元数据和元包含 其他网站网址。 示例 - 如果我提供 URL,那么它将检索详细信息

- URL- http://timesofindia。 indiatimes.com

元数据- 印度时报:印度、世界和印度的最新新闻商业新闻、板球 &体育、宝莱坞

元内容- 印度时报带来最新动态有关政治和新闻的热门突发新闻 印度时事与新闻世界各地、板球、体育、 商业、宝莱坞新闻和娱乐、科学、技术、 健康与健康健身新闻与主要专栏作家的意见。

我进行了很多搜索,但找不到任何线索 任何人都可以通过发送一些代码或一些有用的链接来帮助我,我可以获得一些参考或信息。

I am working on a social Network project.
Which is based on asp.net 4.0 ,WCF and JQuery.
In my project there is a module for extract the metadata and meta contains from the
other website URL.
Example- If i will give URL then it will retrieve the details-

URL- http://timesofindia.indiatimes.com

Meta data- The Times of India: Latest News India, World & Business News, Cricket
& Sports, Bollywood

Meta content- Times of India brings the Latest & Top Breaking News on Politics and
Current Affairs in India & around the World, Cricket, Sports,
Business, Bollywood News and Entertainment, Science, Technology,
Health & Fitness news & opinions from leading columnists.

I have search a lot but not able to get any kind of clue
Can any one help me by send some code or by some useful link i can get some references or information.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

软的没边 2025-01-15 09:43:43

如今,网站不再从其他网站抓取数据,而是联合起来。也就是说,他们通过易于使用的界面共享信息。有几种技术,但常见的格式是使用 RSS,它以 XML 格式呈现数据供您使用。

该特定网站提供一系列 RSS 源。但是,请记住阅读使用条款,因为其使用可能受到限制。当然,您仍然可以进行抓取,但法律禁止将受版权保护的材料据为己有。

Now days, web sites don't scrape data from other sites - they syndicate. That is, they share the information through an interface that is easily consumed. There are a few techniques, but a common format is using RSS that presents the data in XML format for you to consume.

That particular website offers a series of RSS feeds. However, remember to read the terms of use as there may be restrictions on its usage. Of course, you can still go with scraping, but there are laws against claiming copyrighted material as your own.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文