当前位置：文江博客话题详情

robots.txt 的道德规范

发布于 2024-07-24 08:10:05 字数 1432 浏览 4 评论 0原文

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

九厘米的零° 2024-07-31 08:10:06

参数：

robots.txt 文件是隐含许可证，尤其是当您知道它时。因此，继续抓取他们的网站可能会被视为未经授权的访问（即黑客攻击）。很糟糕，但最近在其他法律案件中也出现了类似的论点（与 robots.txt 没有直接关系，而是与其他“被动控制”有关。）
抢夺价格不违反任何版权法，包括 DMCA，因为版权不包括事实信息，只有创意。
从道德上讲，您不应该抢夺价格，因为供应商应该有能力更改价格，而不必担心被来自您网站的人指责为诱饵/转换。
您是否采取了正直的态度，向他们解释了该网站并表示您愿意将他们纳入您的供应商名单中？也许他们会喜欢这个想法，并以一种易于您使用且生产时占用资源较少的方式实际公开数据。
没有直接关于 robots.txt 的法律，因为通常遵循网络礼仪。不要成为“坏人”之一。
有些人过滤机器人是因为他们使用 URL 链接来执行“操作”，例如将东西添加到购物车，而机器人在他们的数据库中留下了大量废弃的购物车。
有些人过滤机器人是因为它们有独家价格，无法根据与供应商的协议公开宣传。如果您在网站上公开这些价格，可能会让他们处于不利的境地。
在当今的经济形势下，如果一家公司不想尽一切可能为自己做广告，那么你不包括他们就是他们自己的错。

回复收藏 0 原文

鸠书 2024-07-31 08:10:06

robots.txt 的另一个用途是帮助保护网络蜘蛛免受自身侵害。对于网络蜘蛛来说，陷入无限深的链接森林相对容易，正确构建的 robots.txt 文件会告诉蜘蛛“你不需要去这里”。

回复收藏 0 原文

梦归所梦 2024-07-31 08:10:06

许多人试图通过构建“价格比较”引擎来开展业务，这些引擎会抢占主要网站。

一旦您开始获得任何类型的流量/收入，您将收到停止。这种情况发生在数十个甚至数百个项目中。我什至参与了一个小项目，该项目获得了 Craigslist 的 C&D。

你知道他们怎么说“请求宽恕比获得许可更容易”吗？它不适用于页面抓取。获得许可，否则您将收到他们律师的来信。

如果你幸运的话，那还早，那时你就没什么可失去的了。如果晚了，你可能会因为一封信而一夜之间失去你的生意和所有的工作。

获得许可应该不难。除非您偷偷摸摸地做一些事情，否则您很可能会为他们带来额外的流量。天啊，一旦你的产品起飞，网站可能会乞求你，甚至付钱给你添加他们的数据。

回复收藏 0 原文

像你 2024-07-31 08:10:06

我们允许机器人毫无怨言地挖掘网络的原因之一是，如果我们愿意的话，我们有办法阻止它们。保护双方。

还记得 Cuil 的机器人被指控过度行为（在某些情况下表现得像 DoS 攻击）并耗尽一些小型站点的带宽限额时引起的轩然大波吗？

如果太多人违反 robots.txt，我们可能会遇到更糟糕的情况。

回复收藏 0 原文

回梦 2024-07-31 08:10:06

“不就是不”。

回复收藏 0 原文

笑忘罢 2024-07-31 08:10:06

要回答这个狭隘的问题，对于价格比较网站，您可能最好实时获取价格，而不是提前废弃数据库。很难想象这是一个问题。

回复收藏 0 原文

披肩女神 2024-07-31 08:10:06

简短的回答：不。

就狭隘的问题而言：如果卖家说他们的价格是秘密的，我认为你必须尊重这一点。我会联系他们并询问他们是否真的不希望像您这样的价格比较引擎包含它们，或者“禁止侵入”标志是否出于技术原因。如果是后者，也许他们会为您提供替代方案。如果是前者，那么我会说太糟糕了，他们没有被纳入其中，他们失去了一些业务，这是他们的问题。

切题的咆哮：就我个人而言，我对那些让我费尽心思去了解他们产品价格的公司感到非常恼火，那些地方让我打电话并与销售人员交谈，以便他可以向我进行强行推销，或者更糟，让我给他们我的电话号码，这样他们的推销员就可以打电话骚扰我。我想如果他们不敢告诉我价格，可能意味着价格太高了。

一般来说：robots.txt 文件就像一个“禁止侵入”标志。业主有权决定谁可以进入其财产。如果您认为他们的理由很愚蠢，您可以礼貌地建议他们取下标牌。但你没有权利无视他们的意愿。如果有人在他的院子上挂了“禁止侵入”的牌子，我说：“嘿，我只是想抄近路，有什么大不了的？” ——也许我踩到了他珍贵的保加利亚紫罗兰球茎，毁掉了一项宝贵的投资。也许我正在穿越他人民的神圣墓地并冒犯他们的宗教情感。或者也许他只是一个脾气暴躁的混蛋。但这仍然是他的财产和权利。哦，如果我在无视“禁止侵入”标志后掉入危险的天坑，谁该负责？（在美国，尽管他警告过我，但我可能仍然可以起诉他，但这是对的吗？）

回复收藏 0 原文

烈酒灼喉 2024-07-31 08:10:06

涉及哈佛合作社的故事的一个有趣的现实版本：
Coop 就 ISBN 复印机报警。

回复收藏 0 原文

等风来 2024-07-31 08:10:06

我在这里表现出一些无知，但我一直认为机器人只是由搜索引擎发送的东西。就像谷歌或雅虎一样。

因此，如果您编写了一个在互联网上搜索内容的应用程序，我不会认为这是一个搜索引擎机器人，据我所知，这是 robots.txt 试图阻止的。

但这可能只是选择性无知，因为我可能会这样做，直到该网站的网站管理员联系我并要求我停止:)

回复收藏 0 原文

朮生 2024-07-31 08:10:06

如果人们将其提供给公众访问，他们就不应该试图对其施加限制。将 robots.txt 文件添加到您的网站相当于在您的草坪上放置一个标牌，上面写着“请不要看我”。

回复收藏 0 原文

~没有更多了~

关于作者

失去的东西太少

暂无简介

0 文章

0 评论

22 人气

关注发私信

友情链接

文江博客

robots.txt 的道德规范

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（10）

关于作者

相关话题

热门标签

推荐作者

1CH1MKgiKxn9p

ゞ记忆︶ㄣ

JackDx

信远

yaoduoduo1995

霞映澄塘

友情链接

robots.txt 的道德规范

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（10）

关于作者

相关话题

热门标签

推荐作者

1CH1MKgiKxn9p

ゞ记忆︶ㄣ

JackDx

信远

yaoduoduo1995

霞映澄塘

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。