跟踪网络服务器上旧上传的文件 - 您如何知道哪些文件不再使用?

发布于 2024-08-31 13:21:51 字数 167 浏览 4 评论 0原文

用户可以将文件上传至服务器,并永久有效保存。

我想知道是否有人有跟踪孤立文件的想法。 我的一些想法涉及记录每次上传,但文件通常在 html 中引用,这不容易跟踪。

文件可以闲置但仍可被引用。我可以对这些内容进行完整的文本搜索,但这相当暴力。

难道我就放弃,让他们变老吗?

Users can upload files to the server, which are stored effectively forever.

I want to know if anyone has an idea for tracking orphan files.
A few of my ideas involve logging every upload, but then the files are usually referenced in html which isn't easy to track.

Files can sit unused but still be referenced. I could do a fuill text search on these, but that's pretty brute force.

Do I just give up and let them grow old?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

楠木可依 2024-09-07 13:21:52

我不知道你的情况,但我过去所做的是将所有旧文件(图像)移动到图像文件夹之一的文件夹中,并使用 Xenu 检查我所有 HTML 页面中的链接。链接验证结束时,Xenu 返回了 404 列表。然后,我使用 404 列表编写了一个脚本,将文件从备份位置移回到图像文件夹中。

这非常有效...仍然监视日志文件几周,以防万一我错过了一些东西。

Xenu,顺便说一句,是一个免费的应用程序,可以通过给它一个起始页来帮助您找到损坏的链接。然后,它会在该页面中查找链接来抓取整个网站。如果在爬网期间未找到具有这些文件链接的页面,则需要额外的起始页面。

I don't know your situation but what I have done in the past is move all old files (images) to a folder one off of the images folder and used Xenu to check the links in all of my HTML pages. At the end of the link verification, Xenu returned a list of 404s. I then wrote a script using the list of 404s to move back the files from the backup location back into the images folder.

This worked great... Still monitored the log files for a couple of weeks though just in case I missed something.

Xenu, BTW, is a free app that helps you find broken links by giving it a starting page. It then finds links in that page to crawl your whole site. It would require additional starting pages if the pages that have links to these files are not found otherwise during a crawl.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文