使用python(urllib)下载文件,如何获取真实的文件名?
所以我终于设法让我的脚本登录到网站并下载文件...但是,在某些情况下,我会有一个像“http://www.test.com/index.php?act=Attach&类型=帖子&id=3345”。 Firefox 发现文件名正常...所以我应该可以。
我无法通过诸如remotefile.info()['Content-Disposition']之类的方式找到“Content-Disposition”标头
此外,remotefile.geturl()返回相同的url。
我缺少什么?如何获取实际的文件名?我更喜欢使用内置库。
So I finally managed to get my script to login to a website and download a file... however, in some instances I will have a url like "http://www.test.com/index.php?act=Attach&type=post&id=3345". Firefox finds the filename ok... so I should be able to.
I am unable to find the "Content-Disposition" header via something like remotefile.info()['Content-Disposition']
Also, remotefile.geturl() returns the same url.
What am I missing? How do I get the actual filename? I would prefer using the built-in libraries.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
远程服务器/服务的任务是提供内容处置标头。
除非远程服务器/服务在您自己的控制之下,否则您无能为力。
It is the task of the remote server/Service to provide the content-disposition header.
There is nothing you can do unless the remote server/service is under your own control..