在 HTML 代码中查找并复制字符串
我正在尝试一些新的东西,我通常会在 C# 或 VB 中执行此操作。但出于速度原因,我想在我的服务器上执行此操作。
- 打开文件 terms.txt
- 从 terms.txt 中一次取出一项并打开一个 url(可能是curl 或其他)并转到 http://system.com/set=terms
- 查看 HTML 源代码并提取图片名称 (stringB)。查找 image=StringB&location
- 将 StringB 保存到 imgname.txt
- 关闭文件并循环到 terms.txt 中的下一项
我正在查看 sed 但我相信 awk 可能是最好的方法?这对我来说是全新的,构建这样的命令以在 shell 下运行。我熟悉 Linux 的使用,只需要命令方面的帮助。
I'm trying something new, I would normally do this in C# or VB. But for speed reason I'd like to do this on my server.
- Open File terms.txt
- Take each item one at a time from terms.txt and open a url (possibly curl or something else) and go to http://system.com/set=terms
- View the HTML source and extract pic names (stringB). Look for image=StringB&location
- Save StringB to imgname.txt
- Close file and cycle to the next item in terms.txt
I was looking at sed but I believe awk might be the best way? This is all new to me building a command like this to run under shell. I'm familiar with using linux just need help with the commands.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
应该做,具体取决于 terms.txt 的精确格式(shell 脚本最好处理每行一个条目)以及您是否确实需要解析 HTML(我希望您不需要):
与此不完全不同的东西 将其保存到名为“extractimages”的文件中,chmod +x 它,然后像这样运行它:
Something not entirely unlike this should do ya, depending on the precise format of terms.txt (shell scripts cope best with one entry per line) and whether you actually need to parse the HTML (I'm hoping you don't):
You save this to a file named "extractimages", chmod +x it, and run it like so: