当前位置：文江博客话题详情

在 HTML 代码中查找并复制字符串

发布于 2024-09-12 12:53:46 字数 561 浏览 5 评论 0原文

我正在尝试一些新的东西，我通常会在 C# 或 VB 中执行此操作。但出于速度原因，我想在我的服务器上执行此操作。

打开文件 terms.txt
从 terms.txt 中一次取出一项并打开一个 url（可能是curl 或其他）并转到 http://system.com/set=terms
查看 HTML 源代码并提取图片名称 (stringB)。查找 image=StringB&location
将 StringB 保存到 imgname.txt
关闭文件并循环到 terms.txt 中的下一项

我正在查看 sed 但我相信 awk 可能是最好的方法？这对我来说是全新的，构建这样的命令以在 shell 下运行。我熟悉 Linux 的使用，只需要命令方面的帮助。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

断桥再见 2024-09-19 12:53:46

应该做，具体取决于 terms.txt 的精确格式（shell 脚本最好处理每行一个条目）以及您是否确实需要解析 HTML（我希望您不需要）：

#! /bin/sh

if [ $# -ne 2 ]; then
    echo "usage: $0 termfile baseurl" >&2
    exit 1
fi
termfile="$1"
baseurl="$2"

while read term; do
    wget -q -O- "$baseurl/set=$term" |
      sed -ne 's/^.*image=\([^&]*\)&.*$/\1/p'
done < "$termfile"

与此不完全不同的东西将其保存到名为“extractimages”的文件中，chmod +x 它，然后像这样运行它：

$ ./extractimages terms.txt http://system.com > imgname.txt

Something not entirely unlike this should do ya, depending on the precise format of terms.txt (shell scripts cope best with one entry per line) and whether you actually need to parse the HTML (I'm hoping you don't):

#! /bin/sh

if [ $# -ne 2 ]; then
    echo "usage: $0 termfile baseurl" >&2
    exit 1
fi
termfile="$1"
baseurl="$2"

while read term; do
    wget -q -O- "$baseurl/set=$term" |
      sed -ne 's/^.*image=\([^&]*\)&.*$/\1/p'
done < "$termfile"

You save this to a file named "extractimages", chmod +x it, and run it like so:

$ ./extractimages terms.txt http://system.com > imgname.txt

回复收藏 0 原文

甜｀诱少女 2024-09-19 12:53:46

sed 's|^.*$|wget -q -O- http:\/\/system.com/set=&|' file | bash |sed -ne 's/^.*image=\([^&]*\)&.*$/\1/p'

sed 's|^.*$|wget -q -O- http:\/\/system.com/set=&|' file | bash |sed -ne 's/^.*image=\([^&]*\)&.*$/\1/p'

回复收藏 0 原文

~没有更多了~

关于作者

五里雾

暂无简介

0 文章

0 评论

22 人气

关注发私信

謌踐踏愛綪

文章 0 评论 0

关注

开始看清了

文章 0 评论 0

关注

高速公鹿

文章 0 评论 0

关注

alipaysp_PLnULTzf66

文章 0 评论 0

关注

热情消退

文章 0 评论 0

关注

白色月光

文章 0 评论 0

友情链接

文江博客

在 HTML 代码中查找并复制字符串

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

謌踐踏愛綪

开始看清了

高速公鹿

alipaysp_PLnULTzf66

热情消退

白色月光

友情链接

在 HTML 代码中查找并复制字符串

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

謌踐踏愛綪

开始看清了

高速公鹿

alipaysp_PLnULTzf66

热情消退

白色月光

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。