如何在 Linux 上将 HTML 页面转化成 png 图片
将一个特定页面抓取为一张 png 图片的最简单的方法是使用 CutyCapt ,这是一种在 Linux 下的方便地将 HTML 网页转化成矢量图形和位图图像格式的命令行工具(比如,SVG, PDF, PS, PNG, JPEG, TIFF, GIF)。CutyCapt 内部使用 WebKit 渲染引擎来导出网页渲染输出到图片文件中。它使用 Qt 构建,CutyCapt 实际上是一个也可以在 Windows 上使用的跨平台应用。(译注:也有一个基于 IE 内核的 IECapt 可以作此用途)
在本篇教程中,我会描述如何 将一个 HTML 网页使用 CutyCapt 转化成 png 图片 。
在 Linux 上安装 CutyCapt
这是在特定 Linux 发行版上的安装命令。
在 Debian, Ubuntu 或者 Linux Mint 安装 CutyCapt
$ sudo apt-get install cutycapt
在 Fedora 上安装 CutyCapt
$ sudo yum install subversion qt-devel qtwebkit-devel gcc-c++ make $ svn co svn://svn.code.sf.net/p/cutycapt/code/ cutycapt $ cd cutycapt/CutyCapt
在 Fedora 上编译前,你需要在源码上 打上补丁 。
使用文本编辑器打开 CutyCapt.hpp,并且加入在文件的开头加上下面的两行。
#include #include
最后,如下编译并安装 CutyCapt。
$ qmake-qt4 $ make $ sudo cp CutyCapt /usr/local/bin/cutycapt
在 CentOS 或者 RHEL 安装 CutyCapt
首先在你的 Linux 上 启用 EPEL 仓库 。接着和在 Fedora 上一样使用相同的步骤编译安装。
使用 CutyCapt 将 HTML 转化成 PNG
将一个 HTML 页面截图成一个 png 图片,只要使用下面的格式运行 CutyCapt。
$ cutycapt --url=http://www.cnn.com --out=cnn.png
要将 HTML 页面保存成不同的格式(比如,PDF),只要适当地指定输出文件。
$ cutycapt --url=http://www.cnn.com --out=cnn.pdf
下图显示了 CutyCapt 命令选项。
在一台不含 X 的服务器上使用 CutyCapt 将 HTML 转换成 PNG
虽然 CutyCapt 是一个命令行工具,但是它需要 X 服务运行。如果你尝试在不含 X 服务的机器上运行,你会得到下面这个错误:
cutycapt: cannot connect to X server :0
如果你要不含 X 的服务器上运行 CutyCapt,你可以在服务器上安装 Xvfb(轻量级“假的”X11 服务)。这样 CutyCapt 就不会报错了。
要在 Debian, Ubuntu 或者 Linux Mint 上安装 Xvfb:
$ sudo apt-get install xvfb
要在 Fedora, CentOS 或者 RHEL 上安装 Xvfb:
$ sudo yum install xvfb
在安装 Xvfb 之后,接下来像这样运行 CutyCapt。
$ xvfb-run --server-args="-screen 0, 1280x1200x24" cutycapt --url=http://www.cnn.com --out=cnn.png
它首先会运行 Xbfb 服务,接着使用 CutyCapt 来抓取网页。因此它可能会花费更长的时间。如果你想要截图多张截图,你可能事先需要将 Xvfb 作为后台守护进程启动。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论