剧作家：通过印刷下载到PDF？

发布于 2025-01-30 20:07:03 字数 1068 浏览 5 评论 0原文

我正在寻求使用剧作家刮擦网页。

我加载页面，然后成功单击“下载”按钮。这将提出一个打印对话框，并选择了打印机。

我想选择“另存为pdf”，然后单击“保存”按钮。

这是我当前的代码：

with sync_playwright() as p:
    browser = p.chromium.launch(headless=True)
    playwright_page = browser.new_page()
    got_error = False

    try:
        playwright_page.goto(url_to_start_from)
        print(playwright_page.title())
        html = playwright_page.content()
    except Exception as e:
        print(f"Playwright exception: {e}")
        got_error = True

    if not got_error:
        soup = BeautifulSoup(html, 'html.parser')

        #download pdf
        with playwright_page.expect_download() as download_info:
            playwright_page.locator("text=download").click()

        download = download_info.value
        path = download.path()
        download.save_as(DOWNLOADED_PDF_FOLDER)

    browser.close()

有没有剧作家有办法做到这一点？

原文

I'm seeking to scrape a web page using Playwright.

I load the page, and click the download button with Playwright successfully. This brings up a print dialog box with a printer selected.

I would like to select "Save as PDF" and then click the "Save" button.

Here's my current code:

with sync_playwright() as p:
    browser = p.chromium.launch(headless=True)
    playwright_page = browser.new_page()
    got_error = False

    try:
        playwright_page.goto(url_to_start_from)
        print(playwright_page.title())
        html = playwright_page.content()
    except Exception as e:
        print(f"Playwright exception: {e}")
        got_error = True

    if not got_error:
        soup = BeautifulSoup(html, 'html.parser')

        #download pdf
        with playwright_page.expect_download() as download_info:
            playwright_page.locator("text=download").click()

        download = download_info.value
        path = download.path()
        download.save_as(DOWNLOADED_PDF_FOLDER)

    browser.close()

Is there a way to do this using Playwright?

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

十二 2025-02-06 20:07:03

您实际上不需要打印对话框，可以通过模拟媒体类型直接从剧作家生成它。

page.emulate_media(media="print")
page.goto("https://robstarbuck.uk/cv");
page.pdf(path="cv.pdf")

这就是我生成简历的方式。

另请参阅：

You don't actually need the print dialog, you can generate this directly from Playwright by emulating the media type.

page.emulate_media(media="print")
page.goto("https://robstarbuck.uk/cv");
page.pdf(path="cv.pdf")

This is how I generate my CV.

关于作者

笑梦风尘

暂无简介

文章

27 人气

关注发私信

李珊平

文章 0 评论 0

关注

Quxin

文章 0 评论 0

关注

范无咎

文章 0 评论 0

关注

github_ZOJ2N8YxBm

文章 0 评论 0

关注

若言

文章 0 评论 0

关注

南…巷孤猫

文章 0 评论 0

友情链接

文江博客

剧作家：通过印刷下载到PDF？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

李珊平

Quxin

范无咎

github_ZOJ2N8YxBm

若言

南…巷孤猫

友情链接

剧作家：通过印刷下载到PDF？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

李珊平

Quxin

范无咎

github_ZOJ2N8YxBm

若言

南…巷孤猫

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。