使用静态 wkHTMLtoPDF 在 C# 中获取 PDF 页数
我正在使用以下包装器 WkHtmlToXSharp 将 HTML 报告转换为 PDF。我还想记录转换完成后的页数。
有没有办法从内存中的二进制 PDF 中提取页数?或者我是否需要使用辅助 PDF 库(例如 iTextSharp)从 PDF 中提取页数?
在页脚/页眉中使用 Javascript 是不可接受的解决方案,因为这可能是一个包含大量数据的 60-80 页报告。
谢谢, 拉菲
I'm using the following wrapper WkHtmlToXSharp to convert HTML reports into PDF. I would like to also record the page count after the conversion is complete.
Is there a way to extract the page count from the binary PDF in memory? Or do I need to use secondary PDF libraries such as iTextSharp to extract the page count from the PDF?
Using the Javascript in the page footer/header is not acceptable solution as this can be a data heavy 60-80 pages report.
Thanks,
Rafi
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
如果您自己生成 PDF,您可以尝试直接从 PDF 源格式中对它们进行计数。例如,在 http:// /www.codeproject.com/Articles/14768/Counting-PDF-Pages-using-Regular-Expressions
我不会在这里重复它们,但想法是计算有多少
/Type使用正则表达式在 PDF 上点击 /Page
。在一个好的文本编辑器中打开生成的 PDF,您就会看到它们。留意一个“/Type /Pages”,它会使数字减一,当您“控制”PDF 生成或至少知道它是一致的时,找到一个好的正则表达式很容易。If you generate the PDF yourself, you could try counting them directly from the PDF source format. There are tutorials available for that in for example in http://www.codeproject.com/Articles/14768/Counting-PDF-Pages-using-Regular-Expressions
I won't repeat them here but the idea is to count how many
/Type /Page
hits there are on the PDF using regex. Open a generated PDF in a good text editor and you'll see them yourself. Watch out for one "/Type /Pages" which throws the number off by one, finding a good regex is easy when you "control" the PDF generation or at least know that it's consistent.