我想将pdf导出为xml,并将字体信息作为属性值

发布于 2024-09-19 19:01:36 字数 242 浏览 4 评论 0原文

我想使用任何免费的 pdf 库(如 PDFSharp、ItextSharp)将 pdf 导出到 xml,其中包含字体信息,如字体大小、字体名称、字体样式、字间距、字母间距等。

例如:

此处显示段落文本

可以用C#来做吗?如果可以的话从哪里可以得到相关信息?

I want to export pdf to xml with font information lik font-size, font name, font-style, word spacing, letter spacing etc using any Freely available pdf libraries like PDFSharp, ItextSharp.

For example:

<p font-style="10pt", font-style="italic" letter-spacing="somevalue" word-spacing="somevalue">Paragraph text goes here</p>

Is it possible to do using C#? If possible Where can I get related information?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

笑脸一如从前 2024-09-26 19:01:36

开源项目 PDF Clown 可能会帮助您。以下是其功能页面的 URL,其中包括带有格式信息的文本导入。然后您可以将其转换为 XElement 、 XAttribute 等和/或最后将 XMLSerialize 转换为 xml 文档。

http://www.stefanochizzolini.it/en/projects/clown/features。 html

sourcefourge 下载如下:

http://sourceforge.net/projects/clown/

The open source project PDF Clown might help you. Following is the url to its features page which includes text imports with formatting info. which you can then turn into XElement , XAttribute etc. etc. and/or finally XMLSerialize into an xml document.

http://www.stefanochizzolini.it/en/projects/clown/features.html

The sourcefourge download is following:

http://sourceforge.net/projects/clown/

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文