使用 iTextSharp 从 PDF 中提取盲文文本(图像)
盲文是盲人专用的字体。我正在尝试解码 PDF 文件中以盲文字体编写的文本并输出普通文本。但 PDFTextExtractor(在 iTextSharp 中)无法处理此字体。是否可以通过其他方式实现?
我想弄清楚如何从 pdf 文件中解码。
我尝试
PdfReader pdf = new PdfReader("C:\\pdfs\\file.pdf");
string text = PdfTextExtractor.GetTextFromPage(pdf, 1);
this.brailleTextBox.Text = text.ToString();
this.normalTextBox.Text = text.ToString();
在包含常规字体(例如 Arial)和盲文字体的文本的 pdf 文件上使用,但它不会返回盲文文本,而是仅返回页面上的普通文本。
如何使用 iTextSharp 获取盲文字体文本。
Braille is a special font for blind people. I am trying to decode the text written in Braille font in a PDF file and output the normal text. But
the PDFTextExtractor (in iTextSharp) cannot handle this font. Is it possible in any other way?
I am trying to figure out how can I decode from a pdf file.
I tried using,
PdfReader pdf = new PdfReader("C:\\pdfs\\file.pdf");
string text = PdfTextExtractor.GetTextFromPage(pdf, 1);
this.brailleTextBox.Text = text.ToString();
this.normalTextBox.Text = text.ToString();
on a pdf file having text in regular font (e.g Arial) and braille font but it doesnt returns the braille text and instead return just the normal text on the page.
How can I get the Braille Font text instead, using iTextSharp.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
(还没有答案)
好吧,也许我理解不正确。我刚刚尝试在您提供的 PDF 上使用
PdfTextExtractor
并且它工作正常。具体来说,以下文本已被踢出第 1 页:如果我误解了您,我深表歉意,但是您是否试图将文本恢复为盲文??
(not an answer yet)
Okay, maybe I'm not understanding correctly. I just tried using the
PdfTextExtractor
on the PDF that you provided and it worked correctly. Specifically the following text was kicked out for page 1:I apologize if I'm misunderstanding you, but are you trying to get the text back as braille?