使用 iTextSharp 从 PDF 中提取盲文文本(图像)

发布于 2024-11-28 13:50:58 字数 475 浏览 7 评论 0原文

盲文是盲人专用的字体。我正在尝试解码 PDF 文件中以盲文字体编写的文本并输出普通文本。但 PDFTextExtractor(在 iTextSharp 中)无法处理此字体。是否可以通过其他方式实现?

我想弄清楚如何从 pdf 文件中解码。

我尝试

PdfReader pdf = new PdfReader("C:\\pdfs\\file.pdf");
string text = PdfTextExtractor.GetTextFromPage(pdf, 1);

this.brailleTextBox.Text = text.ToString();
this.normalTextBox.Text = text.ToString();

在包含常规字体(例如 Arial)和盲文字体的文本的 pdf 文件上使用,但它不会返回盲文文本,而是仅返回页面上的普通文本。

如何使用 iTextSharp 获取盲文字体文本。

Braille is a special font for blind people. I am trying to decode the text written in Braille font in a PDF file and output the normal text. But
the PDFTextExtractor (in iTextSharp) cannot handle this font. Is it possible in any other way?

I am trying to figure out how can I decode from a pdf file.

I tried using,

PdfReader pdf = new PdfReader("C:\\pdfs\\file.pdf");
string text = PdfTextExtractor.GetTextFromPage(pdf, 1);

this.brailleTextBox.Text = text.ToString();
this.normalTextBox.Text = text.ToString();

on a pdf file having text in regular font (e.g Arial) and braille font but it doesnt returns the braille text and instead return just the normal text on the page.

How can I get the Braille Font text instead, using iTextSharp.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

傲影 2024-12-05 13:50:59

(还没有答案)

好吧,也许我理解不正确。我刚刚尝试在您提供的 PDF 上使用 PdfTextExtractor 并且它工作正常。具体来说,以下文本已被踢出第 1 页:

B   r    a   i     l    l    e   C   o   d    e   s 
B r a i l l e C o d e s 

Embossed dot positions as,   


A  B   C   D   E   F   G  H   I    J   K  
A B C D E F G H I J K 
L    M  N  O   P  Q   R  S   T   U   V  
L M N O P Q R S T U V 
W  X   Y   Z 
W X Y Z 


1   2   3    4   5   6    7   8   9   0 
1 2 3 4 5 6 7 8 9 0

如果我误解了您,我深表歉意,但是您是否试图将文本恢复为盲文?

(not an answer yet)

Okay, maybe I'm not understanding correctly. I just tried using the PdfTextExtractor on the PDF that you provided and it worked correctly. Specifically the following text was kicked out for page 1:

B   r    a   i     l    l    e   C   o   d    e   s 
B r a i l l e C o d e s 

Embossed dot positions as,   


A  B   C   D   E   F   G  H   I    J   K  
A B C D E F G H I J K 
L    M  N  O   P  Q   R  S   T   U   V  
L M N O P Q R S T U V 
W  X   Y   Z 
W X Y Z 


1   2   3    4   5   6    7   8   9   0 
1 2 3 4 5 6 7 8 9 0

I apologize if I'm misunderstanding you, but are you trying to get the text back as braille?

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文